Contenido complejo
El contenido complejo utilizado como tipo primitivo se convertía a una serie XML válida añadiendo un
elemento raíz llamado <string>. Examine el XML siguiente:
<dataset>
<value>10</value>
<value>20</value>
<value>30</value>
</dataset>
La expresión XPath /dataset/* dará como resultado la devolución de una serie de nodos XML <value>.
Si el campo de destino es de tipo primitivo, la implementación transformará el resultado de la consulta
en el XML válido añadiendo el nodo raíz <string>.
<string>
<value>10</value>
<value>20</value>
<value>30</value>
</string>
Nota: la implementación no añadirá un elemento raíz <string> si el resultado de la consulta es un sólo
elemento XML.
Contenido de texto
El contenido textual sólo de espacio en blanco de un elemento XML se ignora.
Vista previa y metadatos (orígenes de datos)
Cuando se pulsa Vista previa y metadatos, se visualiza una muestra de registros y el modelo de datos
del origen de datos. Esto da la posibilidad de revisar la información básica de los metadatos.
Vista previa
La pestaña Vista previa ofrece una pequeña muestra de registros y sus valores de campo.
Edición
La pestaña Edición visualiza los metadatos de campo básicos. Para los orígenes de datos con tipo
de contenido de archivos, el modelo de datos se genera a partir de una pequeña muestra de
registros, y puede editar manualmente los metadatos de campo en esta pestaña. Para los orígenes
de datos con tipo de contenido de HCatalog, el modelo de datos se genera en función de las
correlaciones de campos de HCatalog y no puede editar el almacenamiento de campo en esta
pestaña.
Campo
Efectúe una doble pulsación en el nombre del campo para editarlo.
Medida
Este es el nivel de medida que se utiliza para describir las características de los datos en
un campo determinado.
Rol
Se utiliza para indicar a los nodos de modelado si los campos serán de Entrada (campos
predictores) o de Salida (campos predichos) para un proceso de aprendizaje automático.
Ambos y Ninguno son asimismo roles, junto con Partición, que indica un campo que se
utiliza para particionar registros en muestras independientes a efectos de formación,
pruebas y validación. El valor División indica que se construirá un modelo aparte por
cada posible valor del campo. La frecuencia especifica que los valores de un campo deben
utilizarse como ponderación de frecuencia para cada registro. El ID de registro se utiliza
para identificar un registro en la salida.
Almacenamiento
El almacenamiento describe la forma en que los datos se almacenan en un campo. Por
Capítulo 1. Consola de Analytic Server
19