IBM SPSS Analytic Guia Del Usuario página 10

Tabla de contenido

Publicidad

Puede definir orígenes de datos utilizando archivos comprimidos para cualquier formato de archivo
soportado. Los formatos de compresión soportados incluyen Gzip, Deflate, Bz2, Snappy e IBM CMX.
Tipo de archivo delimitado
Los archivos delimitados son archivos de texto de campo libre, cuyos registros contienen un número
constante de campos pero un número variable de caracteres por campo. Los archivos delimitados tienen
generalmente las extensiones de archivo *.csv o *.tab. Consulte "Valores de tipo de archivo delimitado" en
la página 7 para obtener información adicional.
Tipo de archivo fijo
Los archivos de texto de campo fijo son archivos cuyos campos no están delimitados, sino que se inician
en la misma posición y son de longitud fija. Los archivos de texto de campo fijo suelen tener la extensión
de archivo *.dat. Consulte "Valores de tipo de archivo fijo" en la página 8 para obtener información
adicional.
Tipo de archivo semiestructurado
Los archivos semiestructurados (como por ejemplo *.log) son archivos de texto que tienen una estructura
previsible que puede correlacionarse con los campos por medio de expresiones regulares, pero que no
están tan estructurados como los archivos delimitados. Consulte "Valores de tipo de archivo
semiestructurado" en la página 9 para obtener información adicional.
Tipo de archivo de análisis de texto
Los archivos de análisis de texto son documentos (como *.doc, *.pdf o *.txt) que se pueden analizar
utilizando SPSS Text Analytics.
Omitir líneas vacías
Especifica si se deben ignorar las líneas vacías en el contenido del texto extraído. El valor
predeterminado es No.
Separador de líneas
Especifica la serie que define una línea nueva. El valor predeterminado es el carácter de nueva
línea "\n".
Tipo de archivo de SPSS Statistics
Los archivos de SPSS Statistics (*.sav, *.zsav) son archivos binarios que contienen un modelo de datos. No
son necesarios más valores de la pestaña Valores para este tipo de archivo.
Tipo de archivo de formato binario divisible
Especifica que el tipo de archivo es un archivo de formato binario divisible (*.asbf). Este tipo de archivo
puede representar todos los tipos de campo de Analytic Server (a diferencia de CSV, que no puede
representar los campos de lista en absoluto y requiere valores especiales para gestionar las nuevas líneas
y retornos de carro incluidos. No son necesarios más valores de la pestaña Valores para este tipo de
archivo.
Tipo de archivo de secuencia
Los archivos de secuencia (*.seq) son archivos de texto estructurado como pares de clave/valor. Se
utilizan habitualmente como formato de intermediario en los trabajos de MapReduce.
6
IBM SPSS Analytic Server Versión 3.0: Guía del usuario

Publicidad

Tabla de contenido
loading

Tabla de contenido