del clúster de Hadoop. Por contra, también debe procurarse que las divisiones no se
definan tan pequeñas que contengan demasiados pocos registros como para construir
un modelo.
v No se soporta el objetivo de Potenciación.
v No se soporta el objetivo de Agregación autodocimante.
v No se recomienda el objetivo de Conjuntos de datos muy grandes cuando hay pocos
registros; con frecuencia no se generará un modelo, o el modelo generado estará
degradado.
v No se soporta la preparación de datos automática. Esto puede dar lugar a problemas
cuando se intente construir un modelo a partir de datos con muchos valores ausentes;
normalmente dichos datos se imputarían como parte de la preparación de datos
automática. Una solución consistiría en utilizar un modelo de árbol o una red neuronal
con el valor Avanzado seleccionado para imputar los valores ausentes.
v La estadística de precisión no se calcula para los modelos divididos.
Red neuronal
Al crear modelos basados en datos masivos, lo normal es cambiar el objetivo a Conjuntos
de datos muy grandes o bien especificar divisiones.
v No se soporta el entrenamiento continuado de modelos de PSM o estándar existentes.
v El objetivo Generación de Modelo estándar solo se recomienda si los campos se definen
de modo que el número de registros de cada división no sea demasiado grande, donde
la definición de "demasiado grande" depende de la potencia de los nodos individuales
del clúster de Hadoop. Por contra, también debe procurarse que las divisiones no se
definan tan pequeñas que contengan demasiados pocos registros como para construir
un modelo.
v No se soporta el objetivo de Potenciación.
v No se soporta el objetivo de Agregación autodocimante.
v No se recomienda el objetivo de Conjuntos de datos muy grandes cuando hay pocos
registros; con frecuencia no se generará un modelo, o el modelo generado estará
degradado.
v Cuando falten muchos valores en los datos, utilice el valor Avanzado para imputar los
valores que faltan.
v La estadística de precisión no se calcula para los modelos divididos.
Árbol C&R, CHAID y Quest
Al crear modelos basados en datos masivos, lo normal es cambiar el objetivo a Conjuntos
de datos muy grandes o bien especificar divisiones.
v No se soporta el entrenamiento continuado de modelos de PSM existentes.
v El objetivo Generación de Modelo estándar solo se recomienda si los campos se definen
de modo que el número de registros de cada división no sea demasiado grande, donde
la definición de "demasiado grande" depende de la potencia de los nodos individuales
del clúster de Hadoop. Por contra, también debe procurarse que las divisiones no se
definan tan pequeñas que contengan demasiados pocos registros como para construir
un modelo.
v No se soporta el objetivo de Potenciación.
v No se soporta el objetivo de Agregación autodocimante.
v No se recomienda el objetivo de Conjuntos de datos muy grandes cuando hay pocos
registros; con frecuencia no se generará un modelo, o el modelo generado estará
degradado.
v No se soportan las sesiones interactivas.
v La estadística de precisión no se calcula para los modelos divididos.
28
IBM SPSS Analytic Server Versión 3.0: Guía del usuario