v Cuando está presente un campo de división, los tres modelos creados localmente en
Modeler son ligeramente distintos de los tres modelos creados mediante Analytic
Server, y de este modo producen puntuaciones distintas. Los algoritmos en los dos
casos son válidos; los algoritmos que Analytic Server utiliza son simplemente más
recientes. Dado el hecho de que los algoritmos de árbol tienden a tener muchas reglas
heurísticas, la diferencia entre los dos componentes es normal.
Puntuación de modelos
Todos los modelos soportados para el modelado también están soportados para la puntuación.
Además, los nuggets de modelo creados localmente para los nodos siguientes están soportados
para la puntuación: C&RT, Quest, CHAID, Lineal y Red neuronal (independientemente de que el
modelo sea estándar, "boosting y bagging" o para conjuntos de datos de tamaño muy grande),
Regresión, C5.0, Logística, Genlin, GLMM, Cox, SVM, Red bayesiana, Bietápico, KNN, Lista de
decisiones, Discriminante, Autoaprendizaje, Detección de anomalías, Apriori, Carma, K-medias,
Kohonen, R y Minería de textos.
v No se puntuarán las propensiones brutas ni las ajustadas. A modo de solución alternativa,
puede lograrse el mismo efecto calculando manualmente la propensión bruta utilizando un
nodo Derivar con la siguiente expresión: if 'valor-pronosticado' == 'valor-de-interés' then
'prob-de-ese-valor' else 1-'prob-de-ese-valor' endif
v Al puntuar un modelo, Analytic Server no comprueba si todos los campos utilizados en el
modelo están presentes en el conjunto de datos, así que asegúrese de que sea así antes de
ejecutar en Analytic Server
R
La sintaxis R en el nugget debe constar de operaciones record-at-a-time (registro cada
vez).
Salida Se admiten los nodos Matriz, Análisis, Auditoría de datos, Transformación, Estadística, Medias y
Tabla. A continuación se detalla la funcionalidad de nodo soportada.
Auditoría de datos
El nodo Auditoría de datos no puede producir la modalidad de campos continuos.
Medias
El nodo Medias no puede producir un error estándar o un intervalo de confianza del 95
%.
Tabla
El nodo Tabla está soportado mediante la escritura de un origen de datos Analytic Server
temporal que contiene los resultados de operaciones anteriores. A continuación, el nodo
Tabla pagina el contenido de dicho origen de datos.
Exportar
Una secuencia puede comenzar con un nodo origen de Analytic Server y terminar con un nodo
de exportación distinto del nodo de exportación de Analytic Server, pero los datos se moverán de
HDFS a SPSS Modeler Server y por último a la ubicación de exportación.
Mejores prácticas
Retrotracción a HCatalog/Hive
Cuando se trabaja con datos en una tabla Hive particionada, puede estructurar la secuencia de Modeler
para poder retrotraer la selección de las particiones deseadas en Hive.
1. Inicie la secuencia con un nodo de origen de Analytic Server que haga referencia al origen de datos
de HCatalog/Hive.
2. Conecte a un nodo Seleccionar que seleccione registros SOLO para campos que se utilicen como
campos de partición en la tabla Hive. Si en la expresión de este nodo Seleccionar se hace referencia a
campos que no se utilizan como campos de partición, la secuencia no se retrotraerá a HCatalog/Hive.
3. Conecte a otros nodos como haría normalmente.
Capítulo 2. Integración de SPSS Modeler
29