Utilización de orígenes de datos de HCatalog
Analytic Server proporciona soporte para orígenes de datos de HCatalog. Esta sección describe cómo
habilitar varias bases de datos NoSQL subyacentes.
En la mayoría de los casos, debe consultar la documentación del proveedor para la integración de Hive.
Apache Accumulo
https://cwiki.apache.org/confluence/display/Hive/AccumuloIntegration
Apache Cassandra
"Apache Cassandra"
Apache HBase
https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration
MongoDB
https://github.com/mongodb/mongo-hadoop/wiki/Hive-Usage
Oracle NoSQL
https://docs.oracle.com/cd/E57371_01/doc.41/e57351/bigsql.htm#BIGUG21115
Orígenes de datos XML
"Orígenes de datos XML" en la página 16
Apache Cassandra
Analytic Server proporciona soporte para orígenes de datos HCatalog que tienen contenido subyacente en
Apache Cassandra.
Cassandra proporciona un almacén estructurado de claves-valores. Las claves se correlacionan con varios
valores, que se agrupan en familias de columnas. Las familias de columnas son fijas cuando se crea una
base de datos, pero pueden añadirse columnas a una familia en cualquier momento. Además, sólo se
añaden columnas a las claves especificadas, de modo que claves diferentes pueden tener números de
columnas diferentes de cualquier familia determinada. Los valores de una familia columnas para cada
clave se almacenan juntos.
Hay dos formas de definir tablas Cassandra: utilizando la interfaz de línea de mandatos de Cassandra de
herencia (cassandra-cli) y la nueva shell CQL (csqlsh).
Utilice la sintaxis siguiente para crear una tabla Apache Cassandra externa en Hive si la tabla se ha
creado utilizando la CLI de herencia.
CREATE EXTERNAL TABLE <nombre_tabla_hive> (<especificaciones de columna>)
STORED BY 'org.apache.hadoop.hive.cassandra.CassandraStorageHandler'
WITH SERDEPROPERTIES("cassandra.cf.name" = "<familia_columnas_cassandra>",
"cassandra.host"="<host_cassandra>","cassandra.port" = "<puerto_cassandra>")
TBLPROPERTIES ("cassandra.ks.name" = "<espacio_claves_cassandra>");
Por ejemplo, para la definición de tabla de CLI siguiente:
create keyspace test
with placement_strategy = 'org.apache.cassandra.locator.SimpleStrategy'
and strategy_options = [{replication_factor:1}];
create column family users with comparator = UTF8Type;
update column family users with
column_metadata =
[
{column_name: first, validation_class: UTF8Type},
{column_name: last, validation_class: UTF8Type},
{column_name: age, validation_class: UTF8Type, index_type: KEYS}
];
14
IBM SPSS Analytic Server Versión 3.0: Guía del usuario