Aprende sobre Big Data: Que es Apache Hive?

Por definición Apache Hive es una infraestructura de almacenaje de data construida sobre Hadoop para brindar agrupación, consulta, y descomposición de datos.

Inicialmente desarrollado por Facebook, Apache Hive es en la actualidad aprovechada y desarrollada por otras compañías como Netflix y la Financial Industry Regulatory Authority (Finra).

Amazon mantiene un derivado del soft de Apache Hive incluida en Amazon Elastic Mapreduce en sus servicios Amazon Web Services.

Características de Apache Hive

Para mas información visite: www.sitiobigdata.com

Apache Hive soporta el estudio de grandes conjuntos de data almacenada bajo Hdfs de Hadoop y en estilos compatibles como el sistema de anaqueles Amazon S3. Ofrece un verbo de consultas gravitado en Sql convocado Hiveql5 con planes para observar y acortar consultas de fase transparente en Mapreduce, Apache Tez6 y tareas de Spark.

Los tres motores de consumación pueden jalar bajo Yarn. Para avivar las consultas, Hive provee índices, que incluyen índices de bitmaps.

Otros tipos de características de Hive incluyen:

Indexación para otorgar puesta en marcha, tipo de índice que suma la compactación e índices de bitmaps. Otros sujetos de índices serán incluidos en futuras versiones.

Diferentes formas de almacenaje como ejemplar, Rcfile, Hbase, Orc, y otros.

Almacenamiento de metadatos en pedestales de aspectos relacionales, lo que permite dosificar el periodo para proceder comprobaciones semánticas durante la confección de consultas.

Operaciones sobre data comprimida almacenados en el ecosistema Hadoop usando cálculos que incluyen Deflate, Bwt, snappy, etc.

Funciones establecidas por el beneficiario (Udf) para urdir épocas, tomos, y otras herramientas de minería de numeros. Hive soporta la cabida de las actuaciones prohibidas por el afortunado de forma de abordar asuntos no tenido en cuenta.

Consultas Sql (Hiveql), las cuales son convertidas automáticamente a Mapreduce o Tez, o ocupaciones Spark. Por quebranto, Hive almacena sus metadatos en una almohadilla de elementos apache Derby, luego puede ser configurado para esgrimir Mysql.

Si quieres leer mas articulos como este te invitamos a la comunidad de sitiobigdata.com:

http://sitiobigdata.com/index.php/2016/11/28/big-data-3-v-variedad-velocidad-volumen/

Aprende sobre Big Data

jueves, 1 de septiembre de 2016

Que es Apache Hive?

Características de Apache Hive

Otros tipos de características de Hive incluyen:

No hay comentarios:

Publicar un comentario