Por definición Apache Hive es una infraestructura de almacenaje de data construida sobre Hadoop para brindar agrupación, consulta, y descomposición de datos.
Inicialmente desarrollado por Facebook, Apache Hive es en la actualidad aprovechada y desarrollada por otras compañías como Netflix y la Financial Industry Regulatory Authority (Finra).
Amazon mantiene un derivado del soft de Apache Hive incluida en Amazon Elastic Mapreduce en sus servicios Amazon Web Services.
Características de Apache Hive
![]() |
| Para mas información visite: www.sitiobigdata.com |
Los tres motores de consumación pueden jalar bajo Yarn. Para avivar las consultas, Hive provee índices, que incluyen índices de bitmaps.
Otros tipos de características de Hive incluyen:
- Indexación para otorgar puesta en marcha, tipo de índice que suma la compactación e índices de bitmaps. Otros sujetos de índices serán incluidos en futuras versiones.
- Diferentes formas de almacenaje como ejemplar, Rcfile, Hbase, Orc, y otros.
- Almacenamiento de metadatos en pedestales de aspectos relacionales, lo que permite dosificar el periodo para proceder comprobaciones semánticas durante la confección de consultas.
- Operaciones sobre data comprimida almacenados en el ecosistema Hadoop usando cálculos que incluyen Deflate, Bwt, snappy, etc.
- Funciones establecidas por el beneficiario (Udf) para urdir épocas, tomos, y otras herramientas de minería de numeros. Hive soporta la cabida de las actuaciones prohibidas por el afortunado de forma de abordar asuntos no tenido en cuenta.
- Consultas Sql (Hiveql), las cuales son convertidas automáticamente a Mapreduce o Tez, o ocupaciones Spark. Por quebranto, Hive almacena sus metadatos en una almohadilla de elementos apache Derby, luego puede ser configurado para esgrimir Mysql.
Si quieres leer mas articulos como este te invitamos a la comunidad de sitiobigdata.com:
http://sitiobigdata.com/index.php/2016/11/28/big-data-3-v-variedad-velocidad-volumen/

No hay comentarios:
Publicar un comentario