Ecosistema Hadoop – HBase

Ecosistema Hadoop – HBase

Apache HBase es un componente del ecosistema de Hadoop. Es una base de datos distribuida que fue diseñada para almacenar datos estructurados en tablas que podrían tener miles de millones de filas y millones de columnas. HBase es una base…

Ecosistema Hadoop – Pig

Ecosistema Hadoop – Pig

Apache Pig es una plataforma de lenguaje de alto nivel para analizar y consultar grandes conjuntos de datos almacenados en HDFS. Pig como componente de Hadoop Ecosystem utiliza el lenguaje PigLatin. Es muy similar a SQL. Carga los datos, aplica…

Ecosistema Hadoop – Hive

Ecosistema Hadoop – Hive

El componente del ecosistema de Hadoop, Apache Hive, es un sistema de almacenamiento de datos de código abierto para consultar y analizar grandes conjuntos de datos almacenados en archivos Hadoop. Inicialmente, se debía escribir trabajos complejos de Map-Reduce, pero ahora…

Ecosistema Hadoop – YARN

Ecosistema Hadoop – YARN

Hadoop YARN (otro negociador de recursos) es un componente del ecosistema de Hadoop que proporciona la gestión de recursos. Es uno de los componentes más importantes del ecosistema Hadoop. YARN se denomina como el sistema operativo de Hadoop ya que…

Ecosistema Hadoop – MapReduce

Ecosistema Hadoop – MapReduce

Hadoop MapReduce es el componente central del ecosistema de Hadoop que proporciona procesamiento de datos. MapReduce es un marco de software para escribir aplicaciones que procesan la gran cantidad de datos estructurados y no estructurados almacenados en el sistema de…

Ecosistema Hadoop – HDFS (Hadoop Distributed File System)

Ecosistema Hadoop – HDFS (Hadoop Distributed File System)

HDFS es el componente más importante del ecosistema Hadoop. HDFS es el sistema de almacenamiento primario de Hadoop. El sistema de archivos distribuidos de Hadoop (HDFS) es un sistema de archivos basado en Java que proporciona almacenamiento de datos escalable,…

¿Por qué Hadoop es la herramienta más popular para Big Data?

¿Por qué Hadoop es la herramienta más popular para Big Data?

Apache Hadoop es la herramienta de big data más popular y potente. Hadoop proporciona la capa de almacenamiento más confiable del mundo «HDFS«, un motor de procesamiento por lotes «MapReduce» y una capa de administración de recursos «YARN«. Algunas de…

Hadoop es omnipresente – Está y estará en todas partes

Hadoop es omnipresente – Está y estará en todas partes

No hay industria donde Big Data no haya llegado. Big Data ha cubierto casi todos los dominios como salud, comercio minorista, gobierno, banca, medios de comunicación, transporte, recursos naturales, etc. Podemos ver esto en la figura de arriba. Las personas…

Ecosistema Hadoop – Componentes

Ecosistema Hadoop – Componentes

Apache™ Hadoop® es un proyecto de software de código abierto que se puede utilizar para almacenar, procesar y analizar de forma eficaz, grandes volúmenes de datos; cientos de terabytes, petabytes o incluso más. En lugar de utilizar un equipo grande…

10 imágenes sobre inteligencia artificial y machine learning

10 imágenes sobre inteligencia artificial y machine learning

Haciendo alusión a la frase popular de «una imágen vale más que 1000 palabras», el portal AISOMA nos brinda 10 imágenes que abordan temas relacionados con inteligencia artificial (IA) y Machine Learning (ML). Entre los temas tenemos: Evolución de la…