¿Qué es el Big Data? ¿Cómo puedo tratar los datos de mi empresa?

big dataHoy en día las empresas tienen grandes volúmenes de información. Esa información tiene un gran valor estratégico para las empresas, que han tenido que enfrentarse a nuevos desafíos y problemas.

El problema se encuentra en que esos grandes volúmenes de información no podían ser analizados o procesados de forma tradicional ya que la rapidez y la eficiencia en el análisis de los datos es fundamental para la toma de decisiones estratégicas. Es en ese contexto en el que aparece Hadoop como un conjunto de herramientas informáticas que permiten analizar esos datos de forma inteligente y de forma rápida.

hadoopHadoop es una plataforma de aplicaciones distribuidas que nos permite trabajar con Big Data. Hadoop utiliza MapReduce (modelo de procesamiento paralelo liberado por Google) complementado con el sistema de archivos HDFS para gestionar la información.

Hadoop destaca por su arquitectura de alta disponibilidad, permitiendo la replicación de datos en un clúster. Para ello se basa en una arquitectura Maestro/Esclavo en el que un nodo actúa de Maestro y el resto actúan como esclavos, siendo encargados de almacenar la información, que será procesada en el nodo máster cuando corresponda.

No podemos hablar de Hadoop sincloudera mencionar Cloudera. CDH (Cloudera Hadoop) fue la primer empresa en combinar Big Data y Hadoop.

Desde pretecnología os enseñaremos como instalar CDH5 en CentOS 6.

 

 

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s