¿Qué es el Big Data? ¿Cómo puedo tratar los datos de mi empresa?

big dataHoy en día las empresas tienen grandes volúmenes de información. Esa información tiene un gran valor estratégico para las empresas, que han tenido que enfrentarse a nuevos desafíos y problemas.

El problema se encuentra en que esos grandes volúmenes de información no podían ser analizados o procesados de forma tradicional ya que la rapidez y la eficiencia en el análisis de los datos es fundamental para la toma de decisiones estratégicas. Es en ese contexto en el que aparece Hadoop como un conjunto de herramientas informáticas que permiten analizar esos datos de forma inteligente y de forma rápida.

hadoopHadoop es una plataforma de aplicaciones distribuidas que nos permite trabajar con Big Data. Hadoop utiliza MapReduce (modelo de procesamiento paralelo liberado por Google) complementado con el sistema de archivos HDFS para gestionar la información.

Hadoop destaca por su arquitectura de alta disponibilidad, permitiendo la replicación de datos en un clúster. Para ello se basa en una arquitectura Maestro/Esclavo en el que un nodo actúa de Maestro y el resto actúan como esclavos, siendo encargados de almacenar la información, que será procesada en el nodo máster cuando corresponda.

No podemos hablar de Hadoop sincloudera mencionar Cloudera. CDH (Cloudera Hadoop) fue la primer empresa en combinar Big Data y Hadoop.

Desde pretecnología os enseñaremos como instalar CDH5 en CentOS 6.

 

 

Anuncios

#Linuxeros: Debian, la opción preferida para los servidores

Debian se sitúa al frente como la distribución de Linux más utilizada en el ámbito empresarial, dejando atrás los tiempos en los que CentOS era la opción predominante.

ranking distribuciones linux

Como podemos comprobar en las estadísticas publicadas por W3techs,  Debian ha ampliado la distancia con sus competidores. CentOS, que hasta 2012 era la opción más popular entre los servidores web, continúa perdiendo peso. Tal es así, que Ubuntu le ha “robado” la segunda posición en el ranking, afianzándose como la distribución que más ha crecido en los últimos tiempos. Red Hat también sigue de capa caída y, pese a que obtenga grandes ingresos económicos, ya se encuentra en menos del 10% de los servidores web.

El binomio Debian / Ubuntu ya cuenta con un 58 % del mercado, frente al 37 % de CentOS y Red Hat.

debian ubuntuNo obstante, cada área geográfica tiene sus preferencias.  Europa prefiere Debian, Estados Unidos y Asia prefieren CentOS, mientras que Ubuntu es la opción preferida en Sudáfrica, Australia, Brasil y Argentina.

Cuando hablamos de una distribución “favorita” hemos de tener en cuenta que estas tendencias pueden cambiar de un día para otro y que un determinado “bug” puede dar al traste con la confianza de los administradores. También, es muy importante diferenciar los equipos de escritorio de los servidores y recordar que es más importante contar con un sistema fiable, pese a que este pueda estar un poco obsoleto, que utilizar distribuciones poco testeadas en los entornos de producción empresariales.

Dicho esto, ¿cuál es tu distribución Linux de confianza?

Fuente: bitacoras