sábado, 10 de noviembre de 2012

Hadoop

Saludos Mundo Libre.

¿Qué es Apache Hadoop?

El Apache Hadoop ™ ® proyecto desarrolla software de código abierto para la fiabilidad, la computación escalable y distribuido.

El Apache Hadoop biblioteca de software es un marco que permite el procesamiento distribuido de grandes conjuntos de datos a través de grupos de ordenadores que utilizan modelos sencillos de programación. Está diseñado para pasar de los servidores individuales a miles de máquinas, cada oferta local de computación y almacenamiento. En lugar de confiar en el hardware para ofrecer alta avaiability, la propia biblioteca está diseñada para detectar y controlar los errores en la capa de aplicación, por lo que la entrega de un servicio altamente availabile en la parte superior de un grupo de computadoras, cada una de las cuales puede ser propenso a errores.

El proyecto incluye los siguientes módulos:

    Común Hadoop: Las utilidades comunes que soportan los otros módulos de Hadoop.
    Hadoop Distributed File System (HDFS ™): Un sistema de archivos distribuido que proporciona un alto rendimiento de acceso a datos de aplicaciones.
    HILADOS Hadoop: Un marco para la planificación de tareas y gestión de recursos de clúster.
    Hadoop MapReduce: Un sistema basado en HILADOS para el procesamiento paralelo de grandes conjuntos de datos.

Otros proyectos relacionados con Hadoop de Apache son:

    Avro ™: Un sistema de serialización de datos.
    Cassandra ™: Un escalable multi-master de base de datos sin puntos únicos de falla.
    Chukwa ™: Un sistema de recolección de datos para la gestión de grandes sistemas distribuidos.
    HBase ™: Una base de datos escalable y distribuida que soporta el almacenamiento de datos estructurados para tablas grandes.
    Hive ™: Una infraestructura de almacenamiento de datos que proporciona el resumen de datos y consultas ad hoc.
    Mahout ™: una máquina de aprendizaje escalable y biblioteca minería de datos.
    Pig ™: Un alto nivel de flujo de datos lenguaje y un marco de ejecución de cómputo paralelo.
    ZooKeeper ™: Un servicio de coordinación de alto rendimiento para aplicaciones distribuidas.

Introducción

Para empezar, comience aquí:

    Aprenda sobre Hadoop mediante la lectura de la documentación.
    Descarga desde la página de Hadoop liberación.
    Discuta Hadoop en la lista de correo.

Descargar Hadoop

Por favor, visita la página lanzamientos para descargar una versión de Apache Hadoop.
¿Quién utiliza Hadoop?

Una amplia gama de empresas y organizaciones utilizan Hadoop para la investigación y la producción. Los usuarios están invitados a sumarse a la página de Hadoop PoweredBy wiki.




Para aquellos que quieren conocer un poco sobre las entranas de como funciona Facebook.

Fuente:http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F

Traduccion:Dellcom1@.

No hay comentarios:

Publicar un comentario