Soporte Pentaho para Hadoop

Enviado por Marcela Calderón Corail el 20/08/2010 a las 13:34
Marcela Calderón Corail
Pentaho utiliza Hadoop para entregar grandes análisis de datos.

Un gran volumen de datos no debería significar grandes costos. Los volúmenes de información están creciendo a un ritmo nunca antes visto. La tecnología open source, Apache Hadoop, es la tecnología de preferencia para empresas que necesitan reunir, almacenar y procesar efectivamente grandes cantidades de información estructurada y compleja.

Aunque Hadoop es muy poderoso, en su forma cruda, carece de interfaces fáciles de usar para análisis efectivos en tiempo y costo. Una vez que la información entra en Hadoop, ¿Cómo es que sale de ahí? ¿Cómo se exploran y analizan esos datos?

Si tan sólo existiera un producto ETL y BI.......

hadoop_PDI.jpg

hadoop_reporting.jpg

Aspectos destacables
  • La Suite BI de Pentaho ofrece una integración de datos comprensiva, capacidades de reporte y análisis que permite a los desarrolladores y analistas de negocios de Hadoop crear de manera fácil y rápida aplicaciones BI sin codificar. Hay que pensar en Pentaho como el front-end para Hadoop para construir integraciones de datos y aplicaciones de Business Intelligence.
  • Pentaho Data Integration (también conocido como Kettle) es un complemento tecnológico natural y una solución de integración de datos para Hadoop dada su rica herramienta de diseño, arquitectura escalable, distribución de código abierto y adopción en un gran número de sitios Hadoop.
  • La Suite BI de Pentaho ofrece una flexibilidad de implementación sin precedentes pudiendo implementar la misma plataforma con todas las características en sus instalaciones o en la nube o en aplicaciones personalizadas embebidas.
  • El primer resultado de esta iniciativa es el desarrollo de Pentaho Data Integration (PDI) para ser el entorno visual de procesos ETL que incluye la manipulación de archivos Apache Hadoop y la ejecución de herramientas Hadoop. El siguiente conjunto de resultados, que seguirán poco después, van a habilitar la presentación de informes, tableros de control y análisis directo desde los datos almacenados en Hadoop.
Lo que la comunidad está diciendo sobre el soporte Pentaho para Hadoop

"La creciente demanda por aplicar análisis para proveer de información interna a la empresa continúa creciendo a medida que los volúmenes de datos crecen exponencialmente. Pentaho va un paso adelante para liderar la integración de datos para Hadoop y proveer la plataforma BI y herramientas para generar análisis y entregar una amplia gama de capacidades para los negocios y TI." Mark Smith, CEO & EVP Research, Ventana Research

"Utilizamos Hadoop simplemente por las restricciones de los RDBMS tradicionales basados en nuestro volumen de impresión. La combinación de Hadoop y Pentahoo nos dará la oportunidad  de manera fácil y rentable, de llevar nuestro análisis de "grandes datos" a un nivel completamente nuevo y obtener conocimientos nunca antes posibles." Naghi Prasad, VP Engineering, Offerpal

"El servicio de monitoreo  Attributor's Guardian TM escanea más de 40 billones de páginas diariamente, como consecuencia, nuestras  necesidades de datos son significativas. Estamos comprometidos tanto con Hadoop como con Pentaho, y su integración es una enorme victoria para nosotros." Adrian McDermott, Chief Technical OfficerAttributor      

 

Pentaho uiliza Hadoop para entregar grandes análisis de datos
Gran Información no debería significar grandes costos
Los volumenes de información están creciendo a un ritmo nunca antes visto. Una tecnología de recurso abierto, Apache Hadoop, es la tecnología de preferencia para empresas que necesitas reunir, guardar y procesar efectivamente grandes cantidaddes de información estructurada y compleja.
Mientras Hadoop is muy poderoso, en su forma cruda, carece de de interfaces fáciles de usar a tiempo y analisis de costo efectivos. Una vez que la información entra en Hadoop, cómo es que sale de ahí? Como se explora y analiza esos datos? Si tan solo hubiera uno producto ETL y BI...
VIDEO
Destacados
Pentaho BI Suite ofrece una integración de datos comprensiva, capacidades de reporte y análisis que permite a los desarrolladores y analistas de negocios de Hadoop crear de manera fácil y rápida aplicaciones BI sin codificar. Think of Pentaho as the front-end to Hadoop for building data integration and business intelligence applications.
Pentaho Data Integration (también conocido como Kettle) es un ajuste de tecnología natural y solución de integración de datos para Hadoop dada su rica herramienta de diseño, arquitectura escalable, distribución de código abierto y aprobación en un gran número de sitios Hadoop.
Pentaho BI Suite ofrece una flexibilidad de implementación sin precedentes pudiendo implementar la misma plataforma con todas las características en sus instalaciones o en la nube o en aplicaciones personalizadas incrustadas.
El primer resultado de esta iniciativa es el desarrollo de Pentaho Data Integration (PDI) para ser el entorno visual de procesos ETL que incluye la manipulación de archivos Apache Hadoop y la ejecución de herramientas Hadoop. El siguiente conjunto de resultados, que seguirán poco después, va a habilitar la presentación de informes, tablero de control y analizar directamente desde los datos almacenados en Hadoop.
Lo que la comunidad está diciendo sobre el soporte Pentaho para Hadoop
"La creciente demanda por aplicar Analytics para proveer de información interna a la empresa continúa creciendo a medida que los volúmenes de datos crecen exponencialmente. Pentaho va un paso adelante para liderar la integración de datos para Hadoop y proveer la plataforma BI y herramientas para generar Analytics y entregar una amplia gama de capacidades para los negocios y TI."
Mark Smith
CEO & EVP Research
Ventana Research
"Utilizamos Hadoop simplemente por las restricciones de los RDBMS tradicionales basados en nuestro volumen de impresión. La combinación de Hadoop y Pentahoo nos dará la oportunidad  
de manera fácil y rentable, de llevar nuestro análisis de "grandes datos" a un nivel completamente nuevo y obtener conocimientos nunca antes posibles."
Naghi Prasad
VP Engineering
Offerpal
"El servicio de monitoreo  Attributor's Guardian TM escanea más de 40 billones de páginas diariamente, como consecuencia las necesidades de nuestros datos son significativos. Estamos comprometidos tanto con Hadoop como con Pentaho, y su integración es una enorme victoria para nosotros.
Adrian McDermott
Chief Technical Officer
Attributor   
     

 

Etiquetas: | Categorias

Escribe un comentario

¿Quieres usar tu foto? - Inicia tu sesión o Regístrate gratis »
Comentarios de este artículo en RSS