Soporte Pentaho para Hadoop

Enviado por Marcela Calderón Corail el 20/08/2010 a las 13:34
Marcela Calderón Corail
Pentaho utiliza Hadoop para entregar grandes análisis de datos.

Un gran volumen de datos no debería significar grandes costos. Los volúmenes de información están creciendo a un ritmo nunca antes visto. La tecnología open source, Apache Hadoop, es la tecnología de preferencia para empresas que necesitan reunir, almacenar y procesar efectivamente grandes cantidades de información estructurada y compleja.

Aunque Hadoop es muy poderoso, en su forma cruda, carece de interfaces fáciles de usar para análisis efectivos en tiempo y costo. Una vez que la información entra en Hadoop, ¿Cómo es que sale de ahí? ¿Cómo se exploran y analizan esos datos?

Si tan sólo existiera un producto ETL y BI.......

hadoop_PDI.jpg

hadoop_reporting.jpg

Aspectos destacables
  • La Suite BI de Pentaho ofrece una integración de datos comprensiva, capacidades de reporte y análisis que permite a los desarrolladores y analistas de negocios de Hadoop crear de manera fácil y rápida aplicaciones BI sin codificar. Hay que pensar en Pentaho como el front-end para Hadoop para construir integraciones de datos y aplicaciones de Business Intelligence.
  • Pentaho Data Integration (también conocido como Kettle) es un complemento tecnológico natural y una solución de integración de datos para Hadoop dada su rica herramienta de diseño, arquitectura escalable, distribución de código abierto y adopción en un gran número de sitios Hadoop.
  • La Suite BI de Pentaho ofrece una flexibilidad de implementación sin precedentes pudiendo implementar la misma plataforma con todas las características en sus instalaciones o en la nube o en aplicaciones personalizadas embebidas.
  • El primer resultado de esta iniciativa es el desarrollo de Pentaho Data Integration (PDI) para ser el entorno visual de procesos ETL que incluye la manipulación de archivos Apache Hadoop y la ejecución de herramientas Hadoop. El siguiente conjunto de resultados, que seguirán poco después, van a habilitar la presentación de informes, tableros de control y análisis directo desde los datos almacenados en Hadoop.
Lo que la comunidad está diciendo sobre el soporte Pentaho para Hadoop

"La creciente demanda por aplicar análisis para proveer de información interna a la empresa continúa creciendo a medida que los volúmenes de datos crecen exponencialmente. Pentaho va un paso adelante para liderar la integración de datos para Hadoop y proveer la plataforma BI y herramientas para generar análisis y entregar una amplia gama de capacidades para los negocios y TI." Mark Smith, CEO & EVP Research, Ventana Research

"Utilizamos Hadoop simplemente por las restricciones de los RDBMS tradicionales basados en nuestro volumen de impresión. La combinación de Hadoop y Pentahoo nos dará la oportunidad  de manera fácil y rentable, de llevar nuestro análisis de "grandes datos" a un nivel completamente nuevo y obtener conocimientos nunca antes posibles." Naghi Prasad, VP Engineering, Offerpal

"El servicio de monitoreo  Attributor's Guardian TM escanea más de 40 billones de páginas diariamente, como consecuencia, nuestras  necesidades de datos son significativas. Estamos comprometidos tanto con Hadoop como con Pentaho, y su integración es una enorme victoria para nosotros." Adrian McDermott, Chief Technical OfficerAttributor      

 

Pentaho uiliza Hadoop para entregar grandes análisis de datos
Gran Información no debería significar grandes costos
Los volumenes de información están creciendo a un ritmo nunca antes visto. Una tecnología de recurso abierto, Apache Hadoop, es la tecnología de preferencia para empresas que necesitas reunir, guardar y procesar efectivamente grandes cantidaddes de información estructurada y compleja.
Mientras Hadoop is muy poderoso, en su forma cruda, carece de de interfaces fáciles de usar a tiempo y analisis de costo efectivos. Una vez que la información entra en Hadoop, cómo es que sale de ahí? Como se explora y analiza esos datos? Si tan solo hubiera uno producto ETL y BI...
VIDEO
Destacados
Pentaho BI Suite ofrece una integración de datos comprensiva, capacidades de reporte y análisis que permite a los desarrolladores y analistas de negocios de Hadoop crear de manera fácil y rápida aplicaciones BI sin codificar. Think of Pentaho as the front-end to Hadoop for building data integration and business intelligence applications.
Pentaho Data Integration (también conocido como Kettle) es un ajuste de tecnología natural y solución de integración de datos para Hadoop dada su rica herramienta de diseño, arquitectura escalable, distribución de código abierto y aprobación en un gran número de sitios Hadoop.
Pentaho BI Suite ofrece una flexibilidad de implementación sin precedentes pudiendo implementar la misma plataforma con todas las características en sus instalaciones o en la nube o en aplicaciones personalizadas incrustadas.
El primer resultado de esta iniciativa es el desarrollo de Pentaho Data Integration (PDI) para ser el entorno visual de procesos ETL que incluye la manipulación de archivos Apache Hadoop y la ejecución de herramientas Hadoop. El siguiente conjunto de resultados, que seguirán poco después, va a habilitar la presentación de informes, tablero de control y analizar directamente desde los datos almacenados en Hadoop.
Lo que la comunidad está diciendo sobre el soporte Pentaho para Hadoop
"La creciente demanda por aplicar Analytics para proveer de información interna a la empresa continúa creciendo a medida que los volúmenes de datos crecen exponencialmente. Pentaho va un paso adelante para liderar la integración de datos para Hadoop y proveer la plataforma BI y herramientas para generar Analytics y entregar una amplia gama de capacidades para los negocios y TI."
Mark Smith
CEO & EVP Research
Ventana Research
"Utilizamos Hadoop simplemente por las restricciones de los RDBMS tradicionales basados en nuestro volumen de impresión. La combinación de Hadoop y Pentahoo nos dará la oportunidad  
de manera fácil y rentable, de llevar nuestro análisis de "grandes datos" a un nivel completamente nuevo y obtener conocimientos nunca antes posibles."
Naghi Prasad
VP Engineering
Offerpal
"El servicio de monitoreo  Attributor's Guardian TM escanea más de 40 billones de páginas diariamente, como consecuencia las necesidades de nuestros datos son significativos. Estamos comprometidos tanto con Hadoop como con Pentaho, y su integración es una enorme victoria para nosotros.
Adrian McDermott
Chief Technical Officer
Attributor   
     

 

Etiquetas: | Categorias

Pentaho en Chile

Enviado por Cognus Top Line Consulting el 21/06/2010 a las 13:37
Cognus Top Line Consulting

1277505496634-invitacion.jpg

Curso de Entrenamiento en Pentaho

Enviado por Sebastián Beca el 11/06/2010 a las 12:55
Sebastián Beca

Programa del Curso: Pentaho_BI_Suite_Bootcamp

Una de las mejores maneras de llevar adelante un proyecto de Inteligencia de Negocios de manera exitosa es contar con personas capacitadas en las herramientas y tecnologías adecuadas. Durante el próximo mes de Julio entre los días 12 y 15, Cognus dictará el curso de capacitación en Pentaho conocido como Pentaho BI Suite Bootcamp (SLN5000).

Este curso es el central de la escuela de Pentaho, el cual entrega una introducción a todos los conceptos y herramientas principales de la plataforma incluyendo instalación del servidor, modelamiento y diseño de un datawarehouse y cubos con Pentaho Analysis (Mondrian), integración de datos mediante ETLs con Pentaho Data Integration y el diseño y publicación de reportes con Pentaho Reporting.

Para detalles del curso: Pentaho_BI_Suite_Bootcamp-JULIO_2010.pdf

Para inscribirse puede completar el formulario en : bootcamp.cognus.cl


Reduciendo el costo de Business Intelligence con Open Source

Enviado por José Pedro Toma Bonnevaux el 26/05/2010 a las 21:14
José Pedro Toma Bonnevaux

La firma de analistas Third Nature ha lanzado un paper que compara el costo de Business Intelligence propietario con el costo de Business Intelligence open source comercial de Pentaho. El estudio concluye que en el nivel de entrada con un pequeño número de usuarios, el modelo open source puede ser un poco a mucho más barato. Con el aumento en el tamaño de la implementación, la diferencia es cada vez más notoria.

Mark Madsen es el presidente de Third Nature, una firma de consultoría e investigación dedicada al Business Intelligence, integración y gestión de datos. Su último artículo, "Lowering the Cost of Business Intelligence with Open Source” (Reduciendo el costo de Business Intelligence con Open Source) muestra cómo reducir significativamente el costo de BI para su empresa con código abierto comercial. El informe muestra cómo las empresas están ahorrando cientos de miles, si no millones, de dólares con BI de código abierto.  Para pequeños proyectos de BI, las empresas están ahorrando un promedio de 50% y proyectos de BI más grandes, las empresas están ahorrando más del 90%.

Para descargar el artículo completo: lower_costs_with_osbi.pdf

(Leer más)

Pentaho rankeado en los top como proveedor Open Source en importante encuesta de usuarios de BI

Enviado por Marcela Calderón Corail el 18/05/2010 a las 16:13
Marcela Calderón Corail

1274213640797-pentaho_logo.pngPentaho Corporation, el líder de Business Intelligence Open Source, anunció hoy que un nuevo estudio de mercado de Business Intelligence, desarrollado por Dresner Advisory Services, ha rankeado a Pentaho como número uno en todas las categorías por Valor de la Solución y Servicios de Consultoría, y el 100 por ciento de los usuarios de Pentaho que respondieron la encuesta recomendaron a la compañía. El estudio, denominado “Wisdom of Crowds” se encuentra disponible para descarga en http://www.pentaho.com/wisdom_of_crowds/

(Leer más)

Sernatur automatiza procesos del Programa Vacaciones Tercera Edad con Apia

Enviado por Mauricio Vidal el 17/05/2010 a las 16:48
Mauricio Vidal

Dado el éxito de la herramienta Apia como BPM en el caso del programa Chile Emprende, es que nuevamente el Servicio Nacional de Turismo, Sernatur, ha confiado en Cognus y en esta poderosa herramienta, para automatizar esta vez los procesos de fiscalización y rendición de su Programa de Vacaciones Tercera Edad, el cual está focalizado a fomentar el turismo a nivel nacional en las temporadas baja y media para los adultos mayores de nuestro país. Mediante esta implementación es que ahora Sernatur podrá obtener más control y gestión sobre los viajes que se realizan a nivel nacional. Además, se permitirá a su vez avanzar progresivamente a disminuir la documentación física que se utiliza en la actualidad durante el desarrollo de cada temporada del Programa. Finalmente y como un beneficio no menor, se aprecia una ventaja en el apoyo a la administración financiera del programa.

(Leer más)

Pentaho Data Integration 4.0

Enviado por Cristián Correa el 17/05/2010 a las 16:44
Cristián Correa
Una herramienta concreta para el desarrollo ágil de soluciones de Business Intelligence

En el mundo del desarrollo de software las metodologías ágiles cada día van adquiriendo mayor aceptación y adopción dada la versatilidad y flexibilidad que ofrecen, características que en la Inteligencia de Negocios (BI) también se aprecian bastante. Hace un par de días Pentaho mostró al público y a la comunidad en general un prototipo de su nueva versión de la herramienta de integración de datos Pentaho Data Integration (PDI) la cual fue concebida para apoyar el desarrollo de soluciones de (BI) mediante metodologías ágiles, reduciendo y optimizando el ciclo de vida de aplicaciones BI al permitir avanzar de forma paralela en el diseño de las ETL, modelamiento y visualización de datos, que a su vez ayuda a reducir costos, mejorar la productividad y acortar el tiempo necesario para obtener resultados concretos.

(Leer más)

Pentaho Analyzer: Tecnología de análisis de vanguardia

Enviado por Sebastián Beca el 06/11/2009 a las 19:28
Sebastián Beca

El análisis exploratorio de datos (EDA) en las herramientas de Business Intelligence típicamente se realiza por medio de la manipulación de cubos multidimensionales OLAP. Estos cubos son básicamente una manera de representar los datos a trabajar, separando las variables en Dimensiones y Medidas. Por ejemplo, para una empresa del sector retail, las dimensiones pueden ser Producto (con una jerarquía de Categoría-Línea-Producto), Cliente (País-Región-Comuna-Cliente) y Tiempo (Año-Mes-Dia). La medida típica sería las Ventas. La aplicación que utiliza el usuario final es como una gran tabla dinámica, que le permite ver sus medidas, a través de los distintos niveles de las dimensiones.

(Leer más)