|

lunes, 3 de junio de 2013

Pentaho Data Integration - Kettle ¿Cómo Instalar?


Tea Kettle

Pentaho Data Integration (PDI) o Kettle, es una poderosa, intuitiva y eficiente herramienta, para la realización de procesos de Extracción, Transformación y Carga.

Es muliplataforma, así que si trabajamos en Windows o en Linux no tenemos por qué preocuparnos. Es muy gráfica, así que nuestros procesos quedan plasmados en forma de flujos, por lo que en el trabajo suelen decirme que me la paso haciendo 'cuadritos'. Lo díficil es conocer el funcionamiento de cada uno de estos 'cuadritos' o los componentes de Kettle denominados steps, son bastantes y algunos tiene poca o nula documentación en la Internet.

Empecemos por definir algunos conceptos:

Kettle: Otro nombre con el que se suele denominar Pentaho Data Integration, o mejor el nombre original de la herramienta antes que fuera adquirida por Pentaho.

Spoon: Programa que permite construir procesos con una interfaz muy gráfica e intuitiva.

Kitchen: Componente que permite ejecutar jobs por línea de comandos.

Pan: Componente que permite ejecutar transformaciones por línea de comandos.

Bueno ... mucha teoría y vamos a la práctica, primero tenes que tener instalado Java en nuestra máquina. La última versión de Java la podemos conseguir en este enlace http://www.oracle.com/technetwork/es/java/javase/downloads/index.html
  • Luego debemos comprobar que exista la variable de entorno JAVA_HOME, para ello damos clic derecho en MiPC -> Propiedades -> Configuración Avanzada del Sistema -> Opciones Avanzadas -> Variables de Entorno. Si no existe, damos clic en Nueva ... y le asignamos la ruta de instalación del JDK o el JRE


  • Cremos un directorio con nombre pentaho en algún lugar de nuestros disco (preferiblemente en la raíz del sistema) y descomprimos el archivo. Nos creará una carpeta llamada data-integration. 
  • Si vamos a trabajar con bases de datos diferentes a MySQL, es necesario descargar los respectivos .jar del JDBC y copiarlos a la ruta ..,/data-integration/libext/JDBC. En mi caso que suelo trabajar con bases de datos Oracle tengo que copiar el archivo ojdbc14.jar
  • Ahora podemos iniciar el programa entrando al directorio de instalación (.../data-integration) y ejecutando el archivo Spoon.bat en Windows o spoon.sh en Linux.


Si se desean descargar los demás productos de la suite versión community los puede encontrar en la dirección http://community.pentaho.com/. En la próxima entrada veremos como configurarle los parámetros de memoria al Spoon.

3 comentarios:

  1. estimados puedes explicar sobre instalación de pentaho schema workbenck para hacer cubos

    ResponderEliminar
  2. Al ejecutar spoon.bat se ejecuta y se cierra. ¿Cómo y dónde están las variables de entorno de Pentaho para aumentar el valor de la variable PENTAHO_DI_JAVA_OPTIONS a un valor mayor que 2048?
    ¿Tengo que darle permisos en Windows10?
    Gracias y un saludo.

    ResponderEliminar
  3. Buenas tardes, alguien por favor que me pueda ayudar

    ResponderEliminar

Related Posts Plugin for WordPress, Blogger...