Herramienta de integración de datos de Pentaho (PDI)
Las herramientas de integración de datos de código abierto están disponibles para la inteligencia de negocios (BI) y los procesos de visualización de datos. Hay varias herramientas de integración de datos de código abierto como Clover ETL, Pentaho, Karma, Pimcore, Skool, Myddleware, Talend Open Studio. Entre ellos, PDI es la herramienta de integración de datos más utilizada y fácil de usar. Tiene una interfaz gráfica de usuario (GUI) inteligente y equilibrada. PDI se usa principalmente para el procesamiento de datos, que también se puede usar con el sistema de archivos Hadoop (HDFS).
Para el procesamiento analítico en línea (OLAP) y la visualización de datos, es muy importante manejar los datos con cuidado y manipularlos si es necesario. Para este tipo de trabajo, la integración de datos de Pentaho es una herramienta útil que se puede ejecutar en casi todos los sistemas operativos.
Instalación de la herramienta de integración de datos Pentaho
Instalar y configurar Java en Windows
Si tiene una versión superior de Java instalada en su sistema, primero debe eliminarla.
Puede descargar Java desde el sitio web oficial: https://www.java.com/en/download/ o en https://www.oracle.com/java/technologies/downloads/#java8-windows. Después de descargar Java, deberá instalarlo en su computadora siguiendo las instrucciones.
Variables de entorno
A continuación, deberá configurar las variables de entorno para agregar Java al inicio Para hacer esto, siga estos pasos:
- Abrir el menú Inicio y buscar «variables de entorno».
- Clic en «Editar las variables de entorno del sistema».
- Clic en el botón «Variables de entorno».
- En «Variables del sistema», clic en «Nuevo».
- Ingrese «JAVA_HOME» para el nombre de la variable y la ruta al directorio de instalación de Java para el valor de la variable.
- Haga clic en «Aceptar» para guardar los cambios.
Descargar la herramienta de integración de datos de Pentaho
El enlace de descarga se proporciona a continuación. Es un archivo comprimido de casi 1,7 GB.
Descargar Pentaho (https://www.hitachivantara.com/en-us/products/pentaho-plus-platform/data-integration-analytics/pentaho-community-edition.html)
Una vez finalizada la descarga, extrer el archivo comprimido.
Dentro de la carpeta, debe encontrar la herramienta spoon, que se ejecutará para abrir la PDI. Con la ayuda de Java, spoon ejecuta la herramienta de integración de datos Pentaho dentro del servidor.
Para ejecutar la herramienta spoon.bat, vaya dentro de la carpeta de integración de datos de Pentaho, haga doble clic: