Una de las grandes ventajas de Pentaho Data Integration, es que podemos elegir la mejor manera de realizar una tarea de transformación o limpieza de información: Realizándola directamente en la consulta SQL, traernos los datos y realizarla con un Step de Kettle o un Script Java-JavaScript.
Hoy les muestro una sencilla consulta para reemplazar caracteres especiales de una columna en ORACLE apoyándonos en la función REGEXP_REPLACE.
SELECT REGEXP_REPLACE(LA_COLUMNA, '[^A-Za-z0-9ÁÉÍÓÚáéíóú ]', '') AS COLUMNA FROM TABLA;
Para realizar pruebas sin necesidad de tener una tabla propia nos podemos apoyar de la tabla DUAL.
SELECT REGEXP_REPLACE('ANA MARIA R$$$""OJAS MARTÍNEZ(', '[^A-Za-z0-9ÁÉÍÓÚáéíóú ]', '') AS COLUMNA FROM DUAL;
El resultado de esta consulta será:
ANA MARIA ROJAS MARTÍNEZ
SQL, JavaScript, Step de Kettle ...¿Cual es la mejor forma de hacerlo? Dependerá de nuestra experiencia, los recursos técnicos de nuestro SGBD y del servidor de procesamiento, así que les aconsejo probar varias opciones para encontrar la más eficiente.
¡Hasta una próxima entrada!.
estimado, si quiero hacer una auditoria para conocer la calidad de datos en un datamart Oracle teniendo umbrales de aceptacion
ResponderEliminarGracias por tu aporte!
ResponderEliminar