Gestión de la Calidad en los Datos

Walberto Buelvas Argumedo. Medico Diabetólogo, Magister Big Data. Miembro Al Pocrates, Centro de Pensamiento Inteligencia Artificial Aplicada en Salud

“La calidad de nuestras decisiones será tan buena como la de de los datos en los que nos basamos”

La calidad de los datos en salud es un factor determinante para la analítica. El valor potencial del dato en las organizaciones sanitarias no ha parado de crecer en los últimos años como consecuencia de la consolidación de los sistemas de historia clínica electrónica. Los hospitales tienen a su disposición múltiples estrategias para alcanzar dicho valor como big data, bussines analytics o business intelligence. Sin embargo, las organizaciones, en la gran mayoría de los sectores, aún no han logrado capturar dicho valor.

El gobierno del dato es clave para desbloquear las oportunidades que proporcionan los datos y algoritmos. Dentro de las áreas del gobierno del dato destaca la calidad del mismo. Sin ciertos niveles en la calidad de los datos, la toma de decisiones y la eficiencia de los procesos pueden verse afectadas por perdida de integridad, falta de completitud o incluso por la aparición de inconsistencias. Lo que se denomina: “garbage in, garbage out”.

La gestión de la calidad de los datos es crítica en un entorno de Data Warehouse (bodegas de datos) y posteriormente analítico porque cualquier error en calidad de datos, hace que la información extraída posteriormente por el sistema de Business Intelligence pueda conducir a la toma de decisiones erróneas.

Los beneficiarios de una adecuada gestión serían todos los miembros de la organización, sin embargo, los responsables pueden agruparse en dos categorías:

– Propietarios del dato.

– Desarrolladores del proyecto de gestión de datos.

Los primeros son quienes ostentan un contacto más directo con el dato, desde su creación o importación, mientras que los segundos son los que se encargan de implementar el proyecto de administración, por lo que tienen mayores posibilidades de detectar errores de calidad, algo que suele suceder durante la etapa del perfilado.

Abordar con pulcritud la gestión de los datos implica concentrarse en dos procesos principales:

– Exploración de datos.

– Calidad de datos.

Fuente: Juan I. Barrios.  Médico especialista en Informática médica, MSc Business Intelligence

La gestión de la calidad de los datos en el tiempo

Una de las claves para la gestión de datoses el marco temporal de actuación (ver gráfico). Está claro que la fase de implementación debe desarrollarse de acuerdo con rigurosos estándares, sin embargo, no puede obviarse la necesidad de atención que hay que prestar a esta materia posteriormente.

Los pasos por seguir son:

1. Descubrir: identificar y medir la calidad de los datos.

2. Perfilar: definir reglas y objetivos de calidad de datos.

3. Limpiar: diseñar los procesos de mejora de calidad (homologando y enriqueciendo cuando sea necesario).

4. Match: Vinculación de información y estadísticas.

5. Consolidar: fase de implementación de los procesos de mejora de la calidad.

6. Monitorizar: hacer un seguimiento de la calidad de los datos comparándolos a los objetivos prefijados.

 Fuente: Juan I. Barrios.  Médico especialista en Informática médica, MSc Business Intelligence




De manera continua, y desde el momento en que la ejecución de la implementación se ha dado por concluida, es preciso monitorizar la calidad de los datos. La frecuencia de monitorización dependerá de cada negocio y de sus necesidades, sin embargo, en todo caso la implementación de estos procesos de calidad debe estar prevista dentro de la fase de transformación.

Cuando se lleva a cabo la gestión de la calidad de los datos hay que tratar de evitar los errores más frecuentes que pueden llevar al fracaso del proyecto y lo que es más importante, extender su impacto negativo en las acciones futuras de la empresa. Hay que prestar especial atención a:

– La fase de perfilado: es el punto de partida y sólo se lleva a cabo una vez. Darle la consideración necesaria es fundamental ya que es en ese momento cuando se puede conocer de verdad lo que deparan futuros estadios del desarrollo.

– Diversidad de fuentes: la variedad de orígenes de datos puede hacer caer en riesgos de duplicidades, los cuales una vez gestionados con el MDM (gestión de datos maestros), pueden también acarrear duplicados de un mismo sistema.

– Duplicidades en el mismo sistema: otro de los temas más delicados a considerar y que suelen venir motivados por errores humanos.

– Datos incompletos: la completitud es uno de los atributos de la calidad del dato que mayor importancia tienen en términos de análisis. La detección de datos carentes de ella es imprescindible para garantizar la consistencia de la información con que se trabajará.

Conclusiones:

La importancia del dato es cada día más evidente. Es el activo más importante de las corporaciones, del mundo en movimiento a la revolución 5.0.

Los datos no dependen en exclusiva de los sistemas informáticos, ya que los datos los manipulamos los seres humanos y si en cada una de estas etapas no ponemos el énfasis como corresponde, el resultado de cualquier evento podría terminar siendo muy diferente.

Se hace necesario que las entidades de salud cuenten con un Chief Data Officer CDO (un experto de los datos de las organizaciones), quienes deben ocupar un rol estratégico a nivel de Junta directiva. Otro perfil que se torna importante es el científico de datos (experto que diseña las arquitecturas de datos y luego analiza la calidad de los datos a través de técnicas de Big Data).

La habilidad de los científicos de datos será el de velar porque en todas las etapas y pasos que hemos visto con anterioridad, se ponga el esfuerzo para que la calidad final del mismo permita optimizar las decisiones derivadas de su análisis. Esta es no solo la mejor sino la única forma en que modelar la realidad cobrará sentido.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: