Persiguiendo un Ferrari en Bicicleta

Confieso que tiendo a utilizar metáforas en mis escritos (ver “Construyendo Versalles en Tumaco” en www.consultosalud.com), pero en este caso, el título de la columna va enfocado no a la brecha de capacidades entre el mundo desarrollado y países como Colombia, sino a la manifiesta diferencia de velocidad entre el sector de la tecnología y el nuestro, el de la salud. Por supuesto, me refiero al primero como el Ferrari y al segundo como la bicicleta.

Como hemos escrito previamente aquí en AIpocrates, los desarrollos de inteligencia artificial (IA) y los modelos avanzados de ciencia de datos han tenido un difícil desarrollo y una aún mas tormentosa implementación en el sector salud, esto por diversos motivos que van desde la validez, interpretabilidad, confianza y explicabilidad de los mismos hasta la apatía y el temor propios de quienes sienten toda esta revolución como una amenaza creciente a su propio trabajo y por ende a sus ingresos.

Dicha amenaza, la de la “irrelevancia laboral” y la subsecuente reemplazabilidad con la IA es muy clara en sectores como los de transporte y manufactura en donde, según un reciente informe de PricewaterHouse Coopers, los trabajos de hoy serán reemplazados en un 38 y 30% respectivamente. En el sector salud existen datos más “optimistas” si queremos verlo así, entre otros que en la revolución industrial 4.0. el nivel máximo de automatización será el 3, es decir que la toma de decisiones seguirá un modelo híbrido, pero con dominancia humana y el que solo será reemplazada un 12% de la fuerza laboral, pero además se aumentará en un 34% el empleo sectorial. El tema es que los nuevos empleos de la salud no estarán enfocados en la asistencia, sino en perfiles que hoy son escasos (y costosos) especialmente la bioinformática y la ciencia de datos. En resumen, quienes no quieran caer en dicha irrelevancia deben apostarle a adquirir lo que voy a llamar competencias de intersección.

El conocimiento moderno es integrativo, sistémico y transdisciplinario, el mejor ejemplo de este campo es la intersección entre varios conceptos que a veces tratamos indistintamente (y tambien equivocadamente), ellos son: Machine learning, deep learning, inteligencia artificial, ciencia de datos, ciencias de la computación, tecnologías exponenciales y analítica de negocios.

Si bien estas ciencias tienen en común algunos principios (especialmente matemáticos) sus objetivos son diferentes, pero a diferencia de nuestras especialidades médico-quirúrgicas, el valor incremental se encuentra precisamente en sus potentes combinaciones. El siguiente gráfico ejemplifica mejor dicha teoría de conjuntos:

Como podemos deducirlo, la inteligencia artificial engloba básicamente dos modelos diferentes de entrenamiento de máquina: el machine learning, que a su vez tiene las posibilidades de ejecutarse mediante aprendizaje supervisado, no supervisado o reforzado y el deep learning que esta constituido por modelos de entrenamiento más exigentes y complejos, dentro de el se encuentran las famosas redes neuronales de todo tipo (convolucionales, recurrentes, generativas etc) y los desarrollos de procesamiento natural de lenguaje y visión de máquina entre otros.

Pero, la ciencia de datos es la fuente natural e imprescindible de la inteligencia artificial, sin dicha estructura teórica no existe posibilidad de desarrollarla, es la piedra angular de su arquitectura, su Kernel como dirían los ingenieros de software.

Si nos enfocamos en lo que significa la ciencia de datos veremos que conjuga tres grandes conjuntos del conocimiento:

1. Ciencias de la computación y tecnología,

2. Matemática y estadística,

3. Inteligencia de negocios.

Para clarificar una frecuente confusión entre la epidemiología clínica y la ciencia de datos, la primera es la ciencia madre y la segunda una ciencia evolucionada que se basa en mayores capacidades (análisis de big data, modelos relaciones avanzados, predictiva/prescriptiva etc) para una mejor comprensión de la causalidad y una evolución a modelos exponenciales. No existe una pugna entre una y otra, debe existir una complementariedad, de hecho, algunas ramas de la epidemiología misma se están moviendo a dicha intersección, dentro de ellas la epidemiología digital.

Ahora bien, los modelos base en los cuales se cimenta la IA (machine learning y deep learning) tienen a su vez una subclasificación que nos permite navegar desde la superficie a la profundidad del entrenamiento y la complejidad con base en dos características: La utilidad empírica y el entendimiento teórico, veamos el siguiente gráfico:

Como puede deducirse de la gráfica a medida que la dificultad de entendimiento teórico disminuye desde los modelos lineales (regresión) hasta los modelos cuánticos, su utilidad empírica también es menor y por tanto su dificultad de implementación. Los cuadrantes superiores son mucho más parecidos a algunos de los modelos clásicos de la epidemiología clínica, mientras los correspondientes a los cuadrantes inferiores son nuevos para nosotros los médicos y engloban esencialmente lo que conocemos como deep learning y que utilizamos para desarrollos como los de soporte diagnóstico automatizado en imágenes (radiología y patología digital).

A continuación, algunos ejemplos de estos modelos y su agrupamiento correspondiente:

Tipo de IATipo de aprendizajeModeloSubtipos (ejemplos)
Machine learningAprendizaje SupervisadoRegresión linealLogística simple, logística múltiple, no lineal
  ClasificaciónArboles de decisión, máquinas de soporte vectorial
  De conjuntosTécnicas de boosting y random forest
  De ajuste (Tuning)Técnicas de regularización, reducción de dimensionalidad, de imbalance de datos
 Aprendizaje no supervisadoClusterizaciónK-means, análisis de componente principal (PCA), técnicas mixtas
Deep Learning Redes neuronalesConvolucionales, recurrentes, de competencia, generativas
  Procesamiento de lenguaje naturalAnálisis de sentimientos, análisis relacional (Transformers)

Existen diversos software sobre los cuales pueden codificarse y ejecutarse estos modelos, para no complejizarlo diré que la ciencia de datos en lo que respecta a machine learning y especialmente a visualización se mueve principalmente en R, mientras los modelos más complejos como los de aprendizaje supervisado, reforzado y deep learning funcionan posiblemente mejor en Python ®. Este tema será tratado en una futura columna aquí en AIpocrates. Vale la pena mencionar que la mayoría de estos software son de código abierto.

El Ferrari que vamos persiguiendo, como podemos ver, tiene un motor bastante potente en términos de rendimiento y suficientemente complejo en entendimiento, pero es el vehículo en el cual se mueve el mundo moderno y eso no va a cambiar. Hay sectores que ya no van en bicicleta y han logrado subirse a dicho carro en movimiento, dentro de ellos el de finanzas/banca y por supuesto el de la tecnología, sin embargo, es urgente que el sector salud adopte progresiva y efectivamente estos conceptos, empezando desde la academia. Nuestros profesionales requieren moverse a estas competencias de intersección so pena de sucumbir ante la velocidad y caer en la irrelevancia descrita previamente.

Como bien dice Noah Harari “El problema no es crear nuevos empleos sino en crear trabajos que los humanos realicen mejor que los algoritmos”. En salud, interpretar contextos y gestionar las emociones posiblemente sean menos complejas que estos modelos, entonces, ¿por qué no lo hemos hecho?, irónicamente la tecnología a los primeros que parece haber transformado en bots es a los humanos. Retornemos a nuestra esencia, transformando la inteligencia artificial en inteligencia asistida, solo así podremos retrasar el inefable destino de ser los últimos homos sapiens.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: