
Los avances en el conocimiento del sistema inmunológico han transformado el tratamiento y en consecuencia el pronóstico de pacientes con enfermedades cuyo mecanismo fisiopatológico se encuentra mediado por alteraciones en el sistema inmunológico, como por ejemplo, en el caso de la artritis reumatoide, las espondiloartritis, entre otras; hasta hace algunos años las intervenciones terapéuticas disponibles no permitían modificar el curso de la enfermedad, generando una inexorable progresión de la misma acarreando discapacidad permanente e irreversible en estos pacientes e incrementando la mortalidad.
El entendimiento profundo y la caracterización de los mecanismos de la respuesta inmunológica permiten, en el contexto clínico, no solo, diferenciar las enfermedades, sino establecer el pronóstico de los pacientes, así como, llevar a cabo el seguimiento y evaluar la respuesta a las diferentes intervenciones. Adicionalmente, este conocimiento ha permitido desarrollar diferentes medicamentos que modifican la respuesta inmunológica.
En respuesta a un reto antigénico, las células del sistema inmunológico actúan de forma coordinada para conformar una compleja red de señales celulares, el análisis y la caracterización de estas señales intracelulares es invaluable, ya que provee una evaluación funcional del sistema inmunológico de un individuo.
La respuesta del sistema inmunológico frente a una enfermedad autoinmunes o autoinflamatoria se expresa en la genética de células particulares, llamadas células T y células B, que forman el control del sistema inmune adaptativo. Cada célula T o B tiene una proteína de superficie correspondiente llamada receptor, la cual tiene un código genético que reconoce moléculas que dirigen a una señal específica alguna de estas enfermedades.
El mapeo de estas células es un desafío masivo que no se ha resuelto hasta el momento ya que requiere una tecnología de Inteligencia Artificial con capacidades de aprendizaje automático muy robustas.
Con este fin, se han desarrollado las técnicas actuales de citometría de flujo, las cuales, permiten caracterizar millones de células individuales de un paciente, permitiendo la identificación de señales intracelulares incluso en poblaciones celulares poco comunes. A su vez, el desarrollo reciente de la citometría de flujo espectral de alta dimensión y la citometría de masas, han incrementado de forma exponencial nuestra capacidad para estudiar el sistema inmunológico, ya que permiten el análisis de múltiples parámetros celulares en forma simultánea, así como, de diferentes características físicas y químicas, evaluando en promedio más de dos mil partículas por segundo.
Sin embargo, la dimensionalidad incrementada en relación con los tamaños de las cohortes en los estudios clínicos, así como, la complejidad inherente de las correlaciones entre los tipos celulares medidos, y sus señales intracelulares significan varios retos desde el punto de vista computacional.
Con esta reflexión, se buscaría crear una prueba universal que lea el sistema de una persona que nos permitiera revelar de manera temprana enfermedades, infecciones, cánceres y trastornos autoinmunes en su primera etapa y así entregar diagnósticos con mayor eficacia.
Es así como traducir estas observaciones multidimensionales y complejas, como lo son los datos del sistema inmunológico, en modelos computacionales relevantes requiere de técnicas estadísticas rigurosas. El análisis más utilizado es el multivariado, ya que, a diferencia del análisis univariado puede considerar en forma simultánea múltiples aspectos medidos en el sistema inmunológico, lo cual, permite mejorar las predicciones.
Por ese motivo creemos que el próximo avance en investigación fundacional será decodificar cómo el sistema inmunológico humano previene y controla la enfermedad autoinmune. La inteligencia artificial y el aprendizaje automático serán las claves de este logro, transformando el futuro de la salud humana frente a estas patologías crónicas de la misma manera que hoy están cambiando otros aspectos de nuestras vidas.
No obstante, el modelamiento multivariado requiere tamaños de muestra progresivamente mayores en la medida que el número de variables observadas se incrementa, esto es especialmente cierto en el caso de modelos que utilizan técnicas de aprendizaje de máquina (machine learning); como los basados en aprendizaje profundo (deep learning), los cuales, requieren tamaños de muestra sustancialmente mayores <<multidimensionalidad>>. Esto genera un reto importante, por un lado, por la baja prevalencia de las enfermedades autoinmunes y autoinflamatorias, lo cual hace difícil y costosa la recolección de muestras para llevar a cabo análisis con un mayor número de pacientes. Por otro lado, los análisis multivariados desarrollados que utilizan todas las mediciones disponibles generan modelos largos y complejos, poco robustos, difíciles de interpretar y de implementar en escenarios con recursos limitados.
Es por esto que en los últimos años se han desarrollado diferentes soluciones basadas en las técnicas de aprendizaje de máquina con el fin de superar algunos de los retos que implican el análisis de este tipo de datos, por ejemplo, soluciones que facilitan la integración de datos procedentes de diferentes sitios, en el caso de estudios multicéntricos, como es el caso de Swarm Learning (SL).
Estas herramientas son necesarias debido al enorme tamaño y complejidad del sistema inmunológico humano. El cual es miles de millones de veces más grande que el mismo genoma humano, y procesar esta cantidad gigantesca de información exige capacidades importantes de ciencia de datos y supercomputación de frontera. También exige un cambio significativo en la manera en que abordamos los estudios de investigación básica y clínica en autoinmunidad.
Tradicionalmente, los estudios clínicos en autoinmunidad se han centrado en realizar pruebas a la mayor cantidad de individuos tanto afectados como controles, alcanzando una cantidad limitada de datos sobre cada sujeto, lo cual en nuestro medio tiene muchas limitaciones debido al alto costo y acceso al sistema de salud. Con las remarcables herramientas nuevas de la genómica y la biología molecular que hoy tenemos a nuestra disposición, los investigadores pueden recoger millones de puntos de datos sobre un solo individuo. Esto nos conduce a un nuevo modelo para aprender: Menos personas, muchos más datos.
Así mismo, se han evaluado diferentes algoritmos con el objetivo de analizar datos procedentes de las técnicas moleculares, con el fin de obtener modelos robustos y que permitan su mejor interpretación y aplicación en el contexto clínico. Algunos de los modelos utilizados son el análisis por vecino más cercano (KNN), máquinas de soporte vectorial (SVM), árboles de decisión, selección de operador (LASSO) entre otros.
Adicionalmente, una forma efectiva para reducir la complejidad e incrementar la robustez de los modelos es la integración del conocimiento previo. En las ciencias biológicas, los ejemplos de esta integración de conocimiento previo incluyen la inferencia de redes biológicas y el modelamiento de rutas causales, no obstante, la integración de este conocimiento no ha sido fácil, debido al formato no estructurado de las bases de datos inmunológicas antiguas y adicionalmente a la naturaleza compleja de las características medidas.
Es por esto que se han registrado resultados favorables con el uso de algoritmos, como Elastic Net (EN) (Figura), ya que permiten la integración del conocimiento inmunológico previo en el proceso de optimización de los modelos. Pues al tratarse de modelos dispersos, se pueden utilizar cuando el número de variables excede el número de observaciones, como en el caso del perfilamiento de una única célula del sistema inmunológico. Esta dispersión no solo mejora el desempeño del modelo, sino que permite su mejor interpretación, característica indispensable en el escenario clínico en el cual se requiere de modelos más precisos e interpretables para la toma de decisiones clínicas o el desarrollo de nuevos medicamentos. Por otra parte, permite una mejor integración del conocimiento previo como lo demuestran los métodos de interpretación Bayesiana. La incorporación de este conocimiento inmunológico previo permite guiar el proceso de dispersión hacia soluciones más consistentes con el conocimiento biológico y simultáneamente permitiendo incorporar todas las variables inmunológicas medidas en el análisis exploratorio.
Respecto a la fuente del conocimiento previo, si bien se han utilizado las metodologías de consenso de expertos, estos métodos están sujetos a sesgos, por lo que, se están utilizando técnicas de análisis de lenguaje natural que permitan la extracción del conocimiento a partir de la literatura como por ejemplo immuneXpreso, entre otras.
Las técnicas de Inteligencia artificial han permitido robustecer el análisis de relaciones inmunológicas complejas, incrementando nuestro conocimiento y aplicación práctica de estos modelos en el contexto clínico, y probablemente en un futuro cercano permitirá evolucionar a la medicina personalizada en el tratamiento de pacientes con enfermedades autoinmunes y autoinflamatorias.

Referencias
Culos, A., Tsai, A. S., Stanley, N., Becker, M., Ghaemi, M. S., McIlwain, D. R., Fallahzadeh, R., Tanada, A., Nassar, H., Espinosa, C., Xenochristou, M., Ganio, E., Peterson, L., Han, X., Stelzer, I. A., Ando, K., Gaudilliere, D., Phongpreecha, T., Marić, I., … Aghaeepour, N. (2020). Integration of mechanistic immunological knowledge into a machine learning pipeline improves predictions. Nature Machine Intelligence, 2(10), 619–628. https://doi.org/10.1038/s42256-020-00232-8
Kveler, K., Starosvetsky, E., Ziv-Kenet, A., Kalugny, Y., Gorelik, Y., Shalev-Malul, G., Aizenbud-Reshef, N., Dubovik, T., Briller, M., Campbell, J., Rieckmann, J. C., Asbeh, N., Rimar, D., Meissner, F., Wiser, J., & Shen-Orr, S. S. (2018). Immune-centric network of cytokines and cells in disease context identified by computational mining of PubMed. Nature Biotechnology, 36(7), 651–659. https://doi.org/10.1038/nbt.4152
Romero-Álvarez, V., Acero-Molina, D. A., Beltrán-Ostos, A., Bello-Gualteros, J. M., & Romero-Sánchez, C. (2021). Frecuencia de ANA/DFS70 en familiares de pacientes con artritis reumatoide comparados con pacientes con artritis reumatoide y población sana y su asociación con el estado de salud. Reumatología Clínica, 17(2), 67–73. https://doi.org/10.1016/j.reuma.2019.02.003
Schultze, J. L., Büttner, M., & Becker, M. (2022). Swarm immunology: harnessing blockchain technology and artificial intelligence in human immunology. Nature Reviews Immunology, 22(7), 401–403. https://doi.org/10.1038/s41577-022-00740-1