Diagnóstico de estados psicóticos y teorías del sueño usando análisis automático del habla

Compartir en:

Bruno Bianchi. Universidad de Buenos Aires.

La complejidad del lenguaje nos permite lograr expresar nuestros pensamientos y sentimientos de forma muy precisa. Sin embargo, esa misma complejidad podría dificultar su comprensión. Aquellos que hablamos una segunda lengua de forma no nativa (o sea, que aprendimos de grandes y no convivimos con esa lengua) lo sabemos muy bien. En cada conversación, en cada texto, se nos pasa por alto información que el emisor nos quiso dar. Inflexiones de voz, uso de determinadas palabras (y no de otras) para remarcar alguna característica particular (por ejemplo, no sería lo mismo decir “me caí” que “me desplomé”). En el Laboratorio de Inteligencia Artificial Aplicada (LIAA) de la Facultad de Ciencias Exactas y Naturales de la UBA se trabaja con algoritmos que intentan, desde diferentes ángulos, manejar esta complejidad para comprender de forma profunda el contenido de un texto o un diálogo, ya sea a la hora de analizar la prevalencia de enfermedades psiquiátricas o analizar el contenido de los sueños de las personas, entre otras aplicaciones. En este artículo voy a hacer un rápido repaso de dos investigaciones llevadas a cabo en este laboratorio con algoritmos de Procesamiento del Lenguaje Natural (NLP, por sus siglas en inglés).

Diagnosis temprana de enfermedades psiquiátricas

Los estados psicóticos generan cambios en el lenguaje del paciente. En los estados psicóticos por esquizofrenia, en particular, aparece una disminución en la coherencia del discurso. Los psiquiatras usan esta característica como método de diagnóstico. Entrevistan a un paciente, le hacen preguntas, escuchan sus respuestas y deciden de alguna manera si las oraciones que arma tienen coherencia. Claro que no es la única variable que importa, pero es una más a la hora de diagnosticar. El principal problema es que medir esa coherencia no es sencillo para un psiquiatra. Mucho menos hacerlo de forma objetiva. Y muchísimo menos si esa falta de coherencia aparece gradualmente de modo de detectarla con antelación.

Cada punto del gráfico representa a un paciente según la medición de tres propiedades de su habla. Los puntos rojos corresponden a pacientes que más tarde fueron diagnosticados con psicosis. Puede observarse que la mayoría se encuentran en una región separada del gráfico de los pacientes sin diagnóstico. Reproducido de NPJ Schizophrenia bajo licencia CC by 4.0.

Los investigadores del LIAA (en conjunto con otros investigadores distribuidos por el mundo) implementaron un algoritmo que toma las entrevistas de pacientes con antecedentes familiares de esquizofrenia (grupo de riesgo) y realiza una medición de la coherencia entre las oraciones. Este estudio cobró gran relevancia, ya que tuvo un gran éxito en detectar tempranamente a aquellos pacientes que finalmente fueron diagnosticados con esquizofrenia por los psiquiatras.

El funcionamiento del algoritmo se basa en la técnica de Análisis Semántico Latente (LSA, por sus siglas en inglés), desarrollada inicialmente en los años 80. Esta se basa en asignar a cada palabra de un corpus de textos (por ejemplo, todos los artículos de wikipedia) a una posición en el espacio, de tal forma que aquellas que suelen aparecer en los mismos textos (y por lo tanto, semánticamente relacionadas) quedarán en posiciones cercanas en nuestro espacio de palabras. A partir de la generación de este espacio, la medición de la coherencia entre oraciones pasa a ser un simple cálculo geométrico de distancia entre las palabras de cada oración.

Artículo original: Bedi, G., Carrillo, F., Cecchi, G. A., Slezak, D. F., Sigman, M., Mota, N. B., ... & Corcoran, C. M. Automated analysis of free speech predicts psychosis onset in high-risk youths. NPJ Schizophrenia 1, 15030 (2015).

Análisis del contenido de los sueños

El contenido de los sueños y su significado siempre fue una incógnita para la humanidad. Actualmente, una de las teorías que se propone para entender su rol evolutivo es la denominada “Teoría de Simulación de Peligro” (TST, por sus siglas en inglés), la cual propone que durante los sueños nuestro cerebro simula posibles situaciones de riesgo, a partir de las vivencias diarias. De esta forma, además de simular el riesgo, es capaz de simular posibles respuestas, las cuales podrían servir en caso de que esos riesgos fueran reales.

Con el fin de validar las predicciones de esta teoría, investigadores del LIAA, nuevamente en colaboración con investigadores externos, se propusieron analizar computacionalmente los sueños de personas con algoritmos de NLP. Mientras que el análisis de los sueños se realiza comúnmente mediante el conteo de palabras asociadas a ciertos contextos (por ejemplo, en caso de querer analizar sueños relacionados a persecuciones se cuenta la aparición de verbos de la familia de “correr”), estos investigadores se propusieron analizar el contenido de los mismos de forma global, evitando así que la polisemia de los verbos pudiera interferir con la medición (verbos de la familia de “correr” se asocian con actividades deportivas, no solamente con persecuciones).

Esta forma de análisis, complementaria al clásico conteo de palabras asociadas al contexto de estudio, permitiría una mejor comprensión de los sueños, abriendo una puerta hacia la comprensión de este proceso. Así, mediante el uso del ya mencionado LSA y de un algoritmo más complejo (pero no necesariamente más certero) denominado "word2vec", estos investigadores lograron encontrar que en los relatos de sueños la palabra “correr” se asocia más a situaciones de riesgo que en relatos de la vida cotidiana, tal como lo propone la TST. Estas dos investigaciones son sólo dos ejemplos (de muchos) de cómo los algoritmos de Machine Learning e Inteligencia Artificial nos pueden ayudar a comprender procesos cognitivos, analizando grandes cantidades de texto de una forma compleja y holística.

Artículo original: Altszyler, E., Ribeiro, S., Sigman, M., & Slezak, D. F. The interpretation of dream meaning: Resolving ambiguity using Latent Semantic Analysis in a small corpus of text. Consciousness and Cognition 56, 178 (2017).