y analicen dentro de un marco
ético y seguro
Cabe destacar una de las más recientes aportaciones que está realizando la IA en el campo de la salud. Bluedot –un sistema canadiense basado en técnicas de machine lear-
ning y procesamiento del lenguaje natural, creado para
monitorizar la aparición y diseminación de enfermedades infecciosas– alertó de la aparición de una neumonía atípica
Savana
Savana es una compañía médica internacional que tiene como visión acelerar la investigación médica mediante el uso de la IA, con el objetivo de contribuir a la salud del paciente y la eficiencia de los sistemas de salud. Fue fundada en 2014, y desde entonces cuenta con más de 80 empleados (doctores en IA, especialistas en procesamiento del lenguaje natural, médicos, farmacéuticos, especialistas en ensayos clínicos, ingenieros, programadores, etc.), que trabajan diariamente para poner a disposición de los clínicos el mejor servicio y las mejores soluciones de IA.
Savana ha creado un ecosistema de investigación nacional e internacional que pone en contacto a investigadores de diversas partes del mundo para llevar a cabo, hasta el momento, estu dios en fase IV, observacionales multicéntricos, retrospectivos y no intervencionistas. Actualmente, Savana ha conseguido posicionarse como compañía médica pionera en llevar a cabo estudios basados en evidencia real mediante la reutilización de la historia clínica electrónica. La tecnología que permite llevar a cabo estos estudios es la metodología EHRead®. Esta
metodología, actualmente bajo proceso de patente, se basa en procesamiento del lenguaje natural y permite extraer de una manera probabilística las variables clínicas descritas en el texto libre de las historias clínicas electrónicas de los pacientes, para posteriormente construir una base de datos sintética de los pacientes del hospital o sistema de salud.
Según fuentes de la Johns Hopkins School of Public Health, la mayor parte de la información clínica relevante de la historia clínica electrónica se encuentra en formato de texto libre18. Sin embargo,
los sistemas automáticos de extracción de información clínica, las herramientas de reclutamiento de pacientes para ensayos clínicos o los programas usados hasta el momento para gestión sanitaria, entre otros, utilizan exclusivamente el dato estructurado de la historia para reflejar la práctica en vida real.
Por tanto, esta manera de gestionar la información puede generar una evidencia sesgada que conduce a la incorrecta atención clínica de los pacientes o gestión de recursos. Savana centra su actividad en el texto libre de las historias clínicas electrónicas, y es una empresa líder e innovadora en aplicar procesamiento del lenguaje natural sobre documentos clínicos. Esta nueva forma de hacer ciencia en el sector de la medi cina, basada en el Big Data, ha propiciado la aparición de nuevos debates y desafíos en relación con la protección de la identidad y la privacidad del paciente. La EMA defiende la idea de cómo resulta fundamental encontrar el equilibrio entre la innovación y la protección de datos para brindar beneficios clínicos para el bien público19. En este sentido,
la EMA propone la anonimización como mecanismo para gestionar la tensión entre la salvaguarda de la privacidad personal y la maximización de la utilidad de los datos. La EMA plantea anonimizar los datos personales clínicamente irrelevantes, pero mantener la información suficiente para realizar investigaciones científicas. Por ello, al describir la anonimización es importante evitar términos tan en boga como «verdaderamente anonimizado», ya que la anonimi zación absoluta en este escenario no es posible asegurarla; en todo caso, el desafío supone comprender «un nivel de riesgo aceptable»9.
Por tanto, solo si interiorizamos este cambio de enfoque se alcanzará la medicina de precisión basada en evidencia real, en la que los diagnósticos y tratamientos de los pacientes no dependan solamente de su genoma, sino también de su epigenoma, proteoma, microbioma y meta boloma, así como de su comportamiento (es decir, factores relacionado con la actividad física, nutrición, salud mental, etc.), con el fin de identificar el tratamiento adecuado, en el punto óptimo de la enfermedad en cada paciente individual.
REVISTA Atodo
En esta línea, Savana ha desarrollado una política novedosa de privacidad llamada «Privacidad Natural». Se trata de un método tecnológico nuevo, mediante el cual se genera una base de datos sintética a partir de datos no estructurados. Esta base de datos, que es exportable y explotable, preserva la privacidad individual de una manera más eficiente a las técnicas actuales utilizadas en el mercado. Esto significa que dicha base de datos conserva las propiedades y características generales de los datos originales, al mismo tiempo que protege la privacidad minimizando los riesgos de identificación. Dicho de otra manera, maneja datos técnicamente irreales pero representativos. La metodología para crear la base de datos sintética parte de errores inherentes al procesamiento del lenguaje natural. Estos errores controlados estadísticamente sustituyen la tradi cionalmente utilizada «privacidad diferencial». Como principal ventaja, se elimina la introducción de ruido a la base de datos de los estudios, lo cual podría ser sujeto a ingeniería inversa aumentando así el riesgo de la identificación de los pacientes. Adicionalmente, la privacidad natural agrega una capa de privacidad superior, mediante el equilibrio matemático de los errores, conservando los resultados originales a nivel agregado. Esta «privacidad natural», junto con la tecnología de Savana y los centros sanitarios colaboradores, ha permitido procesar más de 380 millones de documentos clínicos y llevar a cabo actualmente más de 30 estudios RWE en diferentes áreas terapéuticas. Una de las primeras reflexiones que nos podemos plantear a la hora de utilizar este tipo de tecnologías es cómo evaluamos que la extracción automática de variables del texto libre que realiza Savana se esté llevando a cabo correctamente. El procesamiento por parte de EHRead® clasifica las variables
sin hacer inferencia clínica, al contrario que otros sistemas de clasificación (p. ej., CIE). Por tanto, a la hora de evaluar el rendimiento de Savana, debemos utilizar técnicas estadís ticas propias de la evaluación del procesamiento de lenguaje natural: Recall, Precision y F-Score 20 (ver el significado de
cada parámetro en la figura 1). De hecho, esta evaluación, llamada «anotación en el entorno de IA», es muy relevante cuando el sistema se aplica por primera vez en un área médica específica.
Savana Manager es la herramienta desarrollada por Savana que permite a los profesionales sanitarios consultar los datos estructurados obtenidos gracias a EHRead® tras el procesado y
extracción de las variables clínicas de las historias clínicas elec trónicas de su centro. Gracias a esta herramienta, se pueden realizar consultas por patología, pruebas, resultados bioquí micos, fechas, ámbito de actuación, sexo, edad, etc. Y obtener información poblacional de forma muy sencilla sobre caracte rísticas clínicas de los pacientes, como diagnósticos, signos y síntomas, tratamientos, pruebas... Gracias a esta herramienta, se pueden evaluar los principales indicadores de un determi nado proceso clínico evitando los sesgos de selección más allá de la propia existencia de un registro. Algunos de los ejemplos de uso que se pueden llevar a cabo con Savana Manager son:
• Estudios epidemiológicos: encontrar y describir la población tratada.
• Detección y cuantificación de la variabilidad en la práctica clínica.
• Acelerar la viabilidad de los ensayos clínicos encontrando pacientes que cumplen criterios de inclusión cada vez más complejos gracias a la minería de texto libre.
• Comparación de las prácticas clínicas entre los diferentes puntos de atención.
De hecho, el uso de IA en salud no es el futuro, sino el presente. Ya se están empezando a publicar las primeras investigaciones realizadas utilizando la tecnología EHRead® de Savana.
Uno de los estudios observacionales publicados sobre COVID19 que ha incluido un mayor número de pacientes a nivel mundial ha sido el BigCOVIData21. Este estudio,
recientemente publicado por Izquierdo et al., en colabo ración con el Equipo de Investigación de Savana, ha incluido a 10.504 pacientes con diagnóstico confirmado de COVID19 de todo el Sistema de Salud de CastillaLa Mancha, un 52,5% varones, con una media de edad de 58,2 ± 19,7 años. Las principales conclusiones de este estudio fueron que, al ingreso, tanto en atención especializada como primaria, los síntomas más comunes fueron la tos, la fiebre y la disnea, pero los tres síntomas simultáneamente solo se presentaron en menos de la mitad de los casos. Además, el 6% de los pacientes hospitalizados tuvieron que ser ingresados en la unidad de cuidados intensivos (UCI).
Asimismo, el estudio BigCOVIData ha utilizado un algoritmo basado en datos y en machine-learning que ha permitido detectar que la combinación de edad, fiebre y taquipnea fue el mayor predictor de las admisiones en UCI. De hecho, se ha identificado que los pacientes menores de 56 años sin taquipnea y una temperatura <39 ºC (o >39 ºC sin crepita ciones respiratorias) no eran susceptibles de ingreso en UCI. Por el contrario, era probable el ingreso en UCI de los pacientes de 4079 años de edad si tenían taquipnea y retra saban su visita a urgencias después de haber sido atendidos en atención primaria21.