Big Data. Gracias Empezaré con una anécdota
No sé si saben que hoy es el día mundial de la lucha contra el SIDA Les voy a contar una anécdota sobre el sida, que tuvo lugar cuando hace 10 años se reunió un equipo europeo en un proyecto con fondos europeos para encontrar la forma de recomendar el mejor tratamiento para un paciente de sida.
El reto era que hay diferentes cócteles y combinaciones de medicamentos y cuando el médico tiene que emparejar el cóctel de medicamentos con la persona, se basa en mutaciones del virus, pero en la facultad no les enseñan estas mutaciones, y el virus sigue mutando constantemente, y entender cómo emparejarlo, es un reto Eso fue hace 10 años, en 2005 y 2006 El sistema entonces era muy caro.
Si hablamos de mejores cuidados y coste sostenible, en aquel entonces los pacientes con sida que tenían medios enviaban al laboratorio el virus y el virus se testaba con todas y cada una de los medicamentos
Big Data
De acuerdo con el resultado, se hacía una recomendación personalizada de cuál sería el cóctel óptimo para esa persona en concreto Pero esto no tiene escala Si tienes sida y quieres identificar la mutación, la prueba es muy barata, relativamente hablando, en EEUU y otros países; pero cultivarlo en el laboratorio es muy caro.
Big Data. Así que las personas recababan los datos de laboratorio para ver cuál sería la recomendación, y VIH es el sistema estándar de recomendación basado en el laboratorio Lo que sugerimos en aquel entonces y acumulamos en centros como el de Estocolmo, fue aprender de los datos de los pacientes y toda la información que tenemos en sistemas en Europa, para saber cuál sería el mejor cóctel
En 2008, dos años y medio después, había tecnología, Big Data, basada en el aprendizaje automático que había «aprendido» todos los datos de pacientes, que en aquel entonces eran miles, ahora tenemos datos de 66000 pacientes en nuestras bases de datos de distintos lugares de Europa: Italia, Suecia, Alemania, Bélgica, Luxemburgo, etc y es el historial habitual de los pacientes: se recoge, se analiza el genoma y el cóctel de medicamentos, se crea un sistema de recomendación gratuito en internet para que los pacientes lo consulten.
No sólo está disponible y los médicos pueden usarlo, y lo usan a día de hoy, sino que también lo testamos con los médicos Contratamos a 10 expertos y les preguntamos: dado este paciente concreto, que el sistema nunca ha visto antes, sabemos qué tratamiento recibió y qué seguimiento tuvo, si fue un éxito o un fracaso; entonces usted, experto, ¿nos puede decir si el tratamiento dado a este paciente es un éxito o fracaso?.
Y le preguntamos a la máquina que habíamos creado Big Data: ¿será un éxito o fracaso? Y con esas normas de base, sabemos la respuesta
¡Sorpresa! La mayoría de las veces, el sistema era más preciso que los expertos Eso no quiere decir que el sistema vaya a sustituir a los médicos porque hay muchos factores a tener en cuenta, la adherencia al tratamiento siendo uno de ellos Si sabes que un paciente no va a tomarse un medicamento en concreto con un efecto secundario dado, entonces hay que buscar una alternativa.
Aun así, hay mucho que aprender de recabar los datos, analizarlos, gestionarlos y tener un sistema expuesto a 66000 pacientes y no a los pocos miles, centenas o docenas que suele ver un médico
Creo que todos tenemos ejemplos en los que el aprendizaje automático ha podido analizar grandes cantidades de datos y obtener una conclusión que haya sido útil para los expertos en algún aspecto o mejor que ellos.
Esa es la gracia de crear máquinas cognitivas que puedan analizar datos de muchos tipos para obtener algo útil para los expertos Si hablamos de la enfermedad, no sé cuántos conocéis (u os gusta) el libro: El emperador de todos los males, de Siddhartha Mukherjee Dice que con la enfermedad solemos hablar de «lucha», y creo que en la charla de Bil dabais una explicación militar de por qué el consejero delegado debe controlar determinadas situaciones Muchas veces pensamos en «la lucha contra la enfermedad» y queremos utilizar todas nuestras armas
Mucho tiene que ver con la interacción entre personas, y también, en nuestro arsenal, hay herramientas que podemos y debemos usar.
En el ámbito cognitivo, el reto es la multimodalidad La capacidad de aprender de datos estructurados y genómicos o aprender de datos contextuales y analizar y descifrar lo que dice la gente Es un componente fundamental de lo que desarrollamos en Watson, la habilidad de entender el texto libre.
Hace poco le hemos puesto ojos a Watson, y ahora, en RSNA, la mayor conferencia de radiólogos, estamos equipando con la capacidad de aprender del texto, de lo que los médicos ven en una radiografía y escriben sobre el paciente, la capacidad de ver imágenes sacadas de resonancias, TAC, etc, junto con el texto
Obviamente se puede complementar con sensores La multimodalidad es parte de lo que necesitamos y debemos hacer con lo cognitivo La capacidad de seguir aprendiendo, que es lo que estamos haciendo Las máquinas no se cansan y siempre se puede actualizar con más datos, diseñar una infraestructura que permite ofrecer una buena solución es un reto que hoy no está resuelto Y requiere más desarrollos
Y lo último y más importante es la causalidad Porque aprender de los datos no es sencillo Muchas veces se aprenden sesgos y diferencias que no quieres tener en cuenta, y la forma en que progresaba el campo médico son los ensayos clínicos bien definidos, aleatorizados y testeados Con el aprendizaje retrospectivo, tomamos el conocimiento que sale de ahí pero no sigue este diseño tradicional, así que ¿cómo desarrollamos la causalidad? Es uno de los tres retos ante nosotros