El desafiament científic es realitzarà en la plataforma Kaggle, que reuneix milers de persones expertes de tot el món en desafiaments basats en ciència de dades
Aquesta competició és una continuació del projecte de Fisabio, que va rebre finançament de la Conselleria d’Innovació en l’Anomenada al Sistema d’Innovació i Investigació
Científics de la Fundació per al Foment de la Investigació Sanitària i Biomèdica de la Comunitat Valenciana (Fisabio), en col·laboració amb la Society for Imaging Informatics in Medicine (SIIM), ha convocat un desafiament científic a nivell internacional per a la detecció de COVID-19 en radiografies de tòraxs utilitzant Intel·ligència Artificial (*IA).
El desafiament científic es realitzarà en Kaggle, una plataforma que es troba en l’avantguarda de l’aprenentatge automàtic o ‘Machine Learning‘ i que reuneix a centenars de milers de persones expertes en desafiaments de tota índole, a nivell mundial, basats en ciència de dades.
Aquesta competició s’emmarca en el projecte «Construcció d’un dataset en obert, per a la detecció precoç de pneumònia per COVID-19 a partir d’una radiografia simple de tòrax», liderat per María de l’Església-Vayá en col·laboració amb José María Salinas.
Aquest projecte, més conegut com a BIMCV–COVID-19, va estar inspirat en el projecte PADCHEST de la doctora Aurelia Busts i va ser seleccionat i finançat per la Conselleria d’Innovació, Universitats, Ciència i Societat Digital en l’Anomenada al Sistema Valencià d’Innovació i Investigació, i en col·laboració amb la Conselleria de Sanitat Universal i Salut Pública, que va autoritzar el projecte des dels seus inicis.
El treball ha sigut valorat positivament per molts laboratoris a nivell mundial i la Society for Imaging Informatics in Medicine es va posar en contacte amb l’equip del Banc d’Imatges Mèdiques de la CV per a realitzar aquest Challenge de Kaggle en la detecció de COVID-19 a través de la Radiologia convencional de tòrax. Aquest desafiament es convocarà en breu a nivell mundial perquè participen científics de tots els països i que aporten tot el seu talent en aquesta causa.
IA contra la COVID-19
Els científics han recopilat dades de radiografies toràciques procedents de la Comunitat Valenciana per a generar models predictius utilitzant la IA. Aquests models són supervisats per radiòlegs especialistes, amb la finalitat de detectar de manera primerenca la pneumònia per COVID-19 en pacients amb símptomes lleus.
Igualment, permet ajudar a l’estratificació del risc de pacients amb símptomes moderats, i ajudarà a identificar a pacients amb major risc d’evolució a una condició greu o crítica. Les dades són totalment anònimes, de manera que no es puga identificar a qui pertanyen les radiografies, sinó que la informació recaptada fa referència únicament a aspectes clínics.
L’objectiu és generar un conjunt de dades en obert (dataset OPEN) reconegut a nivell mundial com un dels datasets més complets i organitzats, que permeta als científics de dades treballar en desenvolupaments d’algorismes d’Intel·ligència Artificial per a elaborar models predictius i desenvolupar eines orientades al diagnòstic simple, ràpid i efectiu de la COVID-19 que, en últim terme, ajudara a agilitar la càrrega de treball dels professionals sanitaris.
Actualment s’han compartit més de 12,456 sessions de radiografies de tòraxs pertanyents a uns 4,706 subjectes amb patologia COVID, així com més de 6,012 sessions de radiografies pertanyents a uns 4,437 pacients sans o amb diferents patologies provinents dels sistemes d’informació sanitaris de la Conselleria de Sanitat Universal i Salut Pública, que seran la base amb la qual s’iniciarà aquest desafiament científic.
Fins ara la resposta ha sigut molt positiva, amb descàrregues des de tots els continents i amb un ampli reconeixement a nivell mundial. Per a això, ha sigut fonamental la col·laboració del Centre d’Investigació Príncep Felip (CIPF) i del Barcelona Supercomputer Center (BSC-*CNS) que ha proporcionat una instància de B2DROP per a la distribució d’aquest treball. B2DROP és part dels serveis d’infraestructura de dades col·laboratives d’EUDAT (www.eudat.eu)
En aquest moment, l’equip de radiòlegs de l’Hospital Sant Joan d’Alacant liderat pel seu cap de servei el doctor Joaquín Galán, juntament amb la doctora Aurelia Busts es troben realitzant un etiquetatge previ necessari per a preparar les dades de manera que els científics puguen realitzar bons models predictius.
En la construcció del dataset BIMCV–COVID-19, s’han tingut en compte els quatre principis fonamentals FAIR per al maneig de dades científiques: capacitat de cerca, accessibilitat, interoperabilitat i reutilització.
És important destacar que la intenció de l’equip investigador és que els principis s’apliquen no sols a les dades en el sentit convencional, sinó també als algorismes, eines i fluxos de treball. L’aplicació d’aquests principis a totes les fases del procés d’investigació garanteix la transparència, la reproductibilitat i la reutilització.
Finalment, cal destacar que en breu s’incorporarà aquest dataset com un nou cas d’ús per a l’avaluació de les llibreries europees (EDDL & ECVL) que s’estan desenvolupant dins del marc del projecte Europeu DeepHealth.
L’equip investigador està compost per Marisa Caparrós; els data curators Joaquim Ángel Montell, José Manuel Saborit i Elena Oliver; a més d’investigadors de la Universitat d’Alacant, la Universitat Miguel Hernández, Medbravo, Sierra Research i la col·laboració de General Electric. També ha col·laborat en la definició inicial del projecte el servei tècnic de la Delegació de Protecció de Dades de la Generalitat.