PADI-web : l’épidémiosurveillance animale en ligne

Résultats & impact 20 février 2020
Les chercheurs du Cirad développent une plate-forme de veille en santé animale, PADI-web, qui puise des informations précieuses directement d’articles en ligne. Dans une publication de Computers and Electronics in Agriculture, l’équipe décrit le fonctionnement de la plate-forme, et expose des résultats prometteurs. PADI-web sera l’un des outils utilisés dans le projet européen de veille sanitaire, MOOD, qui démarre cette année.
Depuis le 31 janvier 2019, 2578 articles relatifs à la nouvelle épidémie de coronavirus ont été classés comme pertinents sur PADI-web. Deux langues sont surveillées, l'anglais et le chinois. En moyenne, la plateforme recense comme pertinents une quarantaine d'articles par jour, avec des pics à plus de 100 articles certains jours. © G. Trébuil, Cirad

Platform for Automated extraction of animal Disease Information from the web : PADI-web. C’est le nom donné à cette plateforme, accessible en ligne, qui décortique des centaines d’articles de Google News par jour. Peste porcine africaine, grippe aviaire, virus de Schmallenberg… mais également des maladies nouvelles comme la COVID-19. PADI-web surveille toutes les maladies en lien avec la santé animale. L’objectif : compléter les sources officielles de veille sanitaire par des informations non-officielles.

Compléter les sources officielles

« Les articles en ligne que PADI-web traite sont issus de Google News. L’outil traduit toutes les langues, vers l’anglais, donc ces articles émanent des quatre coins de la planète », explique Mathieu Roche, chercheur au Cirad en informatique spécialisé dans la fouille de données. « Toutes ces informations ne découlent pas forcément de données officielles et, parfois, certains articles ne parlent d’aucune maladie en particulier, mais expriment seulement des symptômes. Notre but est de prendre en compte toutes ces informations non-officielles qui pourraient passer à la trappe et de les organiser », explique Mathieu Roche.

A l’intérieur des articles, PADI-web repère des noms de maladies, des animaux hôtes, des symptômes, des dates, des lieux, ainsi que toute une liste de mots-clés, tels que « épidémie », « virus », « alerte » … « Avec ces recherches, on est parfois capable de détecter des foyers de maladies avant qu’ils ne soient déclarés officiellement. Et, d’autres fois, on détecte un début de maladie avant même qu’elle ne soit nommée, rien qu’à la description des symptômes », précise Sarah Valentin, doctorante au Cirad.

Actuellement, PADI-web est utilisé par la cellule de Veille Sanitaire internationale (VSI) de la plateforme française d’Epidémiosurveillance en Santé Animale (ESA). Alizé Mercier, co-coordinatrice de cette cellule et chercheuse au Cirad, explique : « L’objectif de la VSI est de détecter et de suivre toutes les menaces potentielles de risques sanitaires pour le territoire français. Pour cela, on utilise des sources officielles, comme la Commission européenne, la FAO, l’OIE, et des sources non-officielles, comme les médias. On utilise donc PADI-web pour la détection automatique des évènements sanitaires mentionnés dans des articles médias sur internet. C’est un outil très utile, qui permet un gain de temps considérable ».

Loin de vouloir remplacer les données officielles, les chercheurs précisent que PADI-web n’est pas infaillible. « L’outil n’est pas capable de savoir s’il fait face à des fake news, par exemple , dit Sarah Valentin. C’est pour cela que le travail des experts, pour vérifier ces informations, est primordial. Il s’agit de compléter les données officielles, surtout pas de les remplacer ».

Associer plusieurs outils de veille

D’autres outils de veille des médias en ligne existent déjà, tels que HealthMap ou ProMED, tous deux très performants. PADI-web s’en différencie par une thématique plus resserrée : la santé animale, soit les maladies qui se transmettent entre animaux, ou entre humains et animaux. « Cela nous permet d’être plus précis et d’aller voir dans le détail des articles, explique Sarah Valentin. L’idée serait d’associer tous ces outils, généraux et spécifiques, pour avoir une veille sanitaire hyper performante. C’est d’ailleurs l’objet du projet européen MOOD ».

Faire évoluer PADI-web

Pour l’instant, PADI-web ne traite que les articles provenant du moteur de recherche Google. Les chercheurs aimeraient l’ouvrir à d’autres moteurs de recherche, comme Baidu, le moteur de recherche chinois. « Mais cela constitue un vrai défi technologique », prévient la doctorante.

Selon Mathieu Roche, il y a matière à évoluer également dans les thèmes traités par PADI-web : « A long terme, l’objectif est de généraliser un maximum nos approches pour qu'elles puissent aussi être utilisées pour d’autres veilles, comme en santé végétale. Mais cela demandera du temps et nécessitera de consolider encore davantage nos collaborations avec INRAE et l’ANSES, déjà impliqués dans les travaux autour de PADI-Web ».

MOOD : un projet H2020 pour renforcer le dispositif de veille sanitaire en Europe

Dans le cadre du programme européen H2020, le projet MOOD coordonné par le Cirad pèse 14 millions d’euros et réunit 25 partenaires parmi 12 pays. Ce projet de 4 ans vise à améliorer la veille sanitaire européenne, avec un focus sur les maladies exotiques ou émergentes qui menacent le vieux continent. Le but est de développer des nouveaux outils, innovants et complémentaires par rapport à ceux déjà existant. Des travaux seront conduits en France, Serbie, Finlande, Italie, Espagne, puis les résultats seront disséminés dans tous les pays de l’UE. Le Cirad, par son expertise sur les maladies tropicales, mais aussi par sa veille en ligne des maladies animales avec PADI-web, est dans les starting blocks pour préparer la réunion de lancement, qui aura lieu à Stockholm en mars prochain.

Référence

Valentin Sarah, Arsevska Elena, Falala Sylvain, De Goër Jocelyn, Lancelot Renaud, Mercier Alizé, Rabatel Julien, Roche Mathieu. 2020. PADI-web: A multilingual event-based surveillance system for monitoring animal infectious diseases. Computers and Electronics in Agriculture , 169, 105163, 5 p.