Prédire la pandémie de COVID-19 avec Twitter


Avec la pandémie de Covid-19 qui secoue le monde depuis plus d’un an, elle a été qualifiée de plus grand défi de l’humanité depuis la seconde guerre mondiale. Désormais, les scientifiques cherchent de nouvelles façons de recueillir des données significatives pour suivre et prédire les futures pandémies et offrir des informations précieuses dans tous les secteurs.

Une étude récente, publiée dans Evolutionary Intelligence en mars 2021, examine comment les médias sociaux peuvent être utilisé par les scientifiques pour créer des analyses significatives, suivre et prédire les futures pandémies.

Dans le but de tirer parti de grands ensembles de données pour obtenir des informations et des analyses significatives, les chercheurs ont utilisé le grand volume de données sur Twitter pour créer une visualisation et une analyse des sentiments exprimés comme moyen de surveiller et de suivre la pandémie de COVID-19. Pour cela, ils ont utilisé une architecture CNN profonde – une entrée multicanal pour l’analyse des données informatiques.

Cette recherche démontre que ce type d’architecture logicielle a des applications possibles dans le monde réel non seulement dans la prévision et la gestion des épidémies, mais dans d’autres secteurs tels que la déconstruction de fausses vidéos profondes sur Internet.

Objectifs de la recherche

Cette recherche est la première du genre avec la sophistication des logiciels et une approche à grande échelle pour analyser 600 000 tweets, puis catégoriser des sentiments tels que la peur, le bonheur, l’espoir, la dépression, la colère, l’anxiété, etc.

L’objectif des chercheurs était de démontrer comment cela peut être utilisé à différentes étapes de l’analyse d’une pandémie. La recherche fournit quatre contributions uniques :

  • Démontrer l’utilisation de Twitter pour l’analyse de données, spécifiquement liées à Covid-19.
  • Présentez une échelle de gradient de résultats, en comparant les données des principaux pays touchés.
  • Logiciel éprouvé capable d’analyser avec succès les sentiments exprimés dans les tweets ou les médias sociaux.
  • Créez un modèle qui permet une analyse prédictive des futurs rapports de cas de Covid-19.

Les chercheurs notent que bien que d’autres grandes données contextuelles entourant Covid-19 aient été recueillies à la fois par Google et le John Hopkins University Center for Systems Science and Engineering, leurs 600 000 tweets avec des paramètres indexés fournissent des informations uniques qui peuvent être utilisées pour approfondir la recherche et sont en cours. ouvertement disponible.

Twitter pour la recherche

Twitter est considéré comme le meilleur endroit où des millions de personnes peuvent exprimer leurs opinions ou mener des études de marché, mais pour les scientifiques, c’est une mine de données. Avec 330 millions d’utilisateurs dans le monde, Twitter est devenu un premier choix pour la collecte de données. Il génère des groupes d’opinions en fonction de la région, du sujet et des événements, ce qui le rend particulièrement utile pour l’analyse des données.

D’autres applications réelles de l’analyse des sentiments sur Twitter incluent les études de marché, l’analyse des tendances, la prédiction des rumeurs, le filtrage du spam, etc. avec des applications possibles du gouvernement aux entreprises et aux soins de santé.

Analyse des sentiments

L’analyse des sentiments examine les sentiments exprimés dans les données, dans ce cas via Twitter, pour prédire les événements clés et les tendances en cours. Ils ont utilisé ce qu’on appelle l’infusion de connaissances de bon sens dans le modèle LSTM pour suivre plus précisément la gamme exacte des émotions exprimées et pour comprendre le sentiment d’une personne lorsque plusieurs émotions sont exprimées dans un tweet.

Les chercheurs ont ensuite dû affiner et entraîner le modèle pour comprendre et catégoriser avec précision les sentiments. La méthodologie de recherche impliquait la collecte de données, l’évaluation de la polarité, la mise à l’échelle du gradient des cas, l’analyse comparative et prédictive, les expériences avec des ensembles de données, l’extraction de caractéristiques, l’étiquetage des sentiments et les tendances avec des paramètres de gradient.

Résultats et candidature

Les chercheurs ont découvert que leur méthodologie a donné une précision de 90,67 %, ce qui a dépassé les précédents travaux de pointe. Le succès de cette modélisation démontre comment les tweets peuvent être collectés à grande échelle pour analyser et modéliser les données avec un haut niveau de précision.

Alors que les données médicales continuent d’évoluer pendant la pandémie, cette recherche peut être appliquée non seulement à la pandémie de Covid-19, mais à toute maladie infectieuse. Les scientifiques peuvent créer une modélisation de prédiction plus à jour et plus précise à partir de sources audio, vidéo et textuelles. Les chercheurs espèrent continuer à affiner le modèle pour une précision accrue de la représentation des données.

Candidature future

Nous sommes à la frontière de l’analyse de données multidimensionnelle à grande échelle via Twitter ou les médias sociaux. Les applications à long terme peuvent s’étendre au-delà des soins de santé et des maladies infectieuses pour englober les études commerciales et de marché, les sciences sociales, les applications gouvernementales et politiques, les problèmes géopolitiques, etc.

Les chercheurs eux-mêmes notent la puissante application dans la déconstruction et l’identification des vidéos deepfake, qui sont généralement presque impossibles à détecter avec l’œil humain. Ces vidéos, qui donnent l’impression qu’une célébrité ou un leader politique dit quelque chose qu’ils n’ont pas dit, deviennent l’un des grands dangers modernes des guerres de l’information. Ce n’est qu’un des nombreux problèmes qui peuvent être atténués grâce à l’analyse approfondie fournie par cette modélisation.

La contribution de ce travail est une méthodologie fiable et systématique d’analyse de données en temps réel et un logiciel prédictif qui utilise les informations générées en permanence sur Twitter. La visualisation des tendances peut fournir une image plus réaliste des maladies infectieuses et des épidémies, ainsi que les implications et la compréhension de ces tendances dans la société.



Vous pouvez lire l’article original (en Anglais) sur le blogwww.socialmedia.biz