Extraction d'informations et de connaissances

Leaders de la thématique

Philippe Langlais & Reihaneh Rabbany

Chercheuses et chercheurs impliqués

Yacine Benahmed, Jackie C.K. Cheung, Richard Khoury, Jian-Yun Nie, Siva Reddy, Amal Zouaq

Étudiantes et étudiants

À venir

Sous-thèmes

  • Extraction de connaissances à partir de textes

  • Extraction de connaissances à partir des médias sociaux

  • Détection de fausses nouvelles et fiabilité

  • Analyse du discours


Description


La langue est un moyen commun utilisé pour décrire la connaissance. Dans de nombreux cas, une grande partie des connaissances que nous pouvons trouver dans un texte sont d'intérêt général et peuvent être utilisées dans de nombreuses tâches de TALN. Par exemple, savoir que « Montréal est une ville du Québec » peut aider à répondre aux questions sur les villes du Québec. L'extraction de connaissances vise à détecter de nouvelles connaissances à partir de textes et à les formuler sous une forme utilisable dans différentes applications. Cela peut être fait soit dans un domaine spécifique, soit dans un domaine ouvert. Les connaissances extraites viendront compléter les graphes de connaissances existants tels que Freebase, Yago, ConceptNet ou UMLS en médecine. Nous prévoyons d'extraire des connaissances de diverses sources : des textes généraux (par exemple des pages Web), des documents spécialisés (par exemple en médecine) ou des contenus générés par les utilisateurs sur les réseaux sociaux.


Lors de l'extraction de connaissances, il est important de détecter la validité d'une information et d'une connaissance pour éviter de diffuser de fausses informations et connaissances dans les inférences. Par conséquent, une attention particulière sera accordée à la détection de la désinformation et à la mesure de la fiabilité des connaissances.