Extraction d'informations et de connaissances
Leaders de la thématique
Philippe Langlais & Reihaneh Rabbany
Chercheuses et chercheurs impliqués
Yacine Benahmed, Jackie C.K. Cheung, Richard Khoury, Jian-Yun Nie, Siva Reddy, Amal Zouaq
Étudiantes et étudiants
À venir
Sous-thèmes
Extraction de connaissances à partir de textes
Extraction de connaissances à partir des médias sociaux
Détection de fausses nouvelles et fiabilité
Analyse du discours
Description
La langue est un moyen commun utilisé pour décrire la connaissance. Dans de nombreux cas, une grande partie des connaissances que nous pouvons trouver dans un texte sont d'intérêt général et peuvent être utilisées dans de nombreuses tâches de TALN. Par exemple, savoir que « Montréal est une ville du Québec » peut aider à répondre aux questions sur les villes du Québec. L'extraction de connaissances vise à détecter de nouvelles connaissances à partir de textes et à les formuler sous une forme utilisable dans différentes applications. Cela peut être fait soit dans un domaine spécifique, soit dans un domaine ouvert. Les connaissances extraites viendront compléter les graphes de connaissances existants tels que Freebase, Yago, ConceptNet ou UMLS en médecine. Nous prévoyons d'extraire des connaissances de diverses sources : des textes généraux (par exemple des pages Web), des documents spécialisés (par exemple en médecine) ou des contenus générés par les utilisateurs sur les réseaux sociaux.
Lors de l'extraction de connaissances, il est important de détecter la validité d'une information et d'une connaissance pour éviter de diffuser de fausses informations et connaissances dans les inférences. Par conséquent, une attention particulière sera accordée à la détection de la désinformation et à la mesure de la fiabilité des connaissances.