You are here

Utilisation d’une méthode fondée sur les n-grammes pour la mise au point d’outils d’extraction ciblée à l’appui de la conservation et de la gestion énergétiques

Project Type: 
initié par le stagiare

Cette recherche vise à étudier et à mettre au point de nouveaux outils de recherche et d’extraction ciblées relevant du domaine de l’informatique décisionnelle pour appuyer les analyses et les processus décisionnels liés à la conservation et à la gestion énergétiques.

Project Leader(s): 

Boursière : Jane E. Mason, École d’informatique David R. Cheriton, Université de Waterloo

Mentor du corps enseignant : Frank Tompa, École d’informatique David R. Cheriton, Université de Waterloo

L’informatique décisionnelle regroupe les techniques informatiques qui aident les organismes à utiliser les données dont ils disposent pour prendre des décisions éclairées et diriger leurs activités avec efficacité. Notre but est d’étudier et de mettre au point de nouveaux outils de recherche et d’extraction ciblées relevant de ce domaine pour appuyer les analyses et les processus décisionnels liés à la conservation et à la gestion énergétiques. Ces outils présenteront également une applicabilité étendue dans le champ de l’analytique d’entreprise.

L’extraction ciblée, dont l’extraction de passages, le système de questions-réponses et l’extraction d’éléments XML sont des exemples, offre un accès plus direct aux informations pertinentes en localisant et en extrayant des documents les passages appropriés pour fournir à l’utilisateur des résultats qui correspondent précisément à sa requête. Nous proposons de représenter les documents par des n grammes de longueur fixe composés d’octets (caractères) contigus. La représentation par n grammes est utilisée avec succès dans de nombreuses applications d’extraction d’informations et de traitement du langage naturel. À notre connaissance, son application à l’extraction ciblée n’a toutefois jamais fait l’objet d’études approfondies.