Extraction de connaissances à partir du texte
Loading...
Date
2017-06-08
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Résumé (Français et/ou Anglais) :
Résumé:
Dans cette thèse on aborde le sujet d’extraction des connaissances à partir du texte arabe. Cette tache a été réalisée à travers la détection et l’extraction des relations sémantiques entre les entités nommées. La problématique de repérage et d’extraction des entités nommées ainsi que les relations sémantiques les reliant a été résolue en utilisant une approche à base de règles, où les règles de l’expert sont traduites sous formes de transducteurs à états finis.
Le manque terrible des ressources linguistiques et d’outils nécessaires au TAL arabe nous a conduit à construire nos propres ressources et à l’adaptation des outils de la plateforme Unitex/GramLab afin d’accomplir les taches citées ci-dessus. Les ressources sont aussi construites et puis compressées et stockées en utilisant les transducteurs à états finis.
Mots clés:
Extraction de connaissances, Entités nommées, relations sémantiques, les transducteurs à états finis.
Abstract
In this thesis we address the issue of knowledge discovery within Arabic text. This task was achieved by detecting and recognizing the semantic relations between named entities. The issue of repering and extracting the named entities as well as the semantic relations binding them is solved by using a rule-based approach where we convert the expert rules to finite state transducers.
The lack of linguistic resources and tools needed for Arabic NLP has pushed us to build our own resources and to adapt the Unitex/GramLab tools to achieve tasks mentioned above. The resources are also built, then compressed and stored using the finite state transducers.
Keywords:
Knowledge discovery, Named entities, Semantic relations, Finite state transducers.
Description
Doctorat en Sciences