Le Web Sémantique et l'Ontologie GOODRELATIONS en Commerce connecté
- Nouveau
Ce travail s'intègre dans le cadre des systèmes de dialogue oral Homme-machine et s'intéresse au problème de la compréhension littérale de la parole en dialecte tunisien dans un domaine restreint.
Dans cet ouvrage, nous proposons une méthode hybride pour la compréhension littérale qui consiste à combiner les modèles CRF et l'ontologie de domaine.
Les modèles CRF tiennent compte des dépendances locales entre les mots d'un même énoncé, et l'ontologie permet d'intégrer les connaissances a priori du domaine.
Afin d'évaluer la méthode proposée, le corpus TuDiCoI du dialogue oral en dialecte tunisien a été élaboré.
Ce corpus constitue un apport intéressant pour les travaux qui opèrent particulièrement sur le traitement automatique du dialecte tunisien.
Ainsi, un guide constitué d'un ensemble de règles orthographiques est proposé afin d'harmoniser les transcriptions.
Ce corpus a été exploité pour la construction de l'ontologie de domaine en se basant sur un processus semi-automatique.
Les résultats d'évaluation montrent que la méthode hybride proposée pour la compréhension est prometteuse et elle peut être exploitée pour les langues peu dotées telles que le dialecte tunisien.
Marwa GRAJA est Docteur, Ingénieur et Maître Assistante en Informatique à l'université de Sfax.
Elle fait membre de l'équipe ANLP-RG (Arabic Natural Language Processing Group) du laboratoire MIRACL.
Ses activités de recherche s’intéressent au domaine de la compréhension automatique de la parole ainsi que la fouille d'opinion dans les textes arabes.
Fiche technique