Le Web Sémantique et l'Ontologie GOODRELATIONS en Commerce connecté
- Nouveau
Cette thèse s'attachera à présenter une nouvelle approche pour séparer les formules mathématiques des autres composantes rédactionnelles d’un document mathématique sans passer par un système de reconnaissance optique de caractères.
L’extraction se fait d’abord par repérage des opérateurs mathématiques les plus significatifs d’une formule, puis par extension du contexte aux opérateurs avoisinants jusqu’à la délimitation totale de l’espace de la formule.
L’étiquetage est réalisé à partir de modèles créés lors d’une phase d’apprentissage utilisant la logique floue.
Le taux d’étiquetage primaire est de l’ordre de 95.3%.
Mais l'étiquetage secondaire accroît ce taux d’environ 4%.
Les résultats obtenus montrent l’applicabilité de notre méthode puisque 93% des formules mathématiques ont pu être extraites d'images de documents de bonne qualité d’impression.
Cette thèse synthétise le travail effectué, pose les problèmes rencontrés et discute des résultats obtenus.
Docteur en informatique, maître Assistante à l’Ecole Supérieure des Sciences et Techniques de Tunis, auteur de plusieurs articles publiés dans des revues et conférences nationales et internationales (IJDAR, ICDAR, ICPR, DRR, CIFED...), membre responsable à UTIC: Unité de Recherche sur les Technologies de l'Information et de Communication
Fiche technique