Résumé des travaux de thèse...


Dans le Laboratoire Reconnaissance de Formes et Vision, mon activité de recherche s'oriente autour de la segmentation des images de documents par la détection de zones d’intérêt. Cette activité est centrée sur le traitement de l’information numérique contenue dans une image et repose sur deux grandes thématiques, à première vue sans lien, que sont la segmentation des documents et la perception visuelle humaine. Je propose dans mes recherches d’aborder le problème de la structuration des documents d’une façon différente de ce qui se fait actuellement. Pour cela, une partie des études réalisées consiste à mesurer l’impact du rédacteur du document dans la présentation et l’organisation des données mais également à prendre en compte l’intervention du lecteur par son interprétation structurée des données et ses intentions particulières dans la capture de l’information. J’ai ainsi cherché à exploiter le fait que le document était fait par l’homme (auteur) et était destiné à l’homme (lecteur). Il était donc au cœur de la problématique mais n’a encore été que très peu impliqué dans ce domaine de recherche.

Jusqu’ici les solutions qui étaient proposées correspondaient à des réponses à des besoins très spécifiques, principalement ciblés sur des familles de documents particuliers, comme les formulaires (documents administratifs, bons de commandes…), les chèques, ou encore les adresses postales. Les solutions proposées reposaient principalement sur la définition de modèles génériques à la base des traitements. De plus en plus de nouveaux besoins se font ressentir dans l’analyse de documents de plus en plus variés dont les structures deviennent parfois très complexes et ne respectent plus toujours les schémas traditionnels de présentation. L’introduction de l’homme et la prise en compte des stratégies d’exploration de l’information constituent les premiers pas vers de nouvelles pistes de recherches.
Dans ce contexte, mes travaux de recherche, qui ont abouti à la rédaction d’un mémoire de thèse, consistent à proposer une méthodologie de segmentation de documents (recherche des structures physique et logique) s’inspirant des mécanismes de capture d’informations visuelles chez l’homme. L’analyse du lien qui s’établit entre le document (par sa mise en forme matérielle) et le lecteur (par ses intentions de recherche et ses motivations) est donc à la base de mon travail. Les premiers thèmes complémentaires de recherches que j’ai abordés font ainsi référence aux sciences de l’homme : sciences cognitives, psychologie et physiologie. Ils m’ont permis de comprendre comment l’homme percevait son environnement, le structurait et l’intégrait. La mise au point de programmes de traitements d’images (transformée de Fourier, filtrage, analyse de texture…) intégrant des domaines de recherche parfois très hétérogènes est un pari ambitieux auquel j’ai cherché à apporter une contribution.

page modifiée la dernière fois en juin 1999 par Véronique EGLIN