> La recherche > L'indexation des images et des séquences d'images
 
       
  Présentation
Plan d'accès
Les membres
  Présentation
DEA
Thèse
  Présentation
L'indexation
Le document
  En cours
Achevés
  Les ouvrages
Les thèses
Les publications
  DEBORA
Telesun
Kiwi
  Institutionnelles
Privées
Universitaires
 

L'indexation des images par le contenu est un objectif ambitieux qui est rendu possible par les capacités techniques offertes par les matériels actuels, et aussi par les progrès scientifiques du traitement d'images et de la vision par ordinateur. Cet objectif se décline en deux familles de problèmes de complexités différentes :

  • être capable, suite à une indexation, de retrouver une image à partir d'une image pratiquement identique ou simplement à partir d'un seul fragment ;
  • être capable de retrouver des classes similaires, même si les images sont très différentes sur le plan du signal: paysage de montagne, etc.

Les applications des outils dérivant de ces travaux concernent bien sûr la consultation et la recherche dans les bases d'images fixes :

  • consultations en vue de vérification de copyright (presse, industrie textile, contrôle aux frontières),
  • recherche (agence de presse, agence de photos pour publicitaires, bases d'images scientifiques ou industrielles).

Mais le développement de la numérisation atteint maintenant la vidéo et ces outils sont aussi destinés à la gestion des archives, ou plus directement à l'assistance à la structuration de la vidéo (fabrication d'hyperliens dans une vidéo).

Bien que centrés sur une approche image et vidéo, nous tentons de maintenir le lien interdisciplinaire avec les autres disciplines impliquées dans cette nouvelle thématique (notre implication dans la création de l'Institut Supérieur du Document Numérique (ISDN) est aussi justifiée par cette volonté).

1. Travaux récents

Nos travaux récents ont porté principalement sur les quatre voies suivantes.

a) La conception de nouvelles représentations à base de graphes
J.M. Jolion dirige depuis 3 ans le comité technique TC15 Graphs based Representations de l'IAPR (International Association for Pattern Recognition), (http://rfv.insa-lyon.fr/TC15). Nous organisons la conférence bi-annuelle (3ème édition cette année en Italie). Ce groupe réunit des chercheurs de très nombreux pays (une quinzaine) intéressés par l'utilisation des graphes en reconnaissance de formes. Nous abordons tout à la fois des développements théoriques (nouveaux algorithmes sur la mise en correspondance de graphes ou la construction de hiérarchies de graphes) et les applications en segmentation d'images, reconnaissance de formes, recalage d'images. Pour notre part, nous avons proposé de nouvelles approches de la réduction des graphes qui sont utiles, tant pour la mise en correspondance (Thèse de J.G. Pailloncy) que pour la modélisation des structures spatiales.

b) La conception de nouveaux descripteurs d'images
Ces descripteurs, de type points d'intérêt, s'appuient sur une mesure de contraste en multirésolution et sur la transformée de Haar, par opposition aux détecteurs de type différentiel comme le détecteur de Harris (thèse de E. Loupias).

c) Une étude de la stabilité de la plupart des descripteurs d'images
Cette étude a été faite en regard d'un bruit de codage de type JPEG.

d) La mise au point d'un système d'indexation
Ce système utilise un mécanisme de bouclage de pertinence interactif permettant de focaliser la recherche sur le type d'images souhaité.

Ces travaux ont trouvé leur aboutissement dans le cadre du logiciel KIWI (http://telesun.insa-lyon.fr/kiwi) qui permet l'indexation de bases d'images fixes.
Ils ont donné bien sûr lieu à thèses, publications (ouvrages, revues, congrès) et brevets.

2. Travaux actuels

Nos travaux actuels peuvent être répartis en deux catégories:
- Les travaux plus orientés vers les applications; ils restent le plus souvent théoriques mais avec une problématique nettement liée à un domaine et/ou un partenaire externe au milieu universitaire,
- les travaux plus prospectifs.
On peut les résumer de la façon suivante:

a) Modélisation d'images astronomiques
Elle est développée en vue d'une indexation de bases de gros volume (50 millions d'images) en collaboration avec l'observatoire de Lyon (thèse de C. Rivero-Moreno qui débutera en septembre 2001.

b) Modèle bayésien pour le bouclage de pertinence
Notre collaboration avec le laboratoire RECODOC, qui a d'abord fait l'objet d'un DEA, nous permettra une meilleure prise en compte des modèles utilisateurs, c'est à dire de la notion d'usage. Ce thème a fait l'objet d'une demande dans le cadre du programme Cognitique.

c) Extraction de textes dans les vidéos
C'est l'objet de la thèse de C. Wolf qui est faite en collaboration avec France Télécom; cette recherche a débouché sur un brevet et une nouvelle voie de collaboration avec l'Université du Maryland.

d) Analyse évènementielle du mouvement dans les vidéos
Deux thèses portent sur cette recherche, celles de R. Mégret et E. Etievent. Initiée dans le projet SESAME, elle se poursuit en collaboration avec France Télécom et l'Université du Maryland. Notre spécificité se situe dans une analyse long terme des séquences, par opposition aux approches locale de type flux optique ou mouvement paramétrique. Cette approche correspond plus aux besoins des indexeurs. Nous y exploitons tout à la fois notre savoir faire sur les points d'intérêt et sur la multirésolution.

e) Les travaux plus prospectifs
Ils portent plus spécialement sur:

  • l'analyse et l'identification de courbes planes et de dot patterns par rehaussement de contraste dans des hiérarchies de graphes,
  • l'étude des structures de graphes hiérarchiques asynchrones,
  • l'extension de concepts statistiques aux ensembles de graphes,
  • la modélisation statistique des images permettant d'aboutir à une meilleure formalisation des propriétés des signaux images.

Tout en maintenant une activité de recherche prospective dans le domaine de l'image et de la reconnaissance de formes, nous avons souhaité afficher une compétence bien ciblée sur un thème restreint afin d'obtenir une reconnaissance nationale et internationale, tant du point de vue universitaire que dans le domaine non académique. Ce dernier aspect nous a conduit à participer à plusieurs contrats de recherche régionaux (projet ACTIV, projet ACTIV II, action Document Vivant au sein du projet régional ISDN) et nationaux (projets SESAME (96 2064) et ECAV, en collaboration avec France Télécom). Ces projets sont décrits dans la seconde partie du rapport.

Dans le domaine de l'image, nous avons été associés à une demande dans le cadre du premier appel d'offre du nouveau département STIC du CNRS en collaboration avec les laboratoires ETIS (S. Phillip), HEUDIYASIC (J.P. Cocquerez) et IRISA (P. Gros).