Homepage of Rémi Megret

Ma photo


Rémi Megret

Laboratoire LIRIS
Bâtiment Jules Verne
INSA de Lyon
20, Avenue Albert Einstein
Villeurbanne, 69621 cedex, FRANCE
Tel au labo: 04.72.43.83.13

email: remi.megret at rfv.insa-lyon.fr

Bienvenue sur ma page web. Je suis actuellement enseignant/chercheur au sein du laboratoire LIRIS (anciennement RFV), où je viens de terminer ma thèse de doctorat sur la « Structuration spatio-temporelle d'une séquence vidéo », sous la direction de Jean-Michel Jolion. Je travaille sur l'analyse du mouvement dans des documents vidéo en vue d'en enrichir la description.

Je me suis en particulier intéressé à la segmentation par le mouvement, par la couleur, à la détection et au suivi de primitives spatiales dans des images en couleur. J'ai particulièrement approfondi le point de vue multi-échelle des analyses, à travers la théorie de l'espace-échelle, appliquée à l'image ou à la classification non paramétrique et non supervisée. Vous trouverez sur cette page des documents qui concernent ce travail, ainsi que ceux relatifs à mes travaux précédents.

Pour les étudiants qui recherchent les documents relatifs à mes enseignements, reportez vous au dossier partagé /pve/rmegret au CIPC. Vous y trouverez une page spécifique.

Thèse

La thèse s'intitule: "Structuration spatio-temporelle d'une séquence vidéo".
Memoire de thèse: PDF (5,6 Mo)

Résumé:

Ce travail aborde le problème de l'extraction d'une structure spatio-temporelle au sein de séquences vidéos, avec comme objectif une représentation qui prenne en compte l'ensemble de la séquence, tant spatialement que temporellement. Plusieurs points de vues sont proposés: le point de vue de l'estimation de trajectoires, le point de vue de la segmentation jointe en espace et en temps, et une formalisation plus générale autour du concept de regroupement récursif. Le point commun des solutions que nous introduisons est de considérer des représentations à plusieurs niveaux, par l'utilisation de structures hiérarchiques. Ces structures sont définies à partir de primitives regroupant les pixels de façon compacte: il s'agira de primitives surfaciques au sein d'une image, et de volumes au sein du bloc spatio-temporel que constitue la vidéo.

Le premier point de vue sépare les dimensions spatiales et le temps. Des primitives sont extraites des images et mises en correspondance temporelle pour former des trajectoires. Nous proposons pour cela l'utilisation de blobs, c'est à dire des régions de forme compacte présentant un contraste avec leur voisinage. Nous utilisons la définition de la théorie de l'espace-échelle, qui présente l'avantage de tirer parti de l'information présente à plusieurs niveaux de détail dans une image à niveaux de gris. Nous proposons une extension de celle-ci à la couleur, sur la base des histogrammes de couleur locaux, que nous relions avec d'autres méthodes non multi-échelle. Les blobs suivis forment des trajectoires, que nous segmentons par le mouvement, à l'aide d'une nouvelle méthode, permettant de prendre en compte des trajectoires de longueurs variées.

Le second point de vue considère les dimensions spatiales et temporelle de façon jointe. Nous proposons une méthode d'extraction de tubes de couleur spatio-temporels dans des blobs d'une vingtaine d'images. Elle est basée sur une classification des pixels de la séquence dans un espace de caractéristiques. L'avantage d'extraire directement des structures spatio-temporelles du bloc vidéo est de pouvoir les comparer, moyennant un décalage temporel, ce qui fournit une mesure de la stabilité temporelle de chaque tube.

Enfin, nous proposons un modèle général permettant de caractériser les méthodes de structuration du bloc spatio-temporel, sur la base de deux concepts: la définition d'une structure spatio-temporelle comme un regroupement récursif des pixels de la séquence, et la décomposition de toute relation spatio-temporelle en une relation synchrone et une projection temporelle.

Publications

Remi Megret, Daniel DeMenthon. A Survey of Spatio-Temporal Grouping Techniques. Research report CS-TR-4403, LAMP, University of Maryland, August 2002.
Rapport de recherche CS-TR-4403: PS (180 ko)

Daniel DeMenthon and Rémi Megret. Spatio-Temporal Segmentation of Video by Hierarchical Mean Shift Analysis. Technical Report LAMP-TR-090, CAR-TR-978, CS-TR-4388, UMIACS-TR-2002-68, University of Maryland, July 2002.
Rapport de recherche CS-TR-4388: PS.GZ (214ko)

R. Megret , J.-M. Jolion. Suivi de blobs de niveaux de gris pour la représentation du contenu dynamique d'une vidéo. RFIA'02 (Angers), vol. 2, pp. 397--406, Jan. 2002.
Article: PS (4 Mo), PDF (1.3 Mo)
Rapport de recherche RR-2001-05: PS (3.9 Mo)

Rémi Megret, Jean-Michel Jolion. Le suivi de blobs comme base pour la caractérisation du mouvement dans des séquences audiovisuelles. CORESA 2001, Dijon, novembre 2001.
Article CORESA: PS (1,3 Mo)

R. Megret, J.-M. Jolion. Tracking scale-space blobs for video description. IEEE MultiMedia, vol. 9, no. 2, pp. 34--43, 2002.
Article: PDF (1,23 Mo)

Rémi Megret, Jean-Michel Jolion. Scale-space blobs tracking for video dynamic content representation. CBMI 2001, Brescia, Italie, septembre 2001.
Rapport de recherche RR-2001-03: PS.GZ (553 ko)

Rémi Megret, Jean-Michel Jolion. Description pré-attentive et structuration du mouvement pour l'indexation de vidéos. ORASIS 2001, Cahors, juin 2001. pp 17-26.
Article ORASIS: PDF (702 ko)
Rapport de recherche RR-2001-02: PDF (942 ko)

Rémi Mégret, Caterina Saraceno, Walter Kropatsch. Building the background mosaic of an image sequence in presence of moving objects. ICPR 2000, Barcelone, Espagne, septembre 2000.
Technical Report: PS.GZ (942 ko)

Travaux précédents


http://rfv.insa-lyon.fr/~megret
email:"remi.megret at liris.insa-lyon.fr"
Rémi Megret, mars 2004