Étude de méthodes graphiques de segmentation d'images

Stage de TER 2003-2004

Lieu et responsable

Ce stage aura lieu dans l'équipe LEAR (apprentissage pour la vision par ordinateur) du laboratoire GRAVIR (CNRS-INRIA-INPG-UJF) à l'INRIA Montbonnot, où il sera encadré par Bill Triggs (Bill.Triggs@inrialpes.fr).

Mots clés

Traitement d'images, vision computationelle, reconnaissance des formes

Résumé

Ce sujet sera adapté à un(e) étudiant(e) qui a une solide formation mathématique, qui sait lire les articles de recherche, et qui a déjà quelques notions de traitement d'images et de calcul scientifique (algèbre linéaire - surtout calcul des valeurs propres - et optimisation).

La segmentation d'images est un problème difficile et pérenne, qui suscite chaque an de nombreux travaux en traitement d'images. Souvent, on reduit le problème au partitionnement d'un graphe dont les noeuds representent les pixels de l'image (ou d'un pyramide multi-échelle associé), et les arêtes pondérées codent la similarité ou la différence entre des pixels voisins.

Le but de ce stage de TER est de faire une étude bibliographique de 4-6 méthodes de segmentation d'images différentes, y inclut quelques méthodes graphiques, et de selectionner, implanter, et comparer quelques unes d'entre elles sur une base d'images naturelles.

Les méthodes à considerer sont a définir avec le stagiaire, mais peuvent inclure (entre autres!) « normalized cuts », « deterministic annealing », « multiscale aggregation » (dans une forme simplifiée) et « typical cuts ». Toutes ces méthodes ont une caractère algébrique / optimisation, donc il faudrait être prêt à travailler à la fois avec les images et avec les bibliothèques de calcul scientifique.

Plusieurs bases d'images sont disponibles pour les essais, mais le « Berkeley Segmentation Database » sera probablement la ressource la plus utile, à la fois pour les images et pour les mesures de performance à adopter.