Accueil Traitement d'image Suppression d'objects Présentation Résultats Téléchargement Stéréovision Présentation Exemple Nolf2 Exemple "Flower" Exemple "Grue" Segmentation en régions Présentation Algos actuels Résultats Débruitage d'image Types de bruits Filtre gaussien Filtre médian Filtre Mean Shift Photos de Chine Arrivée à Pékin Ti'an et Ti'Shan Séjour à Datong Retour à Pékin Recettes de cuisine Tarte à la bière Canapés ananas - fromage Chocolats à l'ail Pré-processeur HTML Principes Présentation Manuel de référence FAQ Exemple complet Téléchargement
	English version

Le Coin du Traitement d'Image

Algorithme rapide de segmentation hiérarchique en régions

Hiérarchique ?

Nous avons vu que le problème majeur de la segmentation en région est la difficulté d'obtenir le bon nombre de régions. En effet, chaque objet possède sa propre échelle. Dans l'image "maison" 512x512 pixels ci-dessous du projet MOVI de l'INRIA, les lettres sur le sol ont une taille d'environ 50 pixels, les fenêtres de 500 pixels et la facade avant de 10000 pixels.
En posant la contrainte de régions de taille supérieure à 5000 pixels, la facade de la maison est bien extraite comme une région mais les petites lettres ont disparues. Inversement, autoriser des régions de 50 pixels engendre beaucoup de petite régions sur la facade qui perd alors son aspect global :

=> Tout objet possède sa propre échelle

Image initiale

Taille min=50px
(320 régions)
Echelle des lettres

Taille min=500px
(98 régions)
Echelle des fenêtres

Taille min=5000px
(21 régions)
Echelle de la façade

C'est pourquoi une image des régions n'est pas un résultat suffisant pour être exploitable : il faudrait dans l'idéal une image des régions pour chaque échelle. D'où le terme "hiérarchique".

Présentation de l'algorithme

Le principe de l'algorithme utilisé est similaire à celui d'un algorithme de fusion :

A l'initialisation, chaque pixel est considéré comme une région.
Les régions sont fusionnées avec leur voisines comme suit, jusqu'à ce que toutes les fusions possibles aient été effectuées :
- Dans l'ordre croissant du gradient de leur frontière commune
- Sous la condition que la valeur du gradient soit inférieure au niveau de bruit (premier paramètre) ou que l'une des deux régions ait une taille inférieure à la taille requise (second et dernier paramètre).

L'aspect hiérarchique de l'algorithme s'obtient en bouclant sur les tailles minimales croissantes spécifiées et en sauvant les résultats pour chacune. Le processus repartant du résultat de la taille minimale précédente, le traitement d'une échelle supplémentaire est non seulement très rapide, mais il assure aussi que les nouvelles régions seront un assemblage d'une ou plusieurs régions de l'échelle précédente.
Cette propriété est très importante, car elle permet une mise en forme du résultat en pyramide de région.

Les informations de sortie sont différentes de celles d'un algorithme classique :

Une image de numéros de région (chaque pixel représente un nombre entier). Elle correspond à l'image classique des régions de l'échelle la plus fine (taille de 50 pixels dans l'exemple). Toutefois, la numérotation est spéciale (voir point suivant).
Une liste de couples {Rmin, Rmax}, pour chaque échelle spécifiée (3 dans l'exemple, 50, 500 et 5000). Chaque couple { Rmin, Rmax } correspond à une région dont le support dans l'image est l'ensemble des pixels de numéro de regions compris entre Rmin et Rmax (pour les régions de l'échelle la plus fine, Rmin=Rmax).

Note : Une phase de débruitage de l'image (similaire à un filtre alterné séquentiel mais en plus rapide) a été incorporée avant la phase de fusion pour améliorer la robustesse au bruit.

Note : L'algorithme utilise l'information de couleur quand elle est disponible.

Temps de calcul

L'objection à venir est la suivante : appliquer cet algorithme tel quel entraîne des temps de calcul prohibitifs (O(N²) en nombre de pixels de l'image).
Quelques approximations mineures, notamment celle du recalcul du "gradient entre régions", et une implémentation efficace du tri par ordre croissant de gradient des voisinages de régions en viennent à bout.

Pour donner un ordre d'idée, le résultat précédents sur l'image "maison", de taille 512x512 pixels, a été obtenu en 0.35 secondes (0.31 s pour les deux premières échelles (50 et 500) et 0.28 s pour la première seule (50)).

L'algorithme a été implémenté en C++ (compilé avec GNU g++ 3.2.2 option -O2 sous Linux, sur un processeur AMD 1800+).

Autres exemples de résultats

La première ligne affiche les images avec des couleurs particulière pour faire ressortir les contrastes. La couleur des régions est la couleur moyenne.
La seconde ligne affiche les images avec des couleurs aléatoires par zones.

Paramètres de l'algorithme :