Sujet de stage, Masters 2006-2007
** Ce sujet n'est plus disponible - il a déjà été affecté **
Détection de piétons et classification de leurs activités
Responsable
Bill Triggs (Bill.Triggs@inrialpes.fr)
Résumé
Mots clés: reconnaissance de formes, classification visuelle,
apprentissage par machine
La première partie peut aussi être fait en magistère.
Les buts de ce stage sont en premier lieu de réimplanter une
méthode de reconnaissance visuelle - le détecteur de piétons de Viola, Jones et Snow
- et en deuxième lieu, si le temps le permet, d'étendre la méthode à
la reconnaissance de différentes classes de mouvement humaine -
marche, cours, danse, jouer au foot ...
La première partie suivra de près l'approche développée par Viola
et Jones, d'abord dans leur détecteur de visages temps-réel a CVPR'01
et plus récemment dans leur détecteur de piétons a ICCV'03. Il s'agit
de parcourir l'image en présentant chaque sous-image à une chaîne de
filtres qui a été optimisée pour éliminer au plus vite les
sous-fenêtrés qui ne sont pas susceptibles de contenir l'objet
recherché. L'optimisation est fait par « AdaBoost », une méthode
d'apprentissage avancée. Au fur et à mesure qu'on descend dans la
chaîne, les filtres deviennent plus complexes et plus lourdes à
évaluer, mais aussi plus capables de détecter de façon fiable les
vraies instances de l'objet recherché. L'intérêt principal de cette
méthode - qui à été très influente - est de fournir un détecteur
efficace qui est très économique en terme de calcul, voir même qui
tourne en temps réel. Les filtres sont basées sur des combinaisons
d'indices visuelles simples et rapides à évaluer - en ce cas, des
filtres de contraste locale spatiale et temporelle.
Il existe actuellement nombreuses variations et optimisations de
ces méthodes. Voir les références plus bas pour quelques
exemples. Pour ce stage les références [1-3] sont les plus
importantes, et il vaut aussi la peine de lire et comprendre [4-7]
pour la partie optimisation.
La deuxième partie généralisera la chaine de détection afin de
sous-classifier les personnes détectées selon plusieurs classes
d'activité : marche, cours, danse, etc.
References on Cascade Detectors
- P. Viola and M. Jones. Robust real-time face detection.
International Journal of Computer Vision (IJCV) 57(2) 137-154, 2004. PDF. (Originally appeared in
CVPR'01).
- P. Viola, M. Jones and D. Snow. Detecting Pedestrians using
Patterns of Motion and Appearance. International Journal of Computer
Vision (IJCV) 63(2) 153-161, 2005. PDF. (Jointly won best paper prize at
ICCV'03).
- Qiang Zhu, Mei-Chen Yeh, Kwang-Ting Cheng and Shai Avidan. Fast
Human Detection Using a Cascade of Histograms of Oriented
Gradients. IEEE Conference on Computer Vision and Pattern Recognition
(CVPR) 2006, pages 1491-1498. PDF. (A
Viola-Jones style human detector using a descriptor set originally
developed in our group).
- P. Viola and M. Jones. Fast and Robust Classification using
Asymmetric AdaBoost and a Detector Cascade. Conference on Neural
Information Processing Systems (NIPS) 2002. PDF. (Method for optimizing Viola-Jones
detection cascades).
- Jie Sun, James M. Rehg and Aaron Bobick. Automatic Cascade
Training with Perturbation Bias. IEEE Conference on Computer Vision
and Pattern Recognition (CVPR) 2004. PDF. (More on optimizing Viola-Jones
detection cascades).
- Jianxin Wu, Matthew D. Mullin and James M. Rehg. Linear Asymmetric
Classifier for Cascade Detectors. International Conference on Machine
Learning (ICML) 2005. PDF. (More on
optimizing Viola-Jones detection cascades).
- S. Charles Brubaker, Matthew D. Mullin and James M. Rehg. Towards
Optimal Training of Cascaded Detectors. European Conference on
Computer Vision (ECCV) 2006. PDF. (Yet more on optimizing
Viola-Jones detection cascades).
- Stan Z. Li, Senior Member, IEEE, and ZhenQiu Zhang. FloatBoost
Learning and Statistical Face Detection. IEEE Transactions on Pattern
Analysis and Machine Intelligence (PAMI) 26(9), 2004. PDF. (An alternative cascade learning
procedure, here used to learn a tree of face detectors not a linear
chain).
- Chang Huang, Haizhou Ai, Yuan Li and Shihong Lao. Vector Boosting
for Rotation Invariant Multi-View Face Detection. International
Conference on Computer Vision (ICCV) 2005. PDF. (More on tree structured face
detection cascades).
- Simon Baker and Shree K. Nayar. Pattern Rejection. IEEE
Conference on Computer Vision and Pattern Recognition (CVPR) 1996. PDF. (One of the earliest papers on
rejection based classifiers).
- François Fleuret and Donald Geman. Coarse-to-fine Face Detection.
International Journal of Computer Vision (IJCV) 41: 85-107, 2001. PDF. (An early paper on rejection
cascade based face detection).