Home > Student Projects > Détection de piétons

Sujet de stage, Masters 2006-2007

** Ce sujet n'est plus disponible - il a déjà été affecté **

Détection de piétons et classification de leurs activités

Responsable

Bill Triggs (Bill.Triggs@inrialpes.fr)

Résumé

Mots clés: reconnaissance de formes, classification visuelle, apprentissage par machine
La première partie peut aussi être fait en magistère.

Les buts de ce stage sont en premier lieu de réimplanter une méthode de reconnaissance visuelle - le détecteur de piétons de Viola, Jones et Snow - et en deuxième lieu, si le temps le permet, d'étendre la méthode à la reconnaissance de différentes classes de mouvement humaine - marche, cours, danse, jouer au foot ...

La première partie suivra de près l'approche développée par Viola et Jones, d'abord dans leur détecteur de visages temps-réel a CVPR'01 et plus récemment dans leur détecteur de piétons a ICCV'03. Il s'agit de parcourir l'image en présentant chaque sous-image à une chaîne de filtres qui a été optimisée pour éliminer au plus vite les sous-fenêtrés qui ne sont pas susceptibles de contenir l'objet recherché. L'optimisation est fait par « AdaBoost », une méthode d'apprentissage avancée. Au fur et à mesure qu'on descend dans la chaîne, les filtres deviennent plus complexes et plus lourdes à évaluer, mais aussi plus capables de détecter de façon fiable les vraies instances de l'objet recherché. L'intérêt principal de cette méthode - qui à été très influente - est de fournir un détecteur efficace qui est très économique en terme de calcul, voir même qui tourne en temps réel. Les filtres sont basées sur des combinaisons d'indices visuelles simples et rapides à évaluer - en ce cas, des filtres de contraste locale spatiale et temporelle.

Il existe actuellement nombreuses variations et optimisations de ces méthodes. Voir les références plus bas pour quelques exemples. Pour ce stage les références [1-3] sont les plus importantes, et il vaut aussi la peine de lire et comprendre [4-7] pour la partie optimisation.

La deuxième partie généralisera la chaine de détection afin de sous-classifier les personnes détectées selon plusieurs classes d'activité : marche, cours, danse, etc.

References on Cascade Detectors

  1. P. Viola and M. Jones. Robust real-time face detection. International Journal of Computer Vision (IJCV) 57(2) 137-154, 2004. PDF. (Originally appeared in CVPR'01).
  2. P. Viola, M. Jones and D. Snow. Detecting Pedestrians using Patterns of Motion and Appearance. International Journal of Computer Vision (IJCV) 63(2) 153-161, 2005. PDF. (Jointly won best paper prize at ICCV'03).
  3. Qiang Zhu, Mei-Chen Yeh, Kwang-Ting Cheng and Shai Avidan. Fast Human Detection Using a Cascade of Histograms of Oriented Gradients. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2006, pages 1491-1498. PDF. (A Viola-Jones style human detector using a descriptor set originally developed in our group).
  4. P. Viola and M. Jones. Fast and Robust Classification using Asymmetric AdaBoost and a Detector Cascade. Conference on Neural Information Processing Systems (NIPS) 2002. PDF. (Method for optimizing Viola-Jones detection cascades).
  5. Jie Sun, James M. Rehg and Aaron Bobick. Automatic Cascade Training with Perturbation Bias. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2004. PDF. (More on optimizing Viola-Jones detection cascades).
  6. Jianxin Wu, Matthew D. Mullin and James M. Rehg. Linear Asymmetric Classifier for Cascade Detectors. International Conference on Machine Learning (ICML) 2005. PDF. (More on optimizing Viola-Jones detection cascades).
  7. S. Charles Brubaker, Matthew D. Mullin and James M. Rehg. Towards Optimal Training of Cascaded Detectors. European Conference on Computer Vision (ECCV) 2006. PDF. (Yet more on optimizing Viola-Jones detection cascades).
  8. Stan Z. Li, Senior Member, IEEE, and ZhenQiu Zhang. FloatBoost Learning and Statistical Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI) 26(9), 2004. PDF. (An alternative cascade learning procedure, here used to learn a tree of face detectors not a linear chain).
  9. Chang Huang, Haizhou Ai, Yuan Li and Shihong Lao. Vector Boosting for Rotation Invariant Multi-View Face Detection. International Conference on Computer Vision (ICCV) 2005. PDF. (More on tree structured face detection cascades).
  10. Simon Baker and Shree K. Nayar. Pattern Rejection. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 1996. PDF. (One of the earliest papers on rejection based classifiers).
  11. François Fleuret and Donald Geman. Coarse-to-fine Face Detection. International Journal of Computer Vision (IJCV) 41: 85-107, 2001. PDF. (An early paper on rejection cascade based face detection).