Réunion du 10 avril 2009

Recrutement :
- UTC : 1 stagiaire de Master (José Flores) sur le bootstrap pour la sélection de modèle en clustering
- LITIS : 1 stagiaire indien (undergraduate) sur netflix et 1 candidat ingénieur de recherche (Julien Delpote, début en mai ?)
- CRIP5 : 1 stagiaire de Master (Anmed Najjar) sur les modèles de mélange et la classification hiérarchique et 1 candidat pour 3 mois IR (peut être) sur les modèles de mélange par bloc et la visualisation
A faire :
- Accord de consortium : Stéphane envoie un projet de contrat.
- Comité d’utilisateurs : Stéphane s’en occupe / coordination avec le projet CADI
Avancement des tâches :
- Tâche T0.1 : site web / OK
  - Il est opérationnel.
  - On peu penser à ajouter une rubrique bibliographique pour les papiers intéressants plutôt fermé par mot de passe et une rubrique data ouverte.
  - Gérard regarde l’éventualité et l’opportunité d’installer un WIKI pour l’intranet du projet.
- Tâche T1.1 : état de l’art pour la classification croisée et pour la factorisation
  - Gérard à récupéré ses documents.
  - Cible : Foundations and Trends in Machine Learning http://www.nowpublishers.com/product.aspx?product=MAL
  - Clarifier la terminologie
  - Faire l’historique
  - Envoyer les papiers intéressants, voir le livre Cluster analysis de Tryon et Bailey.
  - Comment les mélanges et l’acp se rejoignent ? Le co-clustering c’est de l’ACP sous contraintes min U,D,V||X-U.D.V’||2 s.t. D diagonale, V’V=I,U’U=I sous les contraintes U,V ∈ {0,1}, on retrouve le co-clustering (ref : Thèse d’état de G. Govaert)
- Tâche T2.1 : état de l’art pour la sélection de modèle : Dominique, Stéphane, Yves, Gérard et Mohamed
  - Il y a déjà des livres : sélection de modèle en statistique.
  - Il faut bien cibler : au moins clustering (peut être se limiter au clustering croisée) et les modèles associés.
  - Titre : sélection de modèle en clustering
  - Il faut être génératif (on ne peut plus de contenter d’être discriminatif)
  - Sélection de modèle associées au mélange, voire au bloc clustering (nb de classes)
  - Factorisation : combien de facteurs, coude sur le chemin de régularisation, test
  - Appliquer les techniques de Dominique au problème de clustering : attention, il faut disposer d’une forme analytique de l’estimateur μ^
  - Clustering et sélection de variables / sélection de variable : Raftery Raftery, A.E. and Dean, N. (2006). Variable Selection for Model-Based Clustering. /Journal of the American Statistical Assocation/, 101, 168-178.
Remarques diverses :
- Ne pas oublier : KPCA : l. Zwald
- Comment comparer les différentes méthodes de clustering : on les utilise comme pré processing pour un problème supervisé (discutable)
- Workshop de cet été sur le clustering http://www.stat.washington.edu/raftery/Onrgroup/wgsum09.html

fr/compte_rendu_10_04_09.txt · Dernière modification: 10/09/2009 16:56 par ggovaert