Recrutement :
UTC : 1 stagiaire de Master (José Flores) sur le bootstrap pour la sélection de modèle en clustering
LITIS : 1 stagiaire indien (undergraduate) sur netflix et 1 candidat ingénieur de recherche (Julien Delpote, début en mai ?)
CRIP5 : 1 stagiaire de Master (Anmed Najjar) sur les modèles de mélange et la classification hiérarchique et 1 candidat pour 3 mois IR (peut être) sur les modèles de mélange par bloc et la visualisation
A faire :
Avancement des tâches :
Tâche T0.1 : site web / OK
Il est opérationnel.
On peu penser à ajouter une rubrique bibliographique pour les papiers intéressants plutôt fermé par mot de passe et une rubrique data ouverte.
Gérard regarde l’éventualité et l’opportunité d’installer un WIKI pour l’intranet du projet.
Tâche T1.1 : état de l’art pour la classification croisée et pour la factorisation
Gérard à récupéré ses documents.
-
Clarifier la terminologie
Faire l’historique
Envoyer les papiers intéressants, voir le livre Cluster analysis de Tryon et Bailey.
Comment les mélanges et l’acp se rejoignent ? Le co-clustering c’est de l’ACP sous contraintes min U,D,V||X-U.D.V’||2 s.t. D diagonale, V’V=I,U’U=I sous les contraintes U,V ∈ {0,1}, on retrouve le co-clustering (ref : Thèse d’état de G. Govaert)
Tâche T2.1 : état de l’art pour la sélection de modèle : Dominique, Stéphane, Yves, Gérard et Mohamed
Il y a déjà des livres : sélection de modèle en statistique.
Il faut bien cibler : au moins clustering (peut être se limiter au clustering croisée) et les modèles associés.
Titre : sélection de modèle en clustering
Il faut être génératif (on ne peut plus de contenter d’être discriminatif)
Sélection de modèle associées au mélange, voire au bloc clustering (nb de classes)
Factorisation : combien de facteurs, coude sur le chemin de régularisation, test
Appliquer les techniques de Dominique au problème de clustering : attention, il faut disposer d’une forme analytique de l’estimateur μ^
Clustering et sélection de variables / sélection de variable : Raftery Raftery, A.E. and Dean, N. (2006). Variable Selection for Model-Based Clustering. /Journal of the American Statistical Assocation/, 101, 168-178.
Remarques diverses :
fr/compte_rendu_10_04_09.txt · Dernière modification: 10/09/2009 16:56 par ggovaert