Modélisation

Lorsque l'on souhaite modéliser une variable réponse à l'aide de variables explicatives, à effets fixes ou aléatoires, les modèles linéaires et linéaires généralisés sont une famille large et utile proposant un cadre souple pour la modélisation. Si les variables explicatives sont très nombreuses, on peut en outre envisager d'en extraire des composantes (supervisées) pour stabiliser ces modèles et les rendre plus interprétables. Nous proposons différentes méthodes d'estimation de ces modèles.

Les modèles bayésiens hiérarchiques à appartenance mixte sont une famille de modèles à structure latente qui supposent l'existence d'un nombre fixé de groupes. Dans ce type de modèle, le nombre de paramètres augmente avec le nombre de groupes et l’individu peut appartenir à plus d’un groupe. Nous travaillons sur des problèmes de choix de modèles qui se traduisent dans ce contexte par la sélection d’un nombre optimal de groupes, permettant ainsi d'obtenir le modèle le mieux adapté aux données.

La construction d’un bon modèle nécessite au préalable l’extraction et la sélection de caractéristiques pertinentes (ou feature engineering) à partir des données brutes. Il s’agit d'extraire des informations pertinentes, informatives et distinctives puis de les utiliser dans un modèle bien choisi. Nous travaillons sur la construction de caractéristiques, et sur la sélection d’un nombre limité de ces caractéristiques par des méthodes de régularisation (lasso) pour un modèle interprétable.

La validation de modèle est une étape importante de toute modélisation statistique. Dans ce cadre, nous développons de nouvelles procédures de test statistique, par exemple pour vérifier des hypothèses sur la distribution de probabilité des données ou encore du terme d'erreur de modèles paramétriques, notamment ceux utilisés dans le domaine des séries chronologiques. Nous développons également de nouveaux outils pour la détection et la mesure de la dépendance stochastiques entre plusieurs objets aléatoires.

Dernière mise à jour : 01/04/2021