Dédèle ?

C’est qui Dédèle (comprendre ddl pour degré de liberté) ? Mr, c’est quoi un ddl ? Un Dédé quoi ? Comme ce genre de questions revient assez fréquemment en cours ou TD de statistiques, je me suis dit qu’il était peut-être temps d’écrire un petit post dédié à mon amie Dédèle. De toute manière, lorsque cette question ne m’est pas posée directement, je peux lire la détresse (voir la peur) dans les yeux de l’assistance quand j’invoque Dédèle (rassurez vous, il ne s’agit pas là d’une messe noire à l’attention de Dédèle la déesse de Terra Statistica ! Quoique…). Bon ok, je dramatise un chouïa, une grande partie de l’auditoire en question y est complètement insensible, à tort ou à raison. Pauvre Dédèle, tellement impopulaire… Moi même, jusque très tard, j’ai navigué à vue dans les dédales (ou les dédèles devrais-je dire) de Terra Statistica sans vraiment connaître ni chercher à connaître cette bonne vieille Dédèle, pourtant un phare dans la nuit. Damned, j’avais tord… J’avais bien une vague idée de ce qu’elle pouvait bien représenter mais clairement, je m’en souciais guère. Et pourtant, on gagne à la connaître. Qui ça ? Ben Dédèle bien sure.

Dédèle, c’est en fait une variable à surveiller très régulièrement, tout comme on surveille la jauge du niveau de carburant pour éviter de tomber en rade, à moins que la panne sèche soit un objectif en soi… Bref, tu l’auras compris chèr(e) lecteur/lectrice, il faut voir Dédèle comme une réserve et éviter de la faire tomber à zéro. Je te vois venir… Oui, mais à quoi elle sert cette réserve ? Bonne question Jean-Noël (oui, c’est la fin d’année et les fêtes approchent). C’est vrai ça à quoi Dédèle peut bien servir ? Et bien à faire avancer ton modèle statistique tout simplement, que ce soit une Lada première génération (petit réservoir ou petit échantillon) ou bien une Maserati  dernier cri (gros reservoir ou gros échantillon). C’est là que la notion de degrés de liberté prend tout son sens. Ben ouais, tu auras la possibilité d’aller plus loin (cf. plus de liberté) avec un gros réservoir bien plein plutôt qu’avec un petit réservoir même plein. Si comme moi tu es fan de Magic The Gathering (oups je sens que je vais perdre le peu de lecteurs/lectrices qui ont eu le courage de commencer à lire ce post) tu peux aussi voir Dédèle (oui j’ai décidé que Dédèle a plusieurs visages) comme ta réserve de mana. Plus celle-ci est grande et plus tu as de liberté pour lancer tes sorts les plus puissants (bam le Jökulhlaups) ou tes grosses bébêtes préférées (et bim Emrakul). Bon, avec ta réserve de Dédèle tu ne lanceras pas de sort (gosh, je peux lire la deception dans ton regard) mais tu pourras invoquer des variables plus ou moins puissantes pour faire avancer ton modèle statistique (c’est vrai, c’est moins classe qu’une Maserati dernier cri, mais utile, parfois) et avaler toujours un peu plus de variance.

Mouais mais Mr, comment dépenser le contenu de la reserve de Dédèle ? Tu es encore là Jean-Noël ? Hummm, serais-tu toi aussi tombé sous le charme de Dédèle la sirène (je t’avais prévenu, Dédèle a plusieurs visages). Prends garde, elle pourait bien t’entraîner dans les abysses de Terra Statistica. Et bien, tout d’abord, il faut savoir que l’invocation d’une variable quelque soit sa nature (quantitative, ordinale, binaire, qualitative) a un coût. Par exemple une variable quantitative (cf. valeurs numériques continues) te coûtera 1 point de Dédèle. Pour une variable qualitative (cf. catégories ou groupes), il t’en coûtera autant que tu as de groupes ou de catégories moins un : le sacro-saint n-1 (Kali Ma Shakti de…). Accroche-toi Jean-Noël, Dédèle nous tire plus profondément dans les limbes de Terra Statistica. Pour une variable quantitative il t’en coûtera aussi n-1, en fait, mais dans ce cas n vaut 2. Mais pourquoi n-1 me diras-tu Jean-Noël. Et bien parce que chaque estimation de paramètre te fait perdre 1 point de Dédèle et que chaque modèle se construit en estimant un premier paramètre qui sert de point de référence (cf. intercept) pour toute tes variables explicatives qu’elles soient quantitatives ou qualitatives. Dans le cas de variables quantitatives, ce paramètre n’est autre que l’ordonnée à l’origine et pour les varibles qualitatives, il s’agit simplement de la moyenne de la varible à expliquer pour une des modalités qui jouera le rôle de point de référence (généralement la première modalité qui vient par ordre alphabétique ou croissant). Note que ce point de référence sera commun à toutes les variables explicatives de ton modèle. Ceci a pour avantage de faire de grosses economies dans ta dépense de points de Dédèle. Quand ta réserve de Dédèle tombe à zéro, ta Maserati ou ta Lada cale et aucune statistique ne peut être calculée pour les différents paramètres de ton modèle statistique, faute de degrés de liberté. Bref, plus il te reste de points dans ta réserve à Dédèle et plus les tests statistiques qui moulinent en arrière-plan seront puissants (cf. risque de deuxième type faible) pour détecter des effets, même petits, des variables explicatives sur ta variale à expliquer.

Voilà courageux/courageuse lecteur/lectrice, tu es arrivé(e) au bout de ce post interminable sur Dédèle, the goddess, et tu en sais un peu plus sur elle et son univers impitoyable. Si tu veux en savoir un peu plus, le mieux reste encore de la travailler au corps…

Bonne navigation en Terra Statistica.

Advertisements