Une proposition de fusion est en cours entre Encodage one-hot etTableau disjonctif complet.
Vous venez d’apposer le modèle {{à fusionner}}, suivez ces étapes :
1. |
Apposez le bandeau sur les autres pages à fusionner : |
Utilisez ce texte :
|
---|---|---|
2. |
Important : ajoutez une section dans Pages à fusionner en motivant votre proposition. |
Pour créer la section : |
3. |
Pensez à informer les contributeurs principaux de la page et les projets associés lorsque cela est possible. |
Utilisez ce texte :
|
Cet article est une ébauche concernant les probabilités et la statistique.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
Untableau disjonctif complet (TDC) est un type de représentation de données qualitatives utilisé en analyse des données. Dans ce tableau, une variable qualitative à modalités est remplacée par
variables binaires, chacune correspondant à une des modalités[1].
Dans la littérature anglophone sur l'apprentissage automatique, il est connu sous le nom de codage "one-hot" ("one-hot encoding").
Une famille est constituée d'un père, d'une mère et d'un jeune garçon. On s’intéresse aux variables "sexe" et "couleur des yeux" de ce ménage.
Voici le tableau regroupant ces informations :
individu | Sexe | Yeux |
---|---|---|
père | Masculin | Marron |
mère | Féminin | Bleu |
enfant | Masculin | Vert |
Le tableau disjonctif complet de cette population prend la forme suivante :
individu | sexe F | sexe M | Yeux B | Yeux M | Yeux V |
---|---|---|---|---|---|
père | 0 | 1 | 0 | 1 | 0 |
mère | 1 | 0 | 1 | 0 | 0 |
enfant | 0 | 1 | 0 | 0 | 1 |