CARACTÉRISATION DES DONNÉES : synthèses numériques des données
Cours 10 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Caractérisation des données
    Mesures de dispersion : évaluent la dispersion à l'intérieur d'une distribution (éparpillement, étalement, dispersion ou variation) Pour les données numériques uniquement
        Coefficient de variation Variation de la dispersion des données en pourcentage
            lié à (=écart type/moyenne * 100)
                Moyenne Somme des valeurs d'une série de données divisée par le nombre de données dans la série Pour les données numériques seulement Plus représentative lorsque la distribution est symétrique
                Écart type Dispersion des observations autour de la moyenne
        Variance Moyenne des carrés des écarts entre chaque observation et la moyenne des observations
            lié à (= écart type au carré)
                Écart type Dispersion des observations autour de la moyenne
        Écart type Dispersion des observations autour de la moyenne
        Étendue Écart entre la plus grande et la plus petite valeur d'une série
    Mesures de distribution caractérisent la forme de la distribution (aplatissement, symétrie) Pour les données numériques seulement
        Coefficient d'aplatissement (Kurtosis) Type et force de l'aplatissement Valeur nulle = aplatissement normal Valeur positive = moins aplati que la normale Valeur négative = plus aplati que la normale
        Coefficient d'asymétrie Sens et force de l'asymétrie Valeur nulle = distribution symétrique Valeur positive = asymétrie à droite Valeur négative = asymétrie à gauche
    Mesures de tendance centrale : résument en une seule valeur la grandeur typique, le milieu ou le centre d'un ensemble de données Pour les données numériques, ordinales et nominales
        Mode Valeur(s) la(les) plus fréquente(s) dans une série de données; Seule mesure centrale pour les données nominales
        Moyenne Somme des valeurs d'une série de données divisée par le nombre de données dans la série Pour les données numériques seulement Plus représentative lorsque la distribution est symétrique
        Médiane Valeur qui occupe la place du milieu au sein des données ordonnées d'une série Pour les données numériques et ordinales Plus représentative que la moyenne pour une distribution asymétrique
© Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023)


Cours 10 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > Caractérisation d'un histogramme
Histogramme
    Caractéristiques
        Aplatissement par rapport à une courbe normale, est-il plus "pointu" ou plus "aplati"?
            Aplatissement faible Kurtosis positif
            Aplatissement normal Kurtosis nul
            Aplatissement élevé Kurtosis négatif
        Symétrie par rapport à une courbe normale, est-il aussi "centré", plus à droite ou plus à gauche?
            Cours asymétrique à gauche Asymétrie négative mode > médiane > moyenne
            Courbe asymétrique à droite Asymétrie positive mode < médiane < moyenne
            Courbe symétrique mode = médiane = moyenne

Distribution normale distribution "théorique" d'un caractère continu unimodal symétrique (c'est-à-dire moyenne = mode = médiane)
    possède
        Constance dans la distribution des données par rapport à son écart-type : . 68% des données se retrouvent à plus ou moins un écart-type . 95% des données se retrouvent à plus ou moins deux écarts-types
© Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023)


Cours 10 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Caractérisation des données > Choix des mesures de centralité
MESURES DE TENDANCE CENTRALE : choix
    en fonction du
        Type de distribution
            Combien de modes?
                Bimodale ou multimodale (deux modes ou plus)
                    Mode
                Unimodal (un seul mode)
                    Quel type de données?
                        Indicateur ordinal
                            Médiane**
                        Indicateur nominal
                            Mode
                        Indicateur numérique (ratio ou intervalle)
                            symétrique ou non?
                                Asymétrique
                                    Médiane
                                Symétrique
                                    Moyenne*
Source : Vaughan, 2001, p. 32 (notre traduction et adaptation)
* Dans une distribution symétrique, la moyenne étant proche du mode et de la médiane, ces derniers pourraient aussi être utilisés.
** Il est à noter que le mode pourrait aussi être utilisé.
© Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023)