Cours 9 / SCI6007 Phase 3 : Éléments empiriques Étapes de la phase empirique ÉTAPES DE LA PHASE EMPIRIQUE Collecte des données Analyse des données va-et-vient possible à l'aide des instruments de collecte développés lors de la phase méthodologique © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données ANALYSE DES DONNÉES en fonction du type de données Données "quantifiables" = données provenant d'indicateurs nominaux, ordinaux, ou numériques analyses statistiques Identification des principales caractéristiques; Vérification de liens; Élaboration de «sens» Données qualitatives = données textuelles non structurées, par exemple provenant de questions ouvertes ou de verbatims d'entrevues analyse de contenu Identification des principales caractéristiques; Vérification de liens; Élaboration de «sens» Objectif = Synthèse analyse de contenu Identification des principales caractéristiques; Vérification de liens; Élaboration de «sens» analyses statistiques Identification des principales caractéristiques; Vérification de liens; Élaboration de «sens» Données "quantifiables" = données provenant d'indicateurs nominaux, ordinaux, ou numériques analyses statistiques Identification des principales caractéristiques; Vérification de liens; Élaboration de «sens» Identification des principales caractéristiques; Vérification de liens; Élaboration de «sens» © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques Analyses statistiques Niveaux Deuxième niveau : niveau explicatif / prédictif Objectif : explorer et vérifier des liens type de statistiques Statistiques inférentielles Premier niveau : niveau descriptif Objectif : décrire les caractéristiques de l'échantillon type de statistiques Statistiques descriptives Outils un peu de vocabulaire... © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Vocabulaire POPULATION = Ensemble d'individus possédant des caractéristiques communes d'intérêt pour l'étude d'un phénomène Comprend ÉCHANTILLON = Sous-ensemble de la population Est composé INDIVIDU / UNITÉ STATISTIQUE = Chaque élément d'un échantillon, d'une population Possède CARACTÈRE = Aspect particulier que l'on veut étudier (variable, indicateur) Exemples Budget Nombre de livres Corps d'emploi Possède MODALITÉS = Différentes valeurs prises par un caractère Peuvent être QUALITATIVES = Valeurs non numériques (ordinal / nominal) Exemple Corps d'emploi {commis, technicien, bibliothécaire, etc.} Peuvent être QUANTITATIVES = Valeurs numériques Peuvent être CONTINUES = Ensemble de valeurs théoriquement infinies Exemple Âge moyen des utilisateurs {25,43; 35,67; etc.} Peuvent être DISCRÈTES = Ensemble de valeurs finies ou dénombrables Exemple Nombre de bibliothécaires dans une bibliothèque {1, 2, 3, 50, 100, etc.} © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Outils Évolution des outils « d'aide au calcul » Doigts Cailloux Boulier Règle à calcul Calculatrice Ordinateur Exemples de logiciels dédiés Calc Excel SPSS Statistica © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives STATISTIQUES DESCRIPTIVES : synthèse des données et de leurs caractéristiques potentiellement utiles pour tous les niveaux de recherche traitement Caractérisation des données type de mesure Mesures de dispersion Mesures de tendance centrale Représentation des données principes généraux Mise en forme efficace type de présentation Choix entre tableaux et graphiques Graphique Mise en forme Types de graphiques Types de relations Tableau Mise en forme peut servir à Graphique Mise en forme Types de graphiques Types de relations Types Pour caractère avec beaucoup de modalités Pour caractère avec peu de modalités © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en tableau > Caractère qualitatif OU quantitatif discret avec peu de modalités TABLEAU LORSQUE PEU DE MODALITÉS Caractères : Sexe & Nombre moyen de documents empruntés par semaine Réponses obtenues : Homme 0-5 Femme 11-15 Femme 0-5 Homme 6-10 Femme 0-5 Femme 11-15 Préparation 1. Distinguer les différentes modalités du caractère (classes) 2. Déterminer le nombre d'individus pour chaque modalité (effectifs de classes - effectifs absolus) 3. Calculer les effectifs relatifs (= effectif absolu / taille de l'échantillon) 4. Présenter sous forme de tableau Exemple pour un caractère Caractère : Corps d'emploi Réponses obtenues : Professionnel Technicien Cadre Technicien Personnel de soutien Technicien Personnel de soutien Professionnel Professionnel Technicien Professionnel Technicien Cadre Technicien Personnel de soutien 1. Identification des modalités Modalités : Professionnel, Cadre, Technicien, Personnel de soutien 2 et 3. Décompte des effectifs (absolus et relatifs) Exemple pour deux caractères Tableau de contingence / croisé = Tableau de fréquence pour 2 caractères Exemple Femme 0-5 Homme 0-5 Homme 6-10 Femme 0-5 1. Identification des modalités Modalités : Homme, Femme; 0-5, 6-10, 11-15 2 et 3. Décompte des effectifs © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en tableau > Caractère quantitatif continu OU discret avec beaucoup de modalités TABLEAU LORSQUE BEAUCOUP DE MODALITÉS Exemple d'une méthode manuelle 1. Calculer étendue (valeur maximale – valeur minimale) 2. Choisir le nombre de classes (entre 5 et 15): peut être arbitraire, imposé ou basé sur une méthode mathématique (par ex. la règle de Sturges = valeur entière la plus proche de 1 + 3,3 log10n où n est la taille de l'échantillon) 3. Calculer la longueur des classes (intervalle de classe) : = étendue / nombre de classes Note: pour la longueur des classes on retient le même nombre de chiffres après la virgule que les données mais sans arrondir et on ajoute 1 au dernier chiffre. Par ex., si la longueur des classes est 12,042 et que les données ont deux chiffres après la virgule, la longueur des classes est 12,04 + 0,01 = 12,05 4. Fixer la limite inférieure de la première classe (plus petite que la valeur minimale mais assez proche, une décimale de plus que les données pour éviter que des données arrivent sur une des limites) 5. Déduire les autres limites en additionnant la longueur des classes jusqu'à inclure la valeur maximale 6. Déterminer les effectifs de classe en comptant le nombre de données qui sont incluses dans chacune des classes Exemple Caractère: Nombre de documents empruntés par mois Réponses obtenues: 14 4 5 21 17 23 11 3 6 10 18 11 20 2 6 12 12 3 8 5 4 2 7 2 9 2 21 15 23 12 34 0 31 3 8 5 1 3 2 27 8 1 0 23 12 13 42 10 12 12 0 6 44 6 46 2 33 45 11 39 17 41 36 1. Calcul de l'étendue maximum - minimum = 46 - 0 = 46 2. Définition du nombre de classes 7 (selon Sturges) 3. Définition de la longueur des classes étendue / nombre de classes = 46 / 7 = 6,5714, même nombre de décimales que les données sans arrondir + 1 = 6 + 1 = 7 4. Choix de la limite inférieure -0,5 (plus petite valeur = 0) 5. Calcul des autres limites Limite inférieure -0,5 -0,5 + 7 (longueur des classes) = 6,5 6,5 + 7 = 13,5 13,5 + 7 = 20,5 20,5 + 7 = 27,5 27,5 + 7 = 34,5 34,5 +7 = 41,5 41,5 + 7 = 48,5 6. Calcul des effectifs (absolus et relatifs) © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Principes généraux pour la présentation Principes généraux pour la présentation des statistiques descriptives Représentation des données Principes organisationnels Grouper les données par thème Prioriser les données Titrer et numéroter les tableaux et graphiques Principes visuels Simplicité Choisir un design facile à lire Maximiser le ratio données-encre Montrer les données Éviter la redondance Éviter les abréviations Éviter les rayures, carreaux, etc. © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Mise en forme des tableaux MISE EN FORME DES TABLEAUX Principes ergonomiques Colonnes versus lignes En fonction de ce que l'on veut comparer En fonction de la taille du tableau Données Aligner à droite pour les chiffres, sinon à gauche Indiquer les unités de mesure dans l'entête de colonne Mettre côte à côte les fréquences relatives et absolues d'un caractère Même nombre de décimales pour les données d'un caractère Rapprocher des colonnes ou lignes que l'on veut comparer Trier selon un ordre significatif Utiliser les séparateurs de milliers pour aérer Quadrillage Colorer au besoin une ligne/colonne sur deux Encadrer colorer les données importantes Insérer une ligne pour délimiter l'entête et une ligne pour le total Si nécessaire, privilégier le gris clair et non le noir Utiliser l'espacement entre lignes/colonnes pour aérer Éviter la surcharge © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique Horizontal PRÉSENTATION EN GRAPHIQUE pour les caractères quantitatifs continus OU quantitatifs discrets avec beaucoup de modalités Histogramme pour les caractères quantitatifs discrets avec peu de modalités OU qualitatifs Graphique en secteurs Graphique en bâtons Graphique en lignes Graphique en points Vertical © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > Graphique en points GRAPHIQUE EN POINTS Caractéristiques Chaque point doit être visible Jouer sur la taille Si chevauchement, choisir des formes dont le fond est transparent User de la couleur Formes peuvent varier pour distinguer les modalités (points, carrés, triangles, losanges, etc.) © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > Graphique en lignes (courbes) GRAPHIQUE EN LIGNES Caractéristiques Axe des y (vertical) devant partir à 0 (sauf si cela empêche de voir les petites différences entre les valeurs élevées) Ligne permettant de relier les points pour montrer la tendance Ajouter une ligne de référence lorsque significatif (par ex. la moyenne) Éviter d'avoir trop de styles différents pour distinguer les modalités © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > Graphique en bâtons GRAPHIQUE EN BÂTONS Caractéristiques Axe des bâtons devant partir à 0 (sauf si cela empêche de voir les petites différences entre les valeurs élevées) Horizontal : pour classement ou lorsque les intitulés des modalités sont trop longs pour une mise à la verticale Longueur des bâtons indique la valeur du caractère pour une modalité Largeur sans signification particulière (mais doit être le même pour tous les bâtons) Permet la comparaison des valeurs facilement © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > Graphique en secteurs GRAPHIQUE EN SECTEURS Caractéristiques Ajouter les valeurs des parts pour ne pas que l'évaluation ne repose que sur la comparaison physique des angles des parts Permet de mettre en avant une part par rapport aux autres Éviter d'avoir un trop grand nombre de parts (4-5 environ) © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > TYPES DE RELATIONS Types de relations représentées Classement Tri par rapport à un caractère Ex. : Classement des centres d'archives par rapport au nombre d'utilisateurs/utilisatrices Construction : . En ordre croissant ou décroissant de valeurs Types de graphique : . Bâtons verticaux ou horizontaux . Points Comparaison nominale Comparaison par rapport à un caractère Ex. : Comparaison du budget de plusieurs bibliothèques Types de graphique : . Points . Bâtons verticaux ou horizontaux Distribution Valeurs d'un caractère avec plusieurs modalités Ex. : Répartition des notes des étudiants/étudiantes par note littérale Type de graphique : . Histogramme (=graphique en bâtons verticaux sur des données regroupées en classes) Proportions Part des modalités d'un caractère Ex. : Part du budget pour les 4 principaux postes budgétaires Types de graphique : . Bâtons verticaux ou horizontaux (pourrait être empilé) . Secteurs Série temporelle Tendance dans le temps Ex. : Évolution du budget sur 5 ans Construction : . Axe horizontal pour échelle du temps . Étiquette pour chaque unité de temps Types de graphique : . Lignes . Points et lignes . Bâtons verticaux © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Mise en forme des graphiques MISE EN FORME DES GRAPHIQUES Principes ergonomiques Couleurs et motifs Pour distinguer les valeurs de différents caractères ou modalités Éviter de colorier le fond du graphique Éviter les rayures et autres motifs Quadrillage Si un quadrillage est nécessaire pour faciliter la lecture, privilégier le gris clair Éviter le quadrillage du graphique Étiquettes et légende Mettre la légende près des données Ne pas mettre de bordure à la légende Présenter la légende à la verticale Éviter les étiquettes en angle © Christine Dufour 2024, EBSI, Université de Montréal Cours 9 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Choix entre tableau et graphique TABLEAU OU GRAPHIQUE? Critères de choix Graphique Révéler des relations entre des valeurs multiples Visualiser la distribution des valeurs, les tendances Les deux en ajoutant la table des données au graphique! Tableau Avoir des données précises Comparer des valeurs individuelles Présenter plusieurs unités de mesure Regarder les valeurs individuelles © Christine Dufour 2024, EBSI, Université de Montréal