Plan du cours SCI1102 - Création et gestion de données de qualité (Hiver 2027)
Ce cours est nouvellement offert dans le cadre du Certificat en gestion de données et le Microprogramme de 1er cycle en gestion de données. Découvrez ces programmes en visitant leurs pages.
Avertissement : Le plan de cours cadre affiché ici présente l’intention générale du cours. L’enseignant·e peut toutefois ajuster certains éléments (activités, séquences, évaluations). Le plan de cours officiel qui sera communiqué en début de session prévaudra.
3 crédits
Concomitant : SCI1101
Description officielle
Outils et méthodes de création de jeux de données. Critères d'évaluation. Enjeux stratégiques et techniques du maintien de la qualité. Uniformisation et correction de données. Rôles des créateurs et utilisateurs. Architecture de données.
Objectifs généraux
- Sensibiliser les étudiant.e.s aux enjeux d’évaluation de qualité soulevés par la réutilisation de jeux de données préexistants
- Sensibiliser les étudiant.e.s au maintien de la qualité des données tout au long de leur gestion
- Amener les étudiant.e.s à développer des compétences concernant la création de données
Objectifs spécifiques
Au terme du cours, l’étudiant.e sera en mesure :
- D’expliquer le rôle des diverses parties prenantes à la gestion de données dans les opérations de création de jeux de données
- D’expliquer le rôle des diverses parties prenantes à la gestion de données dans les opérations de maintien de la qualité de jeux de données
- De contextualiser les besoins, les outils et les opérations appropriées pour la création ou l’évaluation de jeux de données selon le contexte spécifique
- D’appliquer les principes, lois ou règlements pertinents au maintien de la qualité des données
- De créer un jeu de données en utilisant des outils appropriés
- D’évaluer la qualité de jeux de données préexistants
- D’appliquer les traitements appropriés à un jeu de données, de manière à corriger les erreurs éventuelles et à assurer l’uniformisation du contenu
- De maîtriser les fonctionnalités de base d’outils usuels pour la création de jeux de données de qualité
- D’expliquer les fonctionnalités de base de logiciels avancés ou moins répandus pour la création de jeux de données de qualité
- D’appliquer des critères pour évaluer la qualité de données à diverses étapes de traitement
Contenu du cours
Module 1 : Contexte de la gestion de la qualité des données
- Définition de la gestion de la qualité des données : objectifs, opérations, outils
- Parties prenantes et leurs rôles dans la gestion de la qualité
Module 2 : Création de données de qualité
- Méthodes de création, p.ex. collecte, réutilisation, extraction, génération
- Outils de création : p.ex., logiciels de gestion de sondages, ...
Module 3 : Gestion de la qualité des données
-
Principes et méthodes
- À la création (p.ex., contrôle des outils et méthodes de collecte ou de génération)
- Lors de la réutilisation (p.ex., nettoyage et uniformisation)
- Tout au long du cycle de vie des données
-
Outils
- Architecture des données
- Logiciels spécialisés dans le nettoyage et l’uniformisation des données (p.ex., OpenRefine)
Évaluation
-
Travaux pratiques (50%)
- TP : Application d’une grille d’évaluation à un jeu de données spécifique
- TP : Nettoyage d’un jeu de données
- TP : Fusion de jeux de données multiples et uniformisation
- TP : Travail lié à la gestion de la qualité dans le cadre d’une architecture de données
- Examen intra (25%)
- Examen final (25%)