Plan du cours SCI6201 - Introduction à la gestion des données (Automne 2025)
3 crédits
Professeure : Lyne Da Sylva
Courriel : Lyne.Da.Sylva@UMontreal.CA
Téléphone : 514 343-7400
Bureau : C-2012, Pavillon Lionel-Groulx
Disponibilités : jeudi 15h-17h ou sur rendez-vous (via Teams/Zoom, par téléphone ou en personne)
Site Web du cours : https://studium.umontreal.ca/course/section.php?id=1909575
Les cours se donnent le vendredi 8h30-11h30.
Description officielle
Typologie de données : ouvertes, liées, massives, de recherche; caractéristiques de chacune. Étapes et enjeux du traitement. Technologies pour leur gestion : formats, logiciels. Aspects éthiques et juridiques.
Objectifs d'apprentissage
Le cours vise les objectifs généraux ci-dessous.
- Familiariser les étudiantes et étudiants avec les différents enjeux soulevés par la gestion des données de divers types.
Au terme du trimestre, l'étudiante ou l'étudiant sera en mesure …
- de distinguer les différents types de données;
- d’adapter la gestion des données en fonction des enjeux associés à chaque type
- d'identifier les parties prenantes dans la gestion de données et leurs rôles respectifs;
- de situer les opérations de gestion des données dans les étapes de leur cycle de vie
- d'expliquer les aspects sociaux, professionnels, éthiques et juridiques de la gestion des données.
- Donner une formation technique et pratique sur l’utilisation de logiciels particuliers pour leur gestion.
Au terme du trimestre, l'étudiante ou l'étudiant sera en mesure …
- d'utiliser des ressources technologiques appropriées (formats, logiciels, etc.) pour la gestion des données;
- d’effectuer certains traitements spécifiques sur des données.
Méthodes pédagogiques
Cours magistraux. Démonstration de logiciels. Discussions et activités pratiques en classe. Travaux pratiques. Conférences invitées. Lectures obligatoires. Visionnement de vidéos.
Contenu du cours
Le cours est segmenté en trois modules, détaillés ci-dessous. Les modules s’enchevêtrent dans le calendrier du cours, pour assurer une progression logique des apprentissages.
Module 1 : Typologie des données
Une première partie de ce module couvrira la typologie des données :
- données ouvertes (des administrations publiques, des sociétés commerciales, des organismes de recherche, etc.);
- données liées du web sémantique;
- données massives ou mégadonnées (Big Data) issues de diverses sources;
- données de la recherche, produites par les chercheurs dans le cadre de projets de recherche institutionnels ou privés;
- renseignements personnels (données confidentielles).
Les étudiantes et étudiants seront initiés aux ressources disponibles pour gérer les données, selon leur type :
- organismes impliqués;
- environnements technologiques;
- documentation pertinente;
Ceci couvrira, par exemple, les formats et environnements du web sémantique pour les données liées, les dépôts pour les données de la recherche ou les licences de partage et réutilisation pour les données ouvertes.
Module 2 : Traitements appliqués aux données
Les étudiantes et étudiants verront quels traitements doivent être développés plus particulièrement pour chaque type de données :
- opérations documentaires classiques : description, organisation, préservation, curation, diffusion, repérage;
- autres opérations, selon le cas : pratiques de citation de jeux de données, évaluation de la qualité des données ouvertes, transcodage d’un format à un autre pour les données liées, analyse et visualisation de grands ensembles de données.
Module 3 : Éléments de contexte de la gestion des données
Les milieux interpellés ainsi que les parties prenantes seront détaillés pour chaque type de données :
- pour les données de recherche : les milieux de la recherche, universitaire ou autre;
- pour les données ouvertes : les milieux des archives, en particulier les archives gouvernementales;
- pour les données liées : tous les milieux pour lesquels la diffusion et le partage d’information sont importants, notamment le secteur culturel;
- pour les données massives : divers milieux de recherche, milieux financiers ou économiques, etc.;
- pour les renseignements personnels : milieux archivistiques ou le secteur commercial.
Également, pour chaque type de données (et selon le cas), les enjeux du traitement et de la gestion seront abordés :
- enjeux pratiques (volume, méthodes de collecte, accessibilité, qualité);
- enjeux technologiques (pérennité, préservation, sécurité, outils et méthodes de traitement);
- enjeux éthiques et juridiques (confidentialité, propriété intellectuelle);
- enjeux scientifiques (statut ontologique des données, impact sur la conduite de la recherche, impact du partage et de la réutilisation des données);
- enjeux économiques (coûts, bénéfices).
Note : le cours est conçu comme faisant partie du programme de maîtrise en sciences de l’information, et par conséquent plusieurs parallèles seront faits avec les sciences de l’information. Cependant, le cours est ouvert aux étudiantes et étudiants d’autre programmes; des ajustements seront faits pour tenir compte de la provenance des personnes inscrites.
Calendrier des activités
| Date | Thématiques abordées | Travaux ou évaluation |
|---|---|---|
| 2025-09-05 | Introduction au cours | |
| 2025-09-12 | Données ouvertes : enjeux, traitements, ressources associées Renseignements personnels (données sensibles) : enjeux, traitements, ressources associées. | Énoncé du travail final |
| 2025-09-19 | Traitements appliqués aux données I : chaîne de traitements; prétraitement | Énoncé du TP1 : nettoyage de données avec OpenRefine |
| 2025-09-26 | Données massives I : enjeux, traitements, ressources associées Données de recherche I : enjeux, traitements, ressources associées | |
| 2025-10-03 | Données liées I : enjeux, traitements, ressources associées | |
| 2025-10-10 | Traitements appliqués aux données II : description | Remise du TP1 Énoncé du TP2 : description de données de recherche |
| 2025-10-17 | Données de recherche II : plans de gestion de données; diffusion de jeux de données Conférence invitée : à confirmer | Travail final – remise de la partie 1 |
| 2025-10-24 | Semaine de lecture – pas de cours | |
| 2025-10-31 | Données massives II : analyse et visualisation Visite au Laboratoire de visualisation (campus MIL) Conférence invitée : Anton Boudreau Ninkov (EBSI) | Remise du TP2
|
| 2025-11-07 | Données liées II : technologies du web sémantique | Énoncé du TP3 : encodage de données liées en RDF |
| 2025-11-14 | Traitements appliqués aux données III : création.
|
|
| 2025-11-21 | Environnement de la gestion des données I Cycle de vie et de gestion des données; Impacts professionnels et disciplinaires |
|
| 2025-11-28 | Environnement de la gestion des données II
Aspects sociaux, éthiques et juridiques
Conférence invitée : Dominic Boisvert (TI, UdeM) et Aurélie Dubois (DAGI, UdeM) Conférence invitée : Alexis Hamel (Ville de Montréal) | Remise du TP3 |
| 2025-12-05 | Environnement de la gestion des données III Sujets connexes : internet des objets, science ouverte, science des données
| Atelier facultatif pour travail final |
| 2025-12-12 | Pas de cours
| Travail final - remise de la partie 2 |
Calendrier des activités
Calendrier en date du 19 août 2025
La matière et sa répartition sont sujettes à changement, selon la vitesse de progression et la disponibilité de conférenciers ou conférencières.
Évaluation
|
Type |
Description |
Échéance |
Pondération |
|
TP1 |
Nettoyage de données |
10 oct. |
25% |
|
TP2 |
Description de données de recherche |
31 oct. |
25% |
|
TP3 |
Données liées – encodage en RDF |
28 nov. |
25% |
|
Travail final Diffusion d’un jeu de données avec sa description |
Partie 1 – création d'un compte Github |
17 oct. |
5% |
|
Partie 2 – diffusion |
12 déc. 17h |
20% |
Lien entre les objectifs spécifiques et la validation des apprentissages
| TP1 - Nettoyage de données | TP2 - Description de données de recherche | TP3 - Données liées – encodage en RDF | Travail final : publication de données | |
|---|---|---|---|---|
| de distinguer les différents types de données; | X | X | ||
| d’adapter la gestion des données en fonction des enjeux associés à chaque type | X | X | X | X |
| d'identifier les parties prenantes dans la gestion de données et leurs rôles respectifs; | X | X | ||
| de situer les opérations de gestion des données dans les étapes de leur cycle de vie | X | X | ||
| d'expliquer les aspects sociaux, professionnels, éthiques et juridiques de la gestion des données. | X | |||
| d'utiliser des ressources technologiques appropriées (formats, logiciels, etc.) pour la gestion des données; | X | X | X | X |
| d’effectuer certains traitements spécifiques sur des données. | X | X | X | X |
Politiques, règlements et directives
L’ensemble des politiques, règlements et directives énoncés dans le Guide étudiant de la maîtrise en sciences de l’information s’applique. Ce guide peut être consulté à l’adresse suivante :
https://wiki.umontreal.ca/pages/viewpage.action?pageId=124093925.
Certains éléments jugés cruciaux sont repris ici.
Délais et dates de remise des travaux
Les retards seront traités conformément à la politique de l'EBSI (voir la section pertinente dans le Guide étudiant de la maîtrise en sciences de l'information).
Règlement disciplinaire sur le plagiat ou sur la fraude concernant les étudiants
Il est attendu que tous les étudiant.e.s inscrit.e.s au cours respectent le code d'honneur de l'EBSI (https://ebsi.umontreal.ca/ressources-services/ressources-pedagogiques/code-honneur/). Le plagiat à l'Université de Montréal est sanctionné par le « Règlement disciplinaire sur la fraude et le plagiat concernant les étudiants ». Pour plus de renseignements, consultez le site https://integrite.umontreal.ca/accueil/.
Respect du droit d'auteur concernant le matériel de cours
"La prestation des cours est soumise au droit d'auteur. L’enregistrement sonore ou visuel d'un cours est strictement interdit à moins d’obtenir au préalable une autorisation écrite de l’enseignante ou de l'enseignant au moyen du Formulaire prévu à cet effet en précisant que la permission écrite d’enregistrer ne donne pas la permission de diffuser l’enregistrement.
Les étudiantes et étudiants en situation en handicap doivent présenter à l'enseignante ou l'enseignant, au début du cours, la lettre de mesures d'accommodement du SESH qui leur accorde le droit d'enregistrer les cours." (https://wiki.umontreal.ca/display/EBSI/Guides+%3E+Code+d%27honneur+de+l%27EBSI)
Utilisation de l'intelligence artificielle générative
Bien que l’exécution des travaux par une autre personne demeure interdite, l’utilisation d’une technologie d’intelligence artificielle pour vous accompagner dans sa réalisation est permise.
Cependant, vous devez citer ChatGPT comme n’importe quelle autre source d’information. Bien que les façons de citer demeurent à éclaircir (il n’y a pas encore de consensus dans la communauté), vous trouverez sur le site des bibliothèques des indications et des ressources pour apprendre à citer ChatGPT et autres semblables.
Qualité de la langue
La professeure tiendra compte de la qualité du français dans l'évaluation des travaux et peut enlever jusqu’à 10 % de la note (voir la section pertinente du Guide étudiant).
Mode de communication
Pour les questions administratives, le mode de communication privilégié entre la professeure et les étudiantes et étudiants est le courriel. Veuillez inscrire obligatoirement au début du champ sujet du message la chaîne suivante : [SCI6201] (incluant les crochets). Veuillez vous assurer que vous êtes officiellement inscrit.e au cours et maintenez à jour l'adresse de courriel enregistrée dans votre profil informatique à l'Université de Montréal. Vous devez lire votre courriel très régulièrement (au moins une fois par jour), des informations importantes concernant le cours ou les TP pouvant être diffusées par ce moyen.
Pour les questions académiques concernant le cours, veuillez utiliser le forum dans l’espace StudiUM du cours.
Ressources
Lectures
Des lectures obligatoires feront l’objet de discussions en classe et soutiennent l’apprentissage nécessaire pour réaliser les travaux. D’autres lectures sont recommandées : elles aident à mieux comprendre la matière du cours, à donner des informations additionnelles pour les travaux ou à approfondir certaines notions.
Informatique générale
N’oubliez pas que vous avez accès à la trousse d’autoformation aux compétences informatiques de base, si vous voulez valider certaines techniques, outils ou procédures.
Autre
L’évaluation des travaux se fait selon le barème présenté dans le Guide étudiant de la maîtrise en sciences de l’information, en utilisant des notes littérales, avec les précisions suivantes :
|
Lettres |
Significations |
Points |
Critères d’évaluation |
|
A+ |
Exceptionnel |
4,3 |
La note A+ est réservée aux travaux exceptionnels qui dépassent les exigences demandées. |
|
A |
Excellent Très bon |
4,0 |
Travaux excellents ou très bons qui répondent exactement aux exigences demandées. |
|
B+ |
Bon |
3,3 |
Travaux qui répondent aux exigences demandées, avec certaines erreurs mineures ou relativement mineures. |
|
C+ |
Passable |
2,3 |
Travaux qui ne rencontrent qu’à moitié les exigences demandées ou qui comportent quelques erreurs importantes. |
|
C- D+ D |
Échec |
1,7
1,3 |
Travaux qui ne rencontrent que partiellement les exigences demandées ou qui comportent des erreurs graves. |
|
E F |
0,5 |
La note E est attribuée aux travaux qui ne répondent pas aux exigences demandées. |