EBSI - Plan du cours : SCI6201 - Introduction à la gestion des données (Automne 2020) Passer au contenu

/ École de bibliothéconomie et des sciences de l'information

Rechercher

Plan du cours SCI6201 - Introduction à la gestion des données (Automne 2020)

3 crédits

Professeure titulaire : Lyne Da Sylva
Courriel : Lyne.Da.Sylva@UMontreal.CA
Téléphone : 514 343-7400
Bureau : C-2012, Pavillon Lionel-Groulx
Disponibilités : mardi 15h-17h ou sur rendez-vous

Description officielle

Typologie de données : ouvertes, liées, massives, de recherche; caractéristiques de chacune. Étapes et enjeux du traitement. Technologies pour leur gestion : formats, logiciels. Aspects éthiques et juridiques.

Objectifs d'apprentissage

Le cours vise les objectifs généraux ci-dessous. 

  1. Familiariser les étudiants avec les différents enjeux soulevés par la gestion des données de divers types.

    Au terme du semestre, l’étudiant(e) sera en mesure …

    1. définir les types de données et les enjeux associés à chaque type;
    2. d'identifier les parties prenantes dans la gestion de données et leurs rôles respectifs;
    3. de décrire les étapes du cycle de vie et de gestion des données;
    4. d'expliquer les aspects éthiques et juridiques de la gestion des données.
  2. Donner une formation technique et pratique sur l’utilisation de logiciels particuliers pour leur gestion.

    Au terme du semestre, l’étudiant(e) sera en mesure …

    1. de décrire des ressources technologiques appropriées (formats, logiciels) pour la gestion des types de données;
    2. d’effectuer certains traitements spécifiques sur des données.

Méthodes pédagogiques

Cours magistraux. Démonstration de logiciels. Travaux pratiques. Conférenciers et conférencières invités. Lectures obligatoires.

Contenu du cours

Une première partie du cours couvrira la typologie des données :

  • données ouvertes (des administrations publiques, des sociétés commerciales, des organismes de recherche, etc.);
  • données liées du web sémantique;
  • données massives ou mégadonnées (Big Data) issues de diverses sources;
  • données de la recherche, produites par les chercheurs dans le cadre de projets de recherche institutionnels ou privés.

Les étudiants seront initiés aux ressources disponibles pour gérer les données, selon leur type :

  • organismes impliqués;
  • environnements technologiques;
  • documentation pertinente;

Ceci couvrira, par exemple, les formats et environnements du web sémantique pour les données liées, les dépôts pour les données de la recherche ou les licences de partage et réutilisation pour les données ouvertes).

Les milieux interpellés ainsi que les intervenants types seront détaillés pour chaque type de données :

  • pour les données de recherche : les milieux de la recherche, universitaire ou autre;
  • pour les données ouvertes : les milieux des archives, en particulier les archives gouvernementales;
  • pour les données liées : tous les milieux pour lesquels la diffusion et le partage d’information sont importants, notamment le secteur culturel;
  • pour les données massives : divers milieux de recherche, milieux financiers ou économiques, etc.

Les étudiants verront quels traitements doivent être développés plus particulièrement pour chaque type de données :

  • opérations documentaires classiques : description, organisation, préservation, curation, diffusion, repérage;
  • autres opérations, selon le cas : pratiques de citation de jeux de données, évaluation de la qualité des données ouvertes, transcodage d’un format à un autre pour les données liées, analyse et visualisation de grands ensembles de données.

Pour chaque type de données (et selon le cas), les enjeux du traitement et de la gestion seront abordés :

  • enjeux pratiques (volume, méthodes de collecte, accessibilité, qualité);
  • enjeux technologiques (pérennité, préservation, sécurité, outils et méthodes de traitement);
  • enjeux éthiques et juridiques (confidentialité, propriété intellectuelle);
  • enjeux scientifiques (statut ontologique des données, impact sur la conduite de la recherche, impact du partage et de la réutilisation des données);
  • enjeux économiques (coûts, bénéfices).

Note : le cours est conçu comme faisant partie du programme de maîtrise en sciences de l’information, et par conséquent plusieurs parallèles seront faits avec les sciences de l’information. Cependant, le cours est ouvert aux étudiants d’autre programmes; des ajustements seront faits pour tenir compte de la provenance des étudiants inscrits.

Calendrier des activités

	Section en chantier

Politiques, règlements et directives

L’ensemble des politiques, règlements et directives énoncés dans le Guide de l’étudiant de la maîtrise en sciences de l’information s’applique. Ce guide peut être consulté à l’adresse suivante :

https://wiki.umontreal.ca/pages/viewpage.action?pageId=124093925.

Certains éléments jugés cruciaux sont repris ici.

Délais et dates de remise des travaux

Les retards seront traités conformément à la politique de l'EBSI (voir la section pertinente dans le Guide de l'étudiant à la maîtrise en sciences de l'information).

Règlement disciplinaire sur le plagiat ou sur la fraude concernant les étudiants

Il est attendu que tous les étudiants inscrits au cours respectent le code d'honneur de l'EBSI (https://ebsi.umontreal.ca/ressources-services/ressources-pedagogiques/code-honneur/). Le plagiat à l'Université de Montréal est sanctionné par le Règlement disciplinaire sur la fraude et le plagiat concernant les étudiants. Pour plus de renseignements, consultez le site https://integrite.umontreal.ca/accueil/.

Qualité de la langue

La professeure tiendra compte de la qualité du français dans l'évaluation des travaux et peut enlever jusqu’à 10 % de la note (voir Guide de l'étudiant).

Mode de communication

Le mode de communication privilégié entre la professeure et les étudiant(e)s est le courriel. Veuillez vous assurer que vous êtes officiellement inscrit(e) au cours et maintenez à jour l'adresse de courriel enregistrée dans votre profil informatique à l'Université de Montréal. Vous devez lire votre courriel très régulièrement (au moins une fois par jour), des informations importantes concernant le cours ou les TP pouvant être diffusées par ce moyen.

Très important : Pour toute correspondance concernant le cours, veuillez inscrire obligatoirement au début du champ sujet du message la chaîne suivante : [SCI6201] (incluant les crochets).