EBSI - Plan du cours : SCI6135 - Indexation de collections numériques (Hiver 2020) Passer au contenu

/ École de bibliothéconomie et des sciences de l'information

Rechercher

Plan du cours SCI6135 - Indexation de collections numériques (Hiver 2020)

3 crédits

Préalables : SCI6051, SCI6052, SCI6055

Chargée de cours : Marielle St-Germain
Courriel : marielle.st-germain@umontreal.ca

Site Web du cours : https://studium.umontreal.ca/course/view.php?id=167558


Les cours se donnent le mercredi de 13h00 à 16h00, C-2043 du Pavillon Lionel-Groulx.


Description officielle

Indexation traditionnelle, automatique, collaborative. Bibliothèques numériques (collections textuelles et non textuelles bibliothéconomiques, archivistiques, muséales). Métadonnées : types, normes, encodage. Web sémantique.

Objectifs d'apprentissage

Ce cours vise à...

  1. initier les étudiants aux approches diverses utilisées pour l'indexation de collections de documents numériques

    Plus précisément :

    1. effectuer l'indexation de documents numériques de différents types;
    2. expliquer les différences entre l’indexation humaine (traditionnelle experte ou collaborative) et l’indexation automatique pour les collections de documents numériques;
    3. définir les types de métadonnées utiles pour décrire une collection numérique donnée;
    4. effectuer l'indexation de documents numériques en suivant un schéma de métadonnées;
    5. encoder des métadonnées selon divers formats;
    6. décrire les outils et méthodes du Web sémantique.
  2. aborder les questions d'indexation dans le cadre des bibliothèques numériques.

    Plus précisément :

    1. décrire différents types de collections et bibliothèques numériques;
    2. identifier les modes d’indexation utilisés dans les bibliothèques numériques;
    3. comprendre les interactions entre les propriétés des documents d’une collection et les métadonnées et les méthodes d’indexation appropriées pour la décrire;
    4. énoncer les propriétés des collections numériques exemplaires.

Méthodes pédagogiques

• exposés magistraux
• conférenciers invités
• ateliers au laboratoire d'informatique
• travaux pratiques
• démonstrations de logiciels
• lectures obligatoires
 

Contenu du cours

Le cours débute par une introduction portant sur le contexte historique, technologique et social de l’indexation de collections numériques. 

Une première section porte sur les propriétés des collections numériques et des documents numériques qu’elles contiennent. Nous examinerons les types de collections (bureautique, web, bibliothèques numériques) et les propriétés de certaines collections particulières. Nous verrons également les types de documents ainsi que leurs caractéristiques et problématiques particulières, dont les documents textuels, visuels, sonores, multimédia, etc. Nous aborderons aussi les distinctions utiles entre les documents d’archives et les documents bibliothéconomiques et autres. 

Une deuxième section du cours aborde la notion de métadonnée, en présentant notamment des définitions, une typologie et la question de la normalisation des métadonnées. Nous examinerons ensuite les méthodologies et les formats d’encodage. Cette section comporte davantage d’aspects pratiques et d’expérimentation en laboratoire. 

Une troisième section explore les différents types d’indexation réalisés pour les collections numériques : l’indexation traditionnelle manuelle, l’indexation collaborative, l’indexation automatique; l’indexation dans le contexte du Web sémantique. 

La dernière section aborde les environnements d’implémentation de collections numériques. Une attention particulière sera portée aux bibliothèques numériques. 

Calendrier des activités

DateActivité(s)Évaluation
2020-01-08

Introduction au cours

 
2020-01-15

Documents numériques : formats et propriétés. Collections numériques : types et propriétés. Bibliothèques numériques.

Atelier exercice - 15h00-16h00

Évaluation d’une collection numérique (exercice obligatoire non évalué)

 

2020-01-22

Métadonnées I

  • Définitions, typologie
  • Schémas de métadonnées 

Atelier TP1 - 14h30-16h00

 

TP1 - Énoncé

 

2020-01-29

Approches d'indexation I

  • Experte traditionnelle
  • Collaborative

 

 
2020-02-05

Approches d'indexation II

  • Sémantique et sémiotique
  • Indexation humaine de l'image

TP1 - Remise

TP2 - Énoncé

 

 

2020-02-12

Métadonnées II

  • Encodage

 

Travail final - Énoncé
2020-02-19

Approches d'indexation III

  • Indexation automatique de documents textuels et d'images

TP2 - Remise

TP3 - Énoncé

2020-02-26

Approches d'indexation IV

  • Indexation de la musique
  • Conférencière invitée (à confirmer)

Atelier TP3 - 14h30-16h00

 
2020-03-04

Semaine de lecture - pas de cours.

 
2020-03-11

Approches d'indexation V

  • Indexation d'images en mouvement

TP3 - Remise

2020-03-18

Métadonnées III

  • Vers le Web sémantique

Atelier TP4 - 14h30-16h00

TP4 - Énoncé

2020-03-25

Approches d'indexation VI

  • Indexation de documents sonores
Atelier TP4 - 14h30-16h00

Soumission du sujet pour le travail final (date limite)

2020-04-01

Approches d'indexation VII

  • Indexation sémantique

 

 

2020-04-08

Séance consacrée au travail final

TP4 - Remise

2020-04-15

Présentations orales

 
2020-04-22

Présentations orales

 
2020-04-29

Remise du travail final

Travail final - Remise

 Calendrier provisoire au 5 janvier 2020.

La matière et sa répartition dans les cours peuvent être sujettes à des changements en fonction de la vitesse de progression et de la disponibilité des conférenciers.

Évaluation

Travaux pratiques d’application (en équipes de deux) : 50 %

  • Quatre travaux pratiques sur l’indexation ou sur l’encodage de métadonnées pour des ressources numériques
    • Application d'un schéma de métadonnées à une collection (TP1) - 5 février - 15 %
    • Indexation d'une collection non textuelle (TP2) - 19 février - 15 %
    • Comparaison d'une indexation manuelle et automatique (TP3) - 11 mars - 10 %
    • Encodage de métadonnées en RDF (TP4) - 8 avril - 10 %

Travail final et présentation orale (individuel): 50 %

  • Exploration d’un sujet touchant une approche d’indexation, un type de métadonnées ou une collection, ou bien l'indexation d’une collection numérique
    • Présentation orale et plan détaillé - 8 et 22 avril - 5 %
    • Travail écrit - 29 avril - 45 %

 

Lien entre les objectifs spécifiques et la validation des apprentissages

 Évaluation d’une collection numérique (exercice non évalué)Attribution de métadonnées Dublin Core à une collectionIndexation d’une collection non textuelleComparaison d’une indexation manuelle et automatiqueEncodage de métadonnées en RDFTravail final
effectuer l'indexation de documents numériques de différents types;XXXX
expliquer les différences entre l’indexation humaine (traditionnelle experte ou collaborative) et l’indexation automatique pour les collections de documents numériques;XX
définir les types de métadonnées utiles pour décrire une collection numérique donnée;X
effectuer l'indexation de documents numériques en suivant un schéma de métadonnées;XX
encoder des métadonnées selon divers formats;XXX
décrire les outils et méthodes du Web sémantique.X
décrire différents types de collections et bibliothèques numériques;XX
identifier les modes d’indexation utilisés dans les bibliothèques numériques;XXX
comprendre les interactions entre les propriétés des documents d’une collection et les métadonnées et les méthodes d’indexation appropriées pour la décrire;XXXXX
énoncer les propriétés des collections numériques exemplaires.X

Politiques, règlements et directives

L’ensemble des politiques, règlements et directives énoncés dans le guide étudiant s’appliquent. Une attention particulière est à porter aux éléments suivants.

Délais et dates de remise des travaux
Les retards seront traités conformément à la politique de l'EBSI (voir le Guide de l'étudiant).

Règlement disciplinaire sur le plagiat ou sur la fraude concernant les étudiants
Il est attendu que tous les étudiants inscrits au cours respectent le code d'honneur de l'EBSI (http://www.ebsi.umontreal.ca/sout/code-honneur.html). Le plagiat à l'Université de Montréal est sanctionné par le Règlement disciplinaire sur la fraude et le plagiat concernant les étudiants. Pour plus de renseignements, consultez le site www.integrite.umontreal.ca.

Qualité de la langue
La professeure tiendra compte de la qualité du français dans l'évaluation des travaux et peut enlever jusqu’à 10 % de la note (voir Guide de l'étudiant).

Mode de communication
Le mode de communication privilégié entre la professeure et les étudiant(e)s est le courriel. Veuillez vous assurer que vous êtes officiellement inscrit(e) au cours et maintenez à jour l'adresse de courriel enregistrée dans votre profil informatique à l'Université de Montréal. Vous devez lire votre courriel très régulièrement (au moins une fois par jour), des informations importantes concernant le cours ou les TP pouvant être diffusées par ce moyen.
Très important : pour toute correspondance concernant le cours, veuillez inscrire obligatoirement au début du champ sujet du message la chaîne suivante : [SCI6135] (incluant les crochets).
 

Ressources

Les lectures obligatoires et suggérées seront précisées en cours de session.

Autre information

Bien que le cours SCI6133 - Indexation et condensation ne soit pas un préalable à ce cours SCI6135, les étudiants ayant suivi SCI6133 auront acquis une expertise en indexation qui leur permettra de saisir certains enjeux importants. Les étudiants n'ayant pas ce préalable pourront également réussir ce cours (notamment, un exposé rapide sur l'indexation sera présenté au début du cours 4) mais en auront une expérience différente.