EBSI - Plan du cours SCI6135 - Indexation de collections numériques (Hiver 2014) Passer au contenu

/ École de bibliothéconomie et des sciences de l'information

Je donne

Rechercher

Navigation secondaire

Plan du cours SCI6135 - Indexation de collections numériques (Hiver 2014)

Préalables : SCI6051, SCI6052, SCI6055

Professeure : Lyne Da Sylva
Courriel : Lyne.Da.Sylva@UMontreal.CA
Téléphone : 514 343-6444
Bureau : C-2030, Pavillon Lionel-Groulx
Disponibilités : le mercredi de 15h à 17h (et sur rendez-vous)

Site Web du cours : https://studium.umontreal.ca/course/view.php?id=49053


Les cours se donnent le mercredi 8:30-11:30.


Description officielle

Indexation traditionnelle, automatique, collaborative. Bibliothèques numériques (collections textuelles et non textuelles bibliothéconomiques, archivistiques, muséales). Métadonnées : types, normes, encodage. Web sémantique.

Objectifs d'apprentissage

 Le cours vise les objectifs généraux suivants :

  1. initier les étudiants aux approches diverses utilisées pour l’indexation de collections de documents numériques;

    Plus précisément :

    1. d'effectuer l'indexation de documents numériques de différents types;
    2. d’expliquer les différences entre l’indexation humaine (traditionnelle experte ou collaborative) et l’indexation automatique pour les collections de documents numériques;
    3. de définir les types de métadonnées utiles pour décrire une collection numérique donnée;
    4. d'effectuer l'indexation de documents numériques en suivant un schéma de métadonnées précis
    5. d’encoder des métadonnées selon divers formats;
    6. de nommer des efforts de normalisation des métadonnées;
    7. de décrire les outils et méthodes du web sémantique;
  2. aborder la problématique de l'indexation dans le cadre des bibliothèques numériques.

    Plus précisément :

    1. de décrire différents types de collections et bibliothèques numériques;
    2. d’identifier les modes d’indexation utilisées dans les bibliothèques numériques;
    3. de comprendre les interactions entre les propriétés des documents d’une collection et les métadonnées et les méthodes d’indexation appropriées pour la décrire.
    4. d’énoncer les propriétés des collections numériques exemplaires;

Méthodes pédagogiques

• exposés magistraux
• conférenciers invités
• ateliers au laboratoire informatique
• démonstrations de logiciels
• lectures obligatoires
 

Contenu du cours

Nouvelle description (dès janvier 2014) :

Collections textuelles et non textuelles; bibliothéconomiques, archivistiques, muséales. Bibliothèques numériques. Métadonnées : types, normes, encodage. Indexation traditionnelle, automatique, collaborative. Web sémantique.

 

Le cours débute par une introduction portant sur le contexte historique, technologique et social de l’indexation de collections numériques.

Une première section porte sur les propriétés des collections numériques et des documents numériques qui y sont contenus. Nous examinerons les types de collections (bureautique, web, bibliothèques numériques,...), et les propriétés de certaines collections particulières. Nous verrons également les types de documents ainsi que leurs caractéristiques et problématiques particulières, dont les documents textuels, visuels, sonores, multimédia, etc. Nous aborderons aussi les distinctions utiles entre les documents d’archives et les documents bibliothéconomiques ou autres.

Une deuxième section du cours aborde la notion de métadonnées, en présentant notamment des définitions, une typologie et la question de normalisation des métadonnées. Nous examinerons ensuite les méthodologies et les formats d’encodage. Cette section comporte davantage d’aspects pratiques et d’expérimentation en laboratoire.

Une troisième section explore les différents types d’indexation réalisés pour les collections numériques : l’indexation traditionnelle manuelle; l'indexation collaborative; l’indexation automatique; l’indexation dans le cadre du Web sémantique.

La dernière section aborde les environnements d’implémentation de collections numériques. Une attention particulière sera portée aux bibliothèques numériques.
 

Calendrier des activités

DateActivité(s)Évaluation
2014-01-08

Introduction au cours

 
2014-01-15

Documents numériques : formats et propriétés.

Collections numériques : types et propriétés

 

Évaluation d’une collection numérique (exercice non évalué)

2014-01-22

Métadonnées I

  • définitions et typologie;
  • indexation avec schémas de métadonnées.


 

Exploration de  schémas de métadonnées (exercice non évalué)

Énoncé TP1

Atelier en laboratoire sur le TP1

2014-01-29

Approches d’indexation I

  • introduction;
  • indexation experte tradtionnelle;
  • indexation collaborative.

 

 
2014-02-05

Approches d’indexation II

  • sémantique et sémiotique
  • indexation humaine de l'image
     

Remise TP1

Énoncé TP2 : Indexation d’une collection non textuelle

2014-02-12

Approches d'indexation III

  • indexation d'images en mouvement.

Atelier sur TP2 - 10h-11h30

 
2014-02-19

Métadonnées II : encodage

  • encodage pour documents de bureautique
  • conventions de nommage
  • métadonnées en HTML
 
2014-02-26

 Métadonnées II : encodage (suite)

  • XML (rappels)
  • RDF
  • moissonnage

Atelier sur le TP3 - 10h30-11h30

Remise TP2

Énoncé TP3 : Encodage de métadonnées en RDF

2014-03-05

Semaine de lecture - pas de cours

 

 
2014-03-12

Approches d’indexation IV : indexation automatique

  • introduction
  • indexation de documents textuels
  • indexation d'images
     

Remise TP3

Énoncé TP4 : Évaluation d'une méthode d'indexation automatique

2014-03-19

Approches d’indexation V

  • indexation de la musique - conférencière invitée : Audrey Laplante, EBSI (à confirmer)
  • indexation de documents sonores


 

2014-03-26

Approches d’indexation VI :

  • Web sémantique – conférencier invité : Éric Charton, École Polytechnique de Montréal

Atelier sur le TP4

 
2014-04-02

Environnements d’implémentation.

  • Conférencière invitée : Élodie Gagné,  Médiathé­caire, Radio-Canada
  • Conférencier invité : Luc Grondin, Érudit (Université de Montréal) (à confirmer)

Remise TP4

2014-04-09

Période de consultation pour le travail final.

 
2014-04-16

Présentations orales

 Présentation orale

2014-04-30

Remise des travaux

Remise des travaux

 Calendrier provisoire au 7janvier 2014.

La matière et sa répartition dans les cours peuvent être sujettes à des changements en fonction de la vitesse de progression et de la disponibilité des conférenciers.

Évaluation

Travaux pratiques d’application : 65 %

  • Quatre TP sur sur les collections numériques ou l’encodage de métadonnées pour des ressources numériques.
    • Définition d'un profil de métadonnées pour une collection donnée - 5 février - 15%
    • Indexation d’une collection non textuelle - 26 février - 20%
    • Évaluation de l’indexation automatique d’un ensemble de documents - 12 mars - 15%
    • Encodage de métadonnées en RDF - 2 avril - 15%


Travail de recherche : 35%

  • Exploration d’un sujet touchant une approche d’indexation, un type de métadonnées ou une collection.
    • Présentation orale  - 16 avril  10%
    • Travail écrit - 30 avril - 25%

L’évaluation des travaux se fait selon le barème présenté dans le Guide de l’étudiant (p. 27), avec les précisions suivantes :

Lettres

Significations

Points

Critères d’évaluation

 

A+

Exceptionnel

4,3

La note A+ est réservée aux travaux exceptionnels qui dépassent les exigences demandées.

 

A
A-

Excellent

Très bon

4,0
3,7

Travaux excellents ou très bons qui répondent exactement aux exigences demandées.

 

B+
B
B-

Bon

3,3
3,0
2,7

Travaux qui répondent aux exigences demandées, avec certaines erreurs mineures ou relativement mineures.

 

C+
C

Passable

2,3
2,0

Travaux qui ne rencontrent qu’à moitié les exigences demandées ou qui comportent quelques erreurs importantes.

 

C-

D+

D

Échec

1,7

1,3
1,0

Travaux qui ne rencontrent que partiellement les exigences demandées ou qui comportent des erreurs graves.

 

0,5
0,0

La note E est attribuée aux travaux qui ne répondent pas aux exigences demandées.
La note F est attribuée lorsqu’un travail ou un examen n’est pas remis ou lorsqu’un travail est remis après la date d’échéance fixée par le professeur, ou dans un cas de plagiat, copiage ou fraude.

 

E
F

 

 

Lien entre les objectifs spécifiques et la validation des apprentissages

 Évaluation d’une collection numérique (exercice non évalué)Exploration de schémas de métadonnées (exercice non évalué)Définition d'un profil de métadonnées pour une collection donnéeIndexation d’une collection non textuelleÉvaluation de l’indexation automatique d’un ensemble de documentsEncodage de métadonnées en RDFTravail de recherche
d'effectuer l'indexation de documents numériques de différents types;XX
d’expliquer les différences entre l’indexation humaine (traditionnelle experte ou collaborative) et l’indexation automatique pour les collections de documents numériques;X
de définir les types de métadonnées utiles pour décrire une collection numérique donnée;XXXX
d'effectuer l'indexation de documents numériques en suivant un schéma de métadonnées précisX
d’encoder des métadonnées selon divers formats;XX
de nommer des efforts de normalisation des métadonnées;XXX
de décrire les outils et méthodes du web sémantique;X
de décrire différents types de collections et bibliothèques numériques;XXXX
d’identifier les modes d’indexation utilisées dans les bibliothèques numériques;XXX
de comprendre les interactions entre les propriétés des documents d’une collection et les métadonnées et les méthodes d’indexation appropriées pour la décrire.XXXXXX
d’énoncer les propriétés des collections numériques exemplaires;X

Politiques, règlements et directives

L’ensemble des politiques, règlements et directives énoncés dans le guide étudiant s’appliquent. Une attention particulière est à porter aux éléments suivants.

Délais et dates de remise des travaux
Les retards seront traités conformément à la politique de l'EBSI (voir le Guide de l'étudiant).

Règlement disciplinaire sur le plagiat ou sur la fraude concernant les étudiants
Il est attendu que tous les étudiants inscrits au cours respectent le code d'honneur de l'EBSI (http://www.ebsi.umontreal.ca/sout/code-honneur.html). Le plagiat à l'Université de Montréal est sanctionné par le Règlement disciplinaire sur la fraude et le plagiat concernant les étudiants. Pour plus de renseignements, consultez le site www.integrite.umontreal.ca.

Qualité de la langue
La professeure tiendra compte de la qualité du français dans l'évaluation des travaux et peut enlever jusqu’à 10 % de la note (voir Guide de l'étudiant).

Mode de communication
Le mode de communication privilégié entre la professeure et les étudiant(e)s est le courriel. Veuillez vous assurer que vous êtes officiellement inscrit(e) au cours et maintenez à jour l'adresse de courriel enregistrée dans votre profil informatique à l'Université de Montréal. Vous devez lire votre courriel très régulièrement (au moins une fois par jour), des informations importantes concernant le cours ou les TP pouvant être diffusées par ce moyen.
Très important : pour toute correspondance concernant le cours, veuillez inscrire obligatoirement au début du champ sujet du message la chaîne suivante : [SCI6135] (incluant les crochets).
 

Ressources

Les lectures obligatoires et suggérées seront précisées en cours de session.

Autre information

Bien que le cours SCI6133 - Indexation et condensation ne soit pas un préalable à ce cours SCI6135, les étudiants ayant suivi SCI6133 auront acquis une expertise en indexation qui leur permettra de saisir certains enjeux importants. Les étudiants n'ayant pas ce préalable pourront également réussir ce cours (notamment, un exposé rapide sur l'indexation sera présenté au début du cours 4) mais en auront une expérience différente.