EBSI - Plan du cours INU3011 - Documents structurés (Hiver 2026) Passer au contenu

/ École de bibliothéconomie et des sciences de l'information

Je donne

Rechercher

Navigation secondaire

Plan du cours INU3011 - Documents structurés (Hiver 2026)

3 crédits

Préalable : INU1001 ou l'équivalent

Chargé de cours : David Valentine
Courriel : david.valentine@umontreal.ca
Disponibilités : sur rendez-vous

Site Web du cours : https://studium.umontreal.ca/course/view.php?id=336274


Les cours se donnent le Mardi de 18h30 à 21h30. Certains travaux de laboratoire s’effectuent à l’intérieur de cette plage horaire dans la salle de cours..


Description officielle

Formats de documents et langages de balisage. Historique. Concepts de base. XML et normes périphériques. Modélisation, validation, stylage. Chaînes de traitement et méthodologies d'implantation. Bases de données XML.

Objectifs d'apprentissage

L’objectif d’apprentissage pricipal de ce cours est de :

prendre conscience des avantages fondamentaux liés à l’utilisation des documents structurés pour la publication d’information documentaire, ainsi que des défis qu’ils posent aux concepteurs de systèmes d’information.

À la fin du cours, l’étudiante ou l’étudiant démontrera une compréhension approfondie des enjeux liés à l’utilisation des documents structurés pour la gestion de l’information documentaire. Plus spécifiquement, la personne étudiante :

  1. démontrera une maîtrise approfondie des concepts et des principes de base des documents structurés;
  2. pourra concevoir des modèles de documents structurés en fonction de besoins donnés;
  3. pourra créer des feuilles de styles en fonction de besoins donnés;
  4. pourra planifier des chaînes de traitement de documents structurés en fonction de besoins donnés;
  5. démontrera une bonne compréhension du processus d’implantation d’un système de documents structurés.

Méthodes pédagogiques

  • Cours magistraux (la participation du groupe est la bienvenue)
  • Lectures et discussions
  • Travaux pratiques
  • Exercices

Contenu du cours

Les documents structurés permettent d’organiser de l’information en utilisant des fichiers texte.
Techniquement simple, il s’agit d’une manière de structurer et de stocker l’information qui offre de multiples possibilités et une grande flexibilité. De ce fait, les documents structurés sont largement utilisés dans toutes les sphères de la gestion de l’information numérique (création, organisation, préservation, diffusion).

L’objectif principal de ce cours est de faire prendre conscience des avantages fondamentaux liés à l’utilisation des documents structurés pour la publication d’information documentaire, ainsi que des défis qu’ils posent aux concepteurs de systèmes d’information. Les objectifs spécifiques sont de se familiariser avec certains types de fonctionnalité des outils de traitement des documents structurés.

Le cours est majoritairement élaboré autour de XML (un des plus importants formats normalisés de documents structurés existant actuellement), tout en proposant un survol des principaux formats permettant de structurer de l’information documentaire à partir de perspectives distinctes (JSON, HTML, Markdown, YAML).

Outre une compréhension approfondie des concepts et principes de base des documents structurés, on vise un niveau de compétence permettant, dans un contexte spécifique bien défini, de concevoir des DTD ou des schémas XML (schémas XSD du W3C), de créer des feuilles de styles CSS et XSLT, de sélectionner des outils, de convertir des documents XML vers d’autres formats et de les publier sur le Web, directement et par le truchement d’une base de données XML.

Une connaissance de HTML et de CSS équivalente aux éléments de ces langages vus dans le cours « INU1001 Introduction à l’information numérique » (ou équivalent comme « SCI6005 Information numérique et informatique documentaire ») est un prérequis essentiel au cours, y compris pour les minitests. Veuillez au besoin réviser ces notions avant la deuxième séance.

Un haut niveau d’implication et de participation (en classe et surtout au laboratoire) est attendu des personnes étudiantes.

L’une des principales activités du cours consiste à réaliser un projet de modé­lisation documentaire (en équipe de deux), à saisir des documents XML et à les publier sur le Web de diverses façons :

  • en XML;
  • en HTML;
  • en JSON;
  • dans une base de données XML.

La nature des documents sera discutée en classe.

Calendrier des activités

DateActivitésÉvaluation
2026-01-13

Plan de cours et ressources. Introduction aux documents structurés. Formats pour le balisage léger avec Markdown et YAML. oXygen.

 
2026-01-20

Historique de XML. Structuration de l’information en XML.

 
2026-01-27

Caractères réservés, entités prédéfinies et entités caractère. oXygen et caractères spéciaux.

Minitest 1 (10%).

2026-02-03

Validité en XML : mécanismes, bénéfices, saisie, écosystème d’un modèle. Présentation du TP 1.

 
2026-02-10

Langage des DTD

Remise TP 1 (10%).

Encodage d’un texte (travail individuel).

2026-02-17

Modélisation. Présentation du TP 2.

Minitest 2 (10%)

2026-02-24

Modélisation (suite). Markdown et YAML pour la rédaction. Présentation du TP 3, aperçu des TP 4 et 5.

Remise TP 2 (15%).

Création d’un modèle XML (travail individuel).

2026-03-03

Période d’activités libres.

 
2026-03-10

Traitement de documents XML : XPath.

Remise TP 3 (15%).

Modélisation préliminaire.

2026-03-17

Traitement de documents XML : XSLT.

 
2026-03-24

Traitement de documents XML : XSLT (suite). Présentation du TP 4.

Retour sur le TP 3 : rencontres séparées par équipe.

2026-03-31

oXygen : projets et scénarios de transformation. JSON.

 
2026-04-07

Validité par schémas XSD. Espaces de noms XML.

Minitest 3 (10%).

2026-04-14

Modèles normalisés et aperçu de la TEI. Publication web de documents XML. Présentation du TP 5. Conclusion.

 
2026-04-21

Période de travail

 
2026-04-28

Période de travail

 
2026-04-29

Fin du trimestre.

Remise du TP4 (20%)

Remise du TP5 (10%)

Note : le contenu du cours et sa répartition entre les séances pourront être ajustés pendant la session en fonction de l’avancement des activités.

Évaluation

Évaluation
Activité Pondération
Trois minitests sur StudiUM (10% par test)* 30%
TP1 : Encodage d’un texte * 10%
TP2 : Création d’un modèle XML * 15%
TP3 : Modélisation préliminaire 15%
TP4 : Modélisation et stylage 20%
TP5 : Publication web 10%

* Les évaluations marquées d’un astérisque (*) sont individuelles. Les TP 3, 4 et 5 sont réalisés en équipe de deux personnes.

Politiques, règlements et directives

Évaluation avec seuil

La politique d’évaluation avec seuil est appliquée (voir le Guide étudiant du 1er cycle 2025-2026). Pour réussir le cours, il faut non seulement atteindre ou dépasser la note de passage pour l’ensemble des acti­vités évaluées du cours, mais également atteindre ou dépasser la note de passage pour le sous-ensemble pondéré des ac­ti­vités évaluées qui sont réalisées individuellement (et non en équipe).

Notez que la note de passage est de « D » pour les étudiants inscrits à un programme de premier cycle et de « C » pour les étudiants inscrits à un programme des cycles supérieurs.

Remise des travaux à évaluer

Les travaux doivent être remis en format numérique sur Studium conformément aux directives indiquées dans le protocole ou l’énoncé du travail concerné.

Si vous ne respectez pas les directives ci-dessus, vous êtes considéré comme n’ayant pas remis le travail.

Vous devez impérativement conserver une copie de sécurité intégrale des artefacts remis, au moins jusqu’à réception de leur correction. Vous devez être prêt à transmettre rapidement sur demande à la personne responsable de la correction (par courriel ou autrement) une copie du matériel remis originellement, en cas de problème de lecture ou autre; c’est votre responsabilité.

Utilisation des outils de l’intelligence artificielle générative (IAg)

L’utilisation de certains outils de l’intelligence artificielle générative (IAg) sera permise dans le cadre de certaines évaluations. Les modalités de ces usages seront expliquées en classe et détaillées dans les énoncés des travaux concernés. Veuillez noter que si l’utilisation de ces outils n’est pas explicitement autorisée par les instructions de l’évaluation, alors elle est proscrite.

Mode de communication

Le mode de communication privilégié du professeur vers les étudiant(e)s est le forum Nouvelles de l'espace Studium du cours.

Dans certains cas, l’enseignant peut également vous joindre par courriel. Pour ce faire, le courriel @umontreal.ca sera utilisé.

Le mode de communication privilégié pour joindre l’enseignant est le courriel. L’adresse courriel de l’enseignant est david.valentine@umontreal.ca. Prière de toujours inscrire la mention [INU3011] (incluant les crochets) au début de la ligne sujet de votre message.

Pour des questions qui portent sur l’organisation du cours, sur la matière ou sur les protocoles des travaux et qui peuvent être d’intérêt général pour l’ensemble de la classe, veuillez privilégier le forum de discussion de l’espace StudiUM du cours.

Intégrité, fraude et plagiat

Ce cours observe la politique de l’Université de Montréal sur l’intégrité dans les études qui est con­sultable à cette adresse : https://integrite.umontreal.ca. Il est de votre devoir de la connaître et de vous y conformer.

Autres règlements et politiques

Tous les règlements, politiques et directives énoncés dans le Guide étudiant du 1er cycle s’appliquent. Une attention particulière est à porter aux éléments suivants :

Code d’honneur
Il est attendu que les étudiant(e)s respectent le code d’honneur de l’EBSI.

Travaux en équipe
Pour les travaux réalisés en équipe, la personne enseignante se réserve le droit d’évaluer séparément chaque membre d’une équipe. L’étudiante ou l’étudiant qui estime avoir une raison valable pour remettre de façon individuelle un travail à réaliser en équipe doit en demander la permission par écrit à l’enseignant. Prière de consulter le guide étudiant pour connaître les modalités de la réalisation des travaux en équipe.

Règlement disciplinaire sur le plagiat ou la fraude concernant les étudiants
Toute infraction au règlement sur le plagiat ou la fraude sera traitée suivant la procédure indiquée dans le règlement.

Retard dans la remise des travaux
Tout retard non justifié dans la remise d’un travail sera sanctionné : 5% de la note est retranché par jour de calendrier de retard jusqu’à un maximum de 35%; à la 8ième journée de calendrier, la note F ou zéro (0) est attribuée.

Qualité de la langue
Un maximum de 10% de la note globale d’un travail pourra être retranché pour mauvaise qualité de la langue dans les travaux (ne s’applique pas aux examens ou quiz en classe).

 

Ressources

Lectures et bibliographie

Les lectures obligatoires et la bibliographie complète se trouvent sur le site web du cours.