EBSI - Plan du cours SCI6343 - Sujets spéciaux - La transformation numérique des documents : des archives au lac de données et à l’IA (Été 2026) Passer au contenu

/ École de bibliothéconomie et des sciences de l'information

Je donne

Rechercher

Navigation secondaire

Plan du cours SCI6343 - Sujets spéciaux - La transformation numérique des documents : des archives au lac de données et à l’IA (Été 2026)

3 crédits

Professeur invité : Bruno Bachimont
Courriel : bruno.bachimont@utc.fr


Les cours se donnent le du 13 au 24 juillet, du lundi au vendredi, 9h à 12h et 13h30 à 16h30.


Description officielle

Thèmes et problématiques d'actualité.

Objectifs généraux

L’objectif du cours est de proposé une perspective globale sur la transformation numérique des documents, de leur conception textuelle à leur traitement comme données. Le processus global s’appelle grammatisation et il s’agit de comprendre ce que fait le numérique à l’archive et à la mémoire, au-delà de la simple instrumentation et technique.

L’archive est un objet complexe, à la fois technique et culturel, témoin du passé pour le présent. L'objectif général est de :

  1. Définir un cadre conceptuel et théorique pour aborder les archives et les contenus dans le contexte des technologies numériques.
  2. Comprendre quels sont les nouveaux problèmes qui apparaissent, comment les aborder, et de maîtriser les concepts permettant de construire les solutions nécessaires.

Objectifs spécifiques

A la fin du cours, l’étudiant sera en mesure de :

  • Posséder les éléments conceptuels pour maîtriser les notions de documents, archives, numérique, grammatisation, dans les différentes.
  • Réinscrire dans ces concepts et enjeux dans une tradition conceptuelle et philosophique.
  • Comprendre le fonctionnement et les enjeux propres aux approches contemporaines du document par son traitement numérique : IA symbolique, IA neuronale, IA générative.
  • Savoir mobiliser ces outils conceptuels et techniques pour analyser ou proposer la transformation numérique de collections ou d’institutions.

Méthodes pédagogiques

Le cours comprend des séances magistrales la première semaine et la seconde semaine se compose des cours le matin (lundi, mardi et jeudi) et de travail personnel le reste du temps, avec l’encadrement, si souhaité, du professeur. Le dernier jour d’enseignement (vendredi de la seconde semaine est consacré à la présentation des travaux réalisés par les étudiants).

Chaque séance magistrale donne lieu à une présentation orale avec un support de cours type PowerPoint diffusé à chaque séance. Une bibliographie générale est donnée au début du cours.

Calendrier des activités

DateActivité(s)Évaluation
2026-07-13

Introduction et présentation du cours

Le document
Introduction à la notion de document et aux principales problématiques documentaires et mémorielles.

 
2026-07-14

Archives : principes et disciplines voisines
Il s’agit d’introduire la problématique des archives et les différents thématiques correspondantes : transmission et préservation des supports, entretien des traditions interprétatives, organisation sociale pour réaliser ces missions. L’archive est présentée comme la rencontre d’un processus de conservation et d’une tradition de lecture. On l’aborde au croisement des disciplines du document : archivistique et les sciences auxiliaires de l’histoire, la bibliothéconomie, la documentation et les approches patrimoniales.

Philosophies de l'archive
L’archive pose la question de la mémoire et de l’oubli, de l’histoire et de la tradition, de l’interprétation et de l’invention. Enjeu de pouvoir et de mémoire, l’archive renvoie à des questionnements philosophiques qui secouent l’institution et la pratique des archives. Platon, Foucault, Derrida, Ricœur scandent ces réflexions.

 
2026-07-15

Projet : principes et méthodologie
La séance est consacrée à présenter le travail demandé et à expliquer et commenter la grille d’analyse fournie comme guide pour ce travail.

L’enjeu est de choisir une institution, un fonds, une collection dont on étudie la trajectoire numérique et analyse les questions posées et les éventuels problèmes rencontrés.

 
2026-07-16

La théorie du support et support numérique
La théorie du support désigne la théorie selon laquelle le support matériel d’une inscription conditionne son interprétation et dès lors sa signification. Selon le type de support on aura une intelligibilité spécifique qui donne lieu à une pensée ou rationalité propre, notamment la « raison graphique » de Jack Goody, ou la « raison computationnelle » proposée par BB.

Les tendances du numérique
Le numérique est une technologie qui comme telle repose sur une tendance technique. Cette notion, venant de André Leroi-Gourhan, signifie qu’une technique évolue selon une certaine logique que l’on retrouve dans ses mises en œuvre. La tendance du numérique repose sur la fragmentation des contenus et s’inscrit dans le processus global de la grammatisation. 3 dimensions particulières de la tendance du numérique sont dégagées dans leurs effets sur les documents : la décomposition du document comme somme de ressources, la question de l’identité du document en face de la multiplicité de ses variantes, le traitement documentaire devenu gestion de données structurées formalisées. Des exemples du monde sonore et audiovisuels sont présentés.

 
2026-07-17

Principes de la numérisation
Rappels sur la numérisation des contenus textuels et non textuels pour comprendre les conditions de ce processus : passage analogique symbolique, normes d’encodages, formats de compression, formats de métadonnées, notamment pour faire le lien avec les autres cours abordant ces sujets.

IA symbolique et lac de données
Le monde documentaire connaît une transformation dans la mesure où la notice documentaire n’est plus l’unité descriptive donnant accès au contenu mais est désormais remplacée par des annotations structurées exprimées selon les modalités du Web sémantique. On voit donc les notions de données, des langages et outils permettant de les manipuler (RDF, ontologies), pour terminer sur la notion de lac de données avec quelques exemples tirés de fonds d’archives.

 
2026-07-20

IA neuronale et générative - I
Les outils issus de l’IA neuronale (apprentissage profond) ainsi que l’IA générative renouvellent la conception des contenus qui ne sont plus vus comme des documents ou ressources sur lesquels des annotations structurées sont apportées, mais des données qu’il faut reconnaître ou qu’il faut engendrer. Les principales classes de réseaux sont présentées, ainsi que des exemples sur le travail documentaire.

 
2026-07-21

IA neuronale et générative – II
L’IA générative tend à s’imposer comme une médiation incontournable des contenus, constituant une nouvelle forme pour la documentation et la recherche d’information. Les principes classes d’outils génératifs sont présentés ainsi que l’impact sur les contenus. Pour une telle transformation en cours, une analyse des tendances est proposée. 

 
2026-07-22

Archivage du Web : généralités et exemple d’un archivage institutionnel
Le Web est un véritable laboratoire pour la préservation numérique et l’archivage des contenus. On envisage la problématique générale et les différentes questions qui se posent lorsqu’on envisage un projet d’archivage du Web. On illustre ce cadre général à travers l’expérience du dépôt légal du Web en France et sa mise en œuvre par l’Ina pour la part qui lui revient. Il convient alors de s’interroger sur le statut d’une telle archive, qui n’est pas une trace conservée mais qui est un enregistrement qui capte une partie du Web à un moment donné et dont il faut assurer ensuite la pérennisation numérique. Ni source ni archive au sens propre, l’archivage du Web amène à renouveler l’épistémologie des connaissances qui sont à construire à partir de telles archives.

 
2026-07-23

Présentation des travaux réalisés en binôme : 20mn d’exposé et 10mn question.

Le support de présentation est remis à la fin de la présentation. Il tient lieu de rapport. Il doit donc pouvoir être lu de manière autonome et donner les informations nécessaires au traitement du sujet, excédant ainsi éventuellement ce qui a été présenté lors de l’exposé oral.

Présentations orales

2026-08-30 

Remise du travail individuel

Charge de travail
Comme indiqué dans le Règlement pédagogique de la Faculté des études supérieures et postdoctorales (Chapitre 1, 1.6 Crédit), un crédit de cours représente une heure de cours et deux heures de travail personnel. La charge de travail pour un cours de 3 crédits est donc de trois heures de cours et six heures de travail personnel par semaine (total de 135 heures dans la session).

Évaluation

Le cours comporte une autoévaluation par les étudiants de leur compréhension à partir d’un questionnaire fourni et composé de 10 questions pour chaque séance. Les étudiants doivent, à partir du cours, se sentir capables de comprendre et de traiter chaque question posée. Il est supposé qu’en cas de doute sur la réponse ou d’incapacité de réponse, l’étudiante s’adresse au professeur pendant qu’il est encore temps.

L’évaluation proprement dite consiste en deux étapes :

  1. un dossier à réaliser sur un projet existant qu’il faudra analyser à travers les différents points de vue exposés en cours. Ce travail sera effectué en binôme. Ce dossier se traduit par deux livrables rendus lors de la dernière séance du cours, consacrée à la présentation des travaux des binômes :

    • Exposé oral
    • Support PowerPoint de l’exposé.

    Ce dossier compte pour 50 % dans l’évaluation. L’exposé et le support de présentation sont notés globalement.

    Le projet est présenté et discuté la première semaine et encadré la seconde semaine.

  2. Une dissertation individuelle.

    Cette dissertation de 3000 mots est à rendre après la fin du cours. La date est précisée dans le calendrier du cours. Le sujet est fourni dès le premier cours.

    Cette dissertation compte pour 50 % dans l’évaluation finale.

Politiques, règlements et directives

L'ensemble des politiques, règlements et directives énoncé dans le guide étudiant s'appliquent. Une attention particulière est à porter aux éléments suivants :

Règlement disciplinaire sur le plagiat ou la fraude concernant les étudiants des cycles supérieurs
Toute infraction au règlement sur le plagiat ou la fraude sera traitée suivant la procédure indiquée dans le règlement.

Il est attendu que toutes les étudiantes et tous les étudiants inscrits au cours respectent le code d'honneur de l'EBSI <https://ebsi.umontreal.ca/ressources-services/ressources-pedagogiques/code-honneur/>.

L'utilisation d'outils comme ChatGPT n'est pas permise, à moins d'indication contraire par le professeur.

Captation audio et vidéo du cours
L’usage de tout document déposé sur StudiUM pour chaque cours est assujetti à l’engagement de chaque étudiant(e) à respecter la propriété intellectuelle et le droit à l’image.

Il est interdit de faire une captation audio ou vidéo du cours, en tout ou en partie, sans le consentement écrit de l'enseignant(e). Le non-respect de cette règle peut mener à des sanctions disciplinaires en vertu de l’Article 3 du Règlement disciplinaire concernant les étudiants.

Délais et dates de remise des travaux
Tout retard non justifié dans la remise d'un travail sera sanctionné : 5% de la note maximale du travail est retranché par jour calendaire de retard jusqu'à concurrence de 35%; à la 8ième journée de calendrier, la note F (échec) ou zéro est accordée. Le jour de la date prévue de la remise du travail ne compte pas. Le samedi et le dimanche ainsi que les jours fériés sont comptés.

Qualité de la langue
Un maximum de 10% de la note globale d'un travail pourra être retranché pour mauvaise qualité de la langue dans les travaux (ne s'applique pas aux examens).

Travaux en équipe
Une demande écrite à l'enseignant(e) doit être faite si un(e) étudiant(e) estime avoir une raison valable pour remettre de façon individuelle un travail à réaliser en équipe. La décision d'accepter ou non d'accorder cette permission revient à l'enseignant(e), qui en avisera l'étudiant(e) par écrit. Si un conflit survient, le litige sera tranché par le (la) directeur (directrice). Sauf indication contraire et écrite de l’enseignant(e), si la permission est accordée, le travail remis par l'étudiant(e) doit répondre aux mêmes exigences que s'il était réalisé en équipe. En cas de remise individuelle non motivée, l'enseignant(e) se réserve le droit de refuser le travail et d'attribuer à l'étudiant(e) une note d'échec (F).

Ressources

BIBLIOGRAPHIE INDICATIVE

Le document :

BACHIMONT, B. (2007) Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents, Paris, Hermès.

BACHIMONT, B. (2017). Patrimoine et numérique : Technique et politique de la mémoire. Bry sur marne: Ina-Editions.

La théorie du support :

BACHIMONT, B. (2010). Le sens de la technique : le numérique et le calcul. Paris: Encres Marines / Les Belles Lettres.

BARBIER, F. (2006) L'Europe de Gutemberg ; Le livre et l'invention de la modernité occidentale, Paris, Belin.

CARRUTHERS, M. (2002) Le livre de la mémoire : la mémoire dans la culture médiévale, Paris, Macula.

CAVALLO, G. & CHARTIER, R. (Eds.) (1997) Histoire de la lecture dans le monde occidental, Paris, Seuil.

CHARTIER, R. (1997) Le livre en révolutions, Paris, Textuel.

DEBRAY, R. (2000) Introduction à la médiologie, Paris, Presses Universitaires de France.

GOODY, J. (1979) La raison graphique, la domestication de la pensée sauvage, Paris, Les Editions de Minuit.

GOODY, J. (1985) La logique de l'écriture, Paris, Armand Colin.

GOODY, J. (1994) Entre l'oralité et l'écriture, Paris, Presses Universitaires de France.

LÉVY, P. (1990) Les technologies de l'intelligence ; L'avenir de la pensée à l'ère informatique, Paris, La Découverte.

MARTIN, H.-J. (1996) Histoire et pouvoirs de l'écrit, Paris, Albin Michel.

VANDENDORPE, C. (1999) Du papyrus à l'hypertexte ; Essai sur les mutations du texte et de la lecture., Paris, La Découverte.

YATES, F. (1975) L'art de la mémoire, Paris, Gallimard.

Archives et philosophie de l'archive :

BACHIMONT, B. (2017). Patrimoine et numérique : Technique et politique de la mémoire. Bry sur marne: Ina-Editions.

CHABIN, M.-A. (2000). Le management de l'archive. Paris: Hermès.

DERRIDA, J. (1995) Mal d'archive, une impression freudienne., Paris, Galilée.

ESAMBERT, B. (2004) Le sacre de l'auteur, Paris, Seuil.

FOUCAULT, M. (1969) L'archéologie du savoir, Paris, Gallimard.

RICŒUR, P. (2000) La mémoire, l'histoire, l'oubli, Paris, Seuil.

VEYNE, P. (1971) Comment on écrit l'histoire, Paris, Seuil.

Numérique et transformation numérique :

Bachimont , B. (2025). Archiver le web : quelle ­ objectivité construire pour quelles ­ interrogations ? Les cahiers du numérique, 20(3-4), 117-131.

BACHIMONT, B. (2023). Le paradigme du code : amnésie de la trace et arbitraire de l’interprétation. In V. Charolles & E. Lamy-Rested (Eds.), Philosophie des technologies : un levier pour l’action (pp. 53-62). Londres: ISTE.

BACHIMONT, B. (2021). Archive et mémoire : le numérique et les mnémophores. Signata - Annales des sémiotiques, Numéro spécial : Sémiotique de l'archive, Maria Giulia Dondero, Andreas Fickers, Gian Maria Tore, Matteo Treleani (eds)(12), 1-19. doi:https://doi.org/10.4000/signata.2980

BACHIMONT, B. (2016). Document et technique : le temps de la préservation Les cahiers d'INCCA-F, Volume 1 : Documentation technique, techniques de documentation, 28-43.

BACHIMONT, B. (2013). Préservation culturelle numérique. In E. Gayou (Ed.), Musique et Technologie (pp. 11-32). Paris: Institut National de l'Audiovisuel

GLADNEY, H. M. (2007) Preserving Digital Information, Berlin, Springer.

MASANÈS, J. (Ed.) (2006) Web archiving, Berlin, Springer.

NONAKA, I. (1999) L'entreprise créatrice de savoir. Harvard Business Review. Paris, Editions d'Organisation.

NONAKA, I. & TAKEUCHI, H. (1995) La connaissance créatrice. La dynamique de l'entreprise apprenante., Bruxelles, De Boeck Université.

Introduction à l'IA :

Alammar, J., & Grootendorst, M. (2024). Hands-On Large Language Models : Language Understanding and Generation. Sebastopol, CA: O’Reilly.

Alliot, J.-M., Schiex, T., Brisset, P., & Garcia, F. (2002). Intelligence artificielle et Informatique théorique. Toulouse : CÉPADUES - Éditions.

Bachimont , B. (2026). AI and algorithms: what digital technology can teach us about our content. In Pietro Conte, Anna Caterina Dalmasso, Maria Giulia Dondero, & A. Pinotti (Eds.), Algomedia. The Image at the Time of Artificial Intelligence : Springer Cham.

Bengio, Y., Goodfellow, I., & Courville, A. (2016). Deep Learning. Cambridge, Ma, USA: MIT Press.

Russell, S., & Norvig, P. (2016). Artificial Intelligence, a Modern Approach (3th ed.). Edinburgh: Pearson.

Le contexte numérique :

BACHIMONT, B. (2014). Le nominalisme et la culture:  questions posées par les enjeux du numérique. In B. Stiegler (Ed.), Digital Studies, organologie des savoirs et technologies de la connaissance (pp. 63-78). Paris: FYP Editions.

BACHIMONT, B. (2015). Le numérique comme milieu : enjeux épistémologiques et phénoménologiques. Principes pour une science des données. Interfaces numériques, 4(3), 385-402.

Bachimont, B. (2025). Digital Ethics: Empowering Agents and Taking Care of Systems. In M.-H. Abel, N. Matta, H. Karray, & I. Saad (Eds.), Ethics and Digital Transition (pp. 1-27). London: ISTE Wiley.

RIFKIN, J. (2005) L'âge de l'accès : la nouvelle culture du capitalisme, Paris, La Découverte.