Modélisation
La modélisation peut se définir de la manière suivante. C'est un processus qui passe par toutes les phases de la démarche scientifique, avec, à partir de l'observation, une conceptualisation du phénomène, une traduction dans un langage (un modèle) et une confrontation du modèle avec de nouvelles observations. Cela peut apparaître trivial, mais il faut rappeler que l'ensemble des phases est influencé par l'expérience et la science de l'observateur.
Source : Scheme Modelling & Environment, 2013, https://www.scheme-rd.fr/notre-methodologie-la-modelisation.
La définition de modélisation ci-dessus résume bien l'essence même de ce processus qui permet de représenter une certaine réalité à l'aide d'un modèle. Cette démarche, qui se doit d'être systématique, peut prendre différentes formes selon le type de réalité que l'on veut modéliser et l'environnement de modélisation utilisé, mais les grandes étapes demeurent sensiblement les mêmes :
Conceptualisation d'un phénomène à partir d'observations
Représentation de la conceptualisation à l'aide d'un certain langage
Validation du modèle à partir de nouvelles observations
La modélisation peut se faire dans différents contextes et de différentes manières, se voulant parfois descriptive et d'autre fois prédictive, par exemple :
Modélisation mathématique de certains phénomènes
Modélisation 3D d'une structure en architecture et ingénierie
Modélisation des processus en entreprise
Modélisation de systèmes d'information en informatique
Dans le cadre du cours, nous avons déjà croisé différentes modélisations, que ce soit les modèles des écologies informationnelles, de l'informatique sociale, de l'appropriation des technologies, du processus d'implantation de solutions documentaires par exemple.
Comme professionnelles et professionnels de l'information, différentes occasions se présenteront pour modéliser des types de documents, des comportements informationnels, des processus d'affaires, etc. Il est ainsi utile de se familiariser avec ce processus, ce que nous ferons dans le cadre du cours pour les prochaines semaines :
Nous nous intéresserons à la modélisation de différents types de documents afin d'en faire ressortir la structure logique.
Nous verrons par la suite comment, selon le type de documents et de structures logiques, il est possible d'exploiter au mieux les possibilités de structuration de l'information dans différents types de logiciels d'application (traitement de texte, tableur, système de gestion de bases de données).
Les différentes étapes de cette démarche de modélisation d'un type de documents sont présentées ci-dessous.
Modélisation d'un type de document : Conceptualisation (1ère étape)
La première étape consiste à observer des exemples représentatifs du type de documents que l'on veut modéliser pour s'assurer de bien en comprendre le contenu et la structure. On part ainsi habituellement d'un certain corpus (c'est-à-dire d'un ensemble de documents) auquel s'ajouteront bien entendu les connaissances de ce type de documents que possède la personne qui en fait la modélisation.
La conceptualisation est ainsi un exercice d'observation et d'analyse :
Il faut réussir à identifier les composantes communes à chacun des documents du corpus, celles qui sont obligatoires et celles qui sont facultatives.
Il faut comprendre comme les composantes sont reliées entre elles.
Il faut identifier la nature des contenus qu'on y retrouve, la manière de les écrire s'il y a lieu (par exemple, si on retrouve une date, y a-t-il un format privilégié?).
Exemple : Conceptualisation d'un courriel
L'observation de plusieurs courriels permet de mettre au jour les caractéristiques suivantes :
Un courriel est composé d'un expéditeur, d'un ou plusieurs destinataires, d'un objet et d'un message.
Les destinataires sont composés d'une ou plusieurs adresses courriel tandis que, pour l'expéditeur, il n'y en a qu'une seule. Une adresse courriel a la forme abc@def.ghi.
L'objet d'un courriel est une simple phrase.
Le message d'un courriel peut être formé d'un ou plusieurs paragraphes de texte.
Note : C'est cette conceptualisation qui a permis de présenter lors d'un cours précédent la représentation XML d'un courriel!
Modélisation d'un type de document : Représentation de la conceptualisation (2ième étape)
Une fois que l'on a bien compris le contenu et la structure du type de documents que l'on veut modéliser, il faut représenter la conceptualisation obtenue afin de l'expliciter. Différents types de représentation sont possibles, entre autres en fonction du type de documents. Ce peut être un schéma, un tableau, une carte conceptuelle, etc. Pour certains types de modélisation, il existe des représentations bien établies comme, par exemple :
pour la modélisation de systèmes informatiques avec UML (Unified Modeling Language),
pour la modélisation de bases de données avec le modèle Entité-Relation (ou Entité-Association).
Lorsqu'il n'y a pas de méthode bien établie, il s'agit d'en choisir une qui correspond bien au type de modélisation à représenter.
La représentation de la conceptualisation sous une forme ou une autre peut amener à détecter des erreurs de logique dans la conceptualisation. Il s'agit alors de faire des allers-retours entre conceptualisation et représentation jusqu'à la création d'une représentation qui semble stabilisée (c'est-à-dire où l'on ne retrouve pas d'erreur).
Exemple : Représentation de la conceptualisation d'un courriel
Dans le cadre d'un type de documents textuel que l'on peut produire dans un traitement de texte, on pourrait en représenter la structure à l'aide d'une liste à puces hiérarchisée de la manière suivante :
courriel
expéditeur [forme abc@abc.com]
destinataire
mel + [forme abc@abc.com]
objet
message
para +
Plus précisément, cette représentation est basée sur une syntaxe et une sémantique très simples retenues pour les besoins du TP Structuration dans un traitement de texte :
La hiérarchie des puces permet de représenter les relations d'inclusion entre des éléments et leurs sous-éléments, comme c'est le cas ici de mel qui est un sous-élément de destinataire.
Il est intéressant de pouvoir y indiquer aussi les éléments qui peuvent se répéter. C'est le cas, par exemple, de l'élément para. On pourrait retrouver plusieurs paragraphes à l'intérieur du message. C'est ce que le + signifie.
De plus, il peut être utile de consigner des informations sur les règles d'écriture particulières de certains contenus comme, par exemple, la forme d'une adresse courriel. C'est ce qui est indiqué entre crochets carrés dans l'exemple [...].
Finalement, on pourrait utiliser l'italique pour indiquer les éléments qui sont facultatifs. Dans cet exemple, on ne retrouve aucun italique comme tous les éléments sont obligatoires.
Modélisation d'un type de document : Validation du modèle (3ième étape)
Il est finalement conseillé de valider le modèle ainsi défini à partir de nouveaux exemples de documents du type de documents représenté. Cette étape pourrait amener à ajuster le modèle (tant sa conceptualisation que sa représentation), comme les nouveaux exemples pourraient avoir fait ressortir des éléments de contenu et de structure absents du corpus initial.
Une autre manière de valider une modélisation est de la présenter à des personnes externes familières avec le type de document. Elles pourraient ainsi confirmer ou infirmer la qualité de la modélisation obtenue.
Exemple : Validation de la conceptualisation d'un courriel
Imaginez, par exemple, que vous ayez modélisé la structure d'un courriel avec uniquement des exemples possédant un destinataire unique. En ce cas, vous n'auriez pas défini l'élément mel comme répétable (+). La validation avec de nouveaux courriels, dont certains avec plusieurs destinataires, vous amènerait à revoir cette décision de modélisation.
Une personne externe pourrait aussi proposer des ajouts à votre modélisation sur la base de son expérience comme :
La présence potentielle de pièces jointes
Une composante temporelle (date d'envoi)
La représentation de cette nouvelle modélisation serait ainsi la suivante :
courriel
expéditeur [forme abc@abc.com]
destinataire
mel + [forme abc@abc.com]
date [forme aaaa-mm-jj]
objet
message
para +
pièce jointe
fichier +