Contrôle de la qualité

Différents aspects sont reliés au contrôle de qualité dans une base de données documentaire qu'il faut avoir en tête tout au long du processus de conception et même après! Une emphase générale est mise sur la qualité dans la société depuis les années 90 pour différentes raisons, entre autres :

  • Pour des questions de crédibilité ...

HUMOR - Your Tax Dollars At Work - 001 - SOTP [https://www.flickr.com/photos/51514834@N00/7270817256]Informations[1]
  • Pour des questions d'efficacité

"Cable ties are for wimps!" [https://www.flickr.com/photos/68423870@N00/5308965]Informations[2]

Importance de la qualité dans les BD

Le manque de qualité dans une base de données peut entraîner des coûts tant directs (perte de temps, d'information, coûts de correction ou remplacement) qu'indirects (p. ex. des dommages à la réputation et à celle des autres). Il n'est pas rare de voir dans l'actualité des exemples des problèmes liés à des BD dont la qualité n'est pas optimale.

ExempleLe succès de Gangnam Style trop grand pour YouTube...

Le problème, c'est que YouTube avait prévu dans le langage informatique un «entier» de 32 bits, soit un nombre maximum de consultations possibles de 2 147 483 647.

[...]

Les ingénieurs ont cependant anticipé le problème et revalorisé l'entier à 64 octets. Ce qui veut dire que Gangnam Style ou d'autres vidéos futures à succès pourront désormais atteindre 9 sextillions de consultations, un chiffre raisonnablement difficile à atteindre.

ExempleHello, I'm Mr. Null. My Name Makes Me Invisible to Computers

For those of you unwise in the ways of programming, the problem is that “null” is one of those famously “reserved” text strings in many programming languages. Making matters worse is that software programs frequently use “null” specifically to ensure that a data field is not empty, so it's often rejected as input in a web form.

[...]

Essentially this is another spin on the Y2K problem, and what happens next will depend a lot on the quality of programming underlying the website or app that's doing the work. Most will accept “Null” without complaint. Some will loop back to the input screen and tell the user to try again, that the last name field can't be blank (But it's not blank! That's just my name!) Some will tell the user that “null” is a reserved term that can't be used. And some will just crash. The unique challenges inherent with the Null Dilemma can be a surprisingly difficult problem to solve. It turns out it's also surprisingly common, and it seems the larger the company is behind the application or the website, the more trouble it will have with my name.

Source : Null, Christopher. 11 novembre 2015. Wired. https://www.wired.com/2015/11/null/

ExempleEquifax éprouve des problèmes avec le français

S'il a été impossible d'avoir des explications de la part d'Equifax, Desjardins reconnaît de son côté qu'il y a un problème avec la reconnaissance des accents français.

[...]

M. Turcotti recommande aux gens d'éviter de mettre des accents ou des traits d'union afin de faciliter le traitement de leur dossier, et ce, même si la façon d'inscrire leur prénom sur le site diffère de la graphie sur leurs autres documents officiels et pièces d'identité.

La qualité d'une BD est liée, d'une part, au modèle économique du système (clients, lectorat & de qui on parle), et d'autre part, à l'expérience des utilisateurs et des utilisatrices. Il ne faut pas seulement exiger la qualité, il faut aussi la créer et la mettre de l'avant :

  • Comme concepteur et conceptrice de BD documentaires, cela implique par exemple l'inclusion de différents mécanismes pour assurer la qualité des données (masques, listes de validation, etc.) et la qualité de l' « expérience-utilisateur » (ergonomie de l'interface).

  • Il faut expliciter aux utilisateurs et utilisatrices les moyens pris pour assurer la qualité.

Types d'erreur

Les erreurs peuvent être introduites tant dans les données qu'on retrouve dans la BD, que par le système utilisé.

Principaux types d'erreur

Nature

Causes

Système

  • Difficulté d'utilisation

  • Mauvaise ergonomie

  • Mauvaise modélisation/ implantation

Données

  • Erreurs dans les données primaires : mauvaises informations, informations absentes, erreurs d'orthographe, informations périmées (par exemple liens hypertextuels)

  • Doublons (redondance)

  • Information au mauvais endroit (champ)

  • Erreurs typographiques (par exemple dates)

  • Resaisie / Reconnaissance optique de caractères (ROC)

  • Dictionnaire de données non suivi (raisons de la non utilisation : complexité, formation inadéquate)

  • Retards / indisponibilités (sources, serveurs, etc.)

  • Évolution des sources (Web)

Les erreurs d'orthographe peuvent être parfois très fréquentes, que ce soit des omissions, des insertions, des substitutions ou des transpositions de caractères. Le clavier QWERTY (ou AZERTY) peut être la source de plusieurs erreurs, ce dernier ayant été conçu à la base pour des raisons mécaniques et non pour optimiser l'efficacité de la saisie. Le clavier Dvorak permet de réduire le nombre d'erreurs et d'être plus rapide, mais les coûts de son insertion en organisation (tant sur le plan matériel que sur le plan des ressources humaines) font qu'il n'a pas été adopté à grande échelle, aucune étude ne semblant avoir réussi à réellement prouver sa supériorité.

Moyens d'action

On peut intervenir au niveau de la qualité d'une BD à trois moments : lors de sa création, lors de la saisie des données, lors de l'utilisation de la BD :

  • Création de la BD : Il est important de prendre le temps de bien conceptualiser la réalité pour laquelle la BD sera implantée. Il faut aussi exploiter l'ensemble des mécanismes de validation disponibles dans le SGBD (masques, listes de validation, etc.) afin de réduire les erreurs lors de la saisie de données. De plus, il faut prendre soin lors de la conception des interfaces, de développer des interfaces ergonomiques ainsi que d'impliquer les utilisateurs et utilisatrices pour s'assurer que le SGBD développé corresponde bien à leur profil.

  • Saisie des données : Il faut implanter des mécanismes afin de vérifier les données qui ne sont pas contrôlées par des mécanismes de validation comme, par exemple, une relecture humaine ou un correcteur orthographique. Il est important de sensibiliser les personnes responsables de la saisie à l'importance de leur qualité ainsi que les former à l'utilisation du dictionnaire de données.

  • Utilisation de la BD : Il est possible d'inclure dans les interfaces de saisie ou de recherche des rappels quant à la forme attendue de certains contenus ou à la syntaxe du langage d'interrogation. De plus, le soin pris lors de la création de la BD afin de développer des interfaces ergonomiques et de bien répondre aux besoins des utilisateurs augmentera la qualité de la BD.

Une BD étant en constante évolution, il est utile de prévoir des moyens pour recueillir les commentaires des utilisateurs et utilisatrices, que ce soit par un lien vers une adresse courriel sur le site Web, par un formulaire Web de rétroaction ou par l'utilisation de plateformes collaboratives externes (ex. Facebook) ou internes (c'est-à-dire intégrées au site Web comme, par exemple, la documentation php).