Aller au contenu principal

Préservation et formats des contenus

Résumé 

La préservation numérique permet l’accès en continu aux contenus en cas d’indisponibilité sur la plateforme de l’éditeur. Comme il s’agit d’un défi majeur dans la publication en accès ouvert à but non lucratif, plusieurs initiatives dirigées par la communauté ont été lancées pour soutenir les éditeurs. Pour faciliter la préservation, l’interopérabilité et l’accessibilité des contenus, les éditeurs doivent s’appuyer sur des normes ouvertes lors du choix des formats de fichiers.

Texte détaillé

Avant le virage numérique, la préservation des publications relevait des bibliothèques, au moyen du dépôt légal ou de la distribution d’exemplaires matériels dans de nombreuses autres bibliothèques. Des approches semblables existent encore depuis le virage numérique : le dépôt légal s’étend désormais aux publications numériques, tandis que les services de préservation numérique s’appuient sur des copies conservées dans un réseau distribué de serveurs, comme l’indiquent les noms de deux services largement utilisés : Lots of Copies Keep Stuff Safe (LOCKSS) et Controlled LOCKSS CLOCKSS. LOCKSS, CLOCKSS et un troisième service digne de mention, Portico, sont des « archives cachées » (dark archives), c’est-à-dire des bases de données de secours de contenu numérique à l’origine ou numérisé, hébergées sur plusieurs serveurs sécurisés et préservant la version originale des contenus. Si les contenus deviennent indisponibles sur la plateforme de l’éditeur, ces services de préservation peuvent prendre la relève et garantir aux utilisateurs un accès continu (Digital Preservation Coalition, 2015 ; Shah et Gul, 2019). 

La préservation devrait être une priorité élevée de l’édition scientifique et savante, mais de nombreux éditeurs ne parviennent toujours pas à assurer la préservation numérique de leurs publications (Laakso, Matthias, et Jahn, 2021). Le coût de ce service est l’une des raisons. Plusieurs initiatives de soutien se sont récemment adressées aux éditeurs du créneau de l’accès ouvert, qui sont particulièrement vulnérables au sujet de la préservation numérique : le PKP Preservation Network  (Sprout et Jordan, 2018) accompagne les éditeurs utilisant le logiciel Open Journal Systems le projet JASPER (JournAlS are Preserved forevER) se concentre sur les revues ayant choisi le modèle Diamant indexées dans le Directory of Open Access Journals, et le Thoth Archiving Network iest une initiative de la communauté visant à aider les petites maisons d’édition portées par des universitaires (Cole, Barnes et Steiner, 2023). 

L’une des fonctions des services de préservation numérique est d’assurer la conversion des formats de fichiers, au cas où ceux qu’emploie un éditeur deviendraient obsolètes. C’est l’une des raisons pour lesquelles chaque éditeur doit utiliser des formats de fichiers ouverts, disposant d’une abondante documentation et comptant une vaste base d’utilisateurs, car ces formats ont de meilleures chances de bénéficier de soutien à la migration en cas d’obsolescence. 

La plupart des publications sont encore livrées dans le format PDF prêt pour l’impression. Or, il n’est guère commode pour la lecture sur de petits écrans ni optimal pour la recherche et l’extraction de texte et de données. Le balisage des contenus en texte intégral au format de suite de balisage d’articles de revue XML ou son équivalent (TEI, par exemple) améliore considérablement la lisibilité par les machines et l’interopérabilité. Fournir les contenus dans une pléthore de formats numériques (PDF, HTML, XML, ePub, etc.) améliore l’expérience utilisateur et l’utilisabilité de ces contenus sur divers appareils et navigateurs. 

Les polices de caractère utilisées sur la plateforme d’édition et dans le texte intégral doivent prendre en charge Unicode et être en accès ouvert, adaptées à une utilisation multiplateforme et accessible. Les images doivent être en haute résolution et accompagnées d’une légende, tandis que les tableaux doivent être bien structurés, annotés et faciles à lire et à interpréter. Pour chaque article, la page de renvoi et le texte intégral doivent contenir des liens vers les données, le code et autres documents de recherche qui sous-tendent les publications et être disponibles dans des entrepôts externes.

Les métadonnées lisibles par machine, exposées via des protocoles d’échange de métadonnées et sur les pages de renvoi des articles, doivent être fournies dans un format commun qui convient aussi à la préservation numérique (XML, CSV, etc.).


Articles de la toolsuite annexes


Directives annexes


Matériels de formation annexes


Références


Pour en savoir plus

  • Armengou, C., Edig, X. van, Laakso, M., et Umerle, T. (2023). « CRAFT-OA Deliverable 3.1 Report on Standards for Best Publishing Practices and Basic Technical Requirements in the Light of FAIR Principles » (brouillon), Zenodo.  Zenodo. https://doi.org/10.5281/zenodo.8112662
  • Barnes, M., Cole, G., Fry, J., Gatti, R., et Higman, R. (2023). « “Good, Better, Best”: Practices in Archiving and Preserving Open Access Monographs » (1.0), Zenodo. https://doi.org/10.5281/zenodo.7876048
  • Barthonnat, C., Blotière, E., Gingold, A., Mas, F.-X., Stanić, N., Pierno, A., Szulińska, A., Armando, L., Pochet, B., de Santis, L., MacGregor, J., Pozzo, R., et Pogačnik, A. (2021). « OPERAS SIG on Tools for Open Scholarly Communication: White Paper 2021 », Zenodo. https://doi.org/10.5281/zenodo.5654319

 

Glossaire


Foire aux questions


Licence

Ce document est sous licence Creative Commons Attribution 4.0 International License


Menu de la Toolsuite