Métadonnées
Résumé
Les métadonnées sont essentielles pour la découvrabilité et la dissémination des publications. Pour s’assurer non seulement que leur contenu sera indexé par les moteurs de recherche, agrégateurs et autres services, mais aussi qu’il atteindra le public visé, les éditeurs et les fournisseurs de services doivent suivre un ensemble de normes et de directives établissant la manière de structurer, de gérer et de distribuer ces métadonnées.
Texte détaillé
Dans le monde de l’édition scientifique et savante en accès ouvert, les métadonnées sont des objets numériques servant à décrire les publications (articles, livres, revues, etc.). Elles sont généralement structurées selon un modèle qui repose sur une norme. Cette approche garantit que les informations fournies sont pertinentes pour les humains comme pour les machines et suffisantes pour l’identification claire des publications (Avanço 2023a ; 2023b).
Les métadonnées de publications les plus communes sont les suivantes :
- les titres (celui du texte et celui de la publication source) ;
- les noms complets et les affiliations institutionnelles des auteurs ;
- le résumé ;
- les mots-clés (contrôlés ou en texte libre) ;
- le nom de l’éditeur ;
- la date de publication ;
- le numéro international standard applicable (ISSN, eISSN, ISBN, ISMN, etc.) ;
- les identifiants pérennes de la publication(DOI), des auteurs et collaborateurs (ORCID), des affiliations des auteurs (ROR), et des organismes de financement (ROR), ainsi que tout autre identifiant pérenne pertinent.
Les métadonnées peuvent aussi inclure le rôle des auteurs (selon la taxonomie CRediT par exemple), des renseignements sur le financement (le nom du bailleur de fonds et le numéro de référence de la subvention, par exemple), des informations sur le droit d’auteur et la concession de licences, un énoncé sur les conflits d’intérêts et les références bibliographiques. Et, dans le cas des articles de revues ou des chapitres de livres, elles peuvent comprendre des informations sur le volume ou le numéro et la pagination.
Les numéros standards et les identifiants pérennes des publications sont particulièrement utiles pour identifier les publications, car ils sont enregistrés dans des registres soigneusement gérés, accompagnés d’autres métadonnées décrivant une publication. Ainsi, il est possible de récupérer d’autres métadonnées pertinentes à partir d’un numéro standard ou d’un identifiant pérenne. Par exemple, avec un DOI, il devient possible de récupérer le type de publication, son titre, l’éditeur, la date de publication, l’ISSN et le titre de la revue s’il y a lieu, etc.
Lors de l’affichage des métadonnées sur leurs plateformes en ligne, les éditeurs doivent simplifier la possibilité de trouver sur une seule page toutes les informations pertinentes concernant une publication particulière (par exemple, un article de revue), sans que les utilisateurs doivent chercher ailleurs. À cette fin, et suivant les recommandations des moteurs de recherche généraux comme Google, chaque publication (article, chapitre, livre, etc.) doit comprendre une page de renvoi dédiée (avec URL unique) affichant les métadonnées mentionnées plus haut et un lien vers le texte intégral.
En plus de mettre ces informations à la disposition des utilisateurs humains, les éditeurs doivent aussi veiller à ce que les moteurs de recherche et les agrégateurs puissent les trouver, ce qui ne pourra qu’accroître la visibilité et l’utilisation des contenus publiés. Les moteurs de recherche et les agrégateurs exigent que les métadonnées se présentent dans un format particulier (XML, JSON, HTML, CSV, etc.) par l’intermédiaire d’un protocole d’échange de métadonnées approprié (Open Access Initiative Protocol for Metadata Harvesting – OAI-PMH, REST API, HTTPS, etc.). De plus, les métadonnées lisibles par machine sont aussi pertinentes pour les utilisateurs humains qui souhaitent les exporter pour analyse ou les importer dans des gestionnaires de références. Les métadonnées doivent aussi figurer dans le texte intégral, dans un format que peuvent lire les humains comme les machines (intégrées dans un PDF, par exemple, ou dans une JATS XML).
La préparation de métadonnées lisibles par machine nécessite un savoir-faire technique, mais heureusement, les éditeurs ne partent pas de zéro, car il existe des logiciels libres et en accès ouvert. Des plateformes comme Open Journal Systems ou Janeway proposent des solutions prêtes à l’emploi pour afficher les métadonnées sur les pages de renvoi pour les humains et les exposer aux machines dans plusieurs formats. Une approche similaire existe pour les livres, en l’occurrence Thoth Open Metadata le système de gestion de métadonnées en accès ouvert dirigé par les pairs.
En plus de respecter les exigences techniques de partage des métadonnées, les éditeurs doivent permettre la transmission facile des métadonnées en les mettant dans le domaine public (par exemple, en utilisant la licence de déclaration de domaine public Creative Commons CC0). Ce faisant, ils permettent à divers agrégateurs de récolter et de diffuser leurs métadonnées sans devoir demander de permission ni gérer de problèmes de licence complexes. Les métadonnées dans le domaine public sont importantes pour la construction de plateformes de découverte non commerciales (OpenAIRE Explore, GoTriple, OpenAlex .etc) et d’index de citations (Peroni et Shotton, 2020). C’est une raison supplémentaire pour laquelle les éditeurs devraient toujours déposer des métadonnées complètes sur les publications, y compris les références bibliographiques, auprès d’une agence d’enregistrement (CrossRef, DataCite etc.), conformément aux recommandations de l'Initiative for Open Citations (I4OC) et de Initiative for Open Abstracts (I4OA).
Articles de la toolsuite annexes
- Logiciels et interopérabilité
- Formats et préservation des contenus
- Pratiques de science ouverte
- Visibilité, indexation, communication, marketing et impact
Directives annexes
Matériels de formation annexes
Références
- Avanço, K. (2023a). What is metadata for publication and how is it used? Part 1: introduction to metadata’. Billet. The Road to FAIR (blog). https://roadtofair.hypotheses.org/499
- Avanço, K. (2023b). What is metadata for publication and how is it used? Part 2: metadata standards’. Billet. The Road to FAIR (blog). https://roadtofair.hypotheses.org/696
- Crossref Metadata Search. https://search.crossref.org/
- Datacite. https://schema.datacite.org/
- DOI Foundation. Digital Object Identifier (DOI). https://www.doi.org/
- GoTriple. https://www.gotriple.eu/
- Initiative for Open Citations (I4OC). https://i4oc.org/
- Initiative for Open Abstracts (I4OA). https://i4oa.org/
- Janeway. https://janeway.systems/
- NISO. (n.d.). Contributor Roles Taxonomy (CRediT). https://credit.niso.org/
- NISO. (n.d.) Journal Article Tag Suite (JATS XML). https://jats.nlm.nih.gov/index.html
- OpenAlex. https://openalex.org/
- OpenAIRE explore. https://explore.openaire.eu/
- Open Archives Initiative. (n.d.). Protocol for Metadata Harvesting. https://www.openarchives.org/pmh/
- Open Journal Systems (OJS). https://pkp.sfu.ca/software/ojs/
- ORCID. https://orcid.org/
- Peroni, S., et David S. (2020). « OpenCitations, an Infrastructure Organization for Open Scholarship », Quantitative Science Studies, 1 (1), pp. 428–444. https://doi.org/10.1162/qss_a_00023
- Registre des organisations de recherche. https://ror.org/
- Thoth Open Metadata. https://thoth.pub
Pour en savoir plus
- Edmunds, J. (2023). Metadata and Libraries. https://openaccessbooksnetwork.hcommons.org/2023/11/16/open-metadata-and-libraries/
- van Gerven Oei, V.W.J. (2020). Open Metadata in Thoth. https://doi.org/10.21428/785a6451.eb0d86e8
Glossaire
Foire aux questions
- Quelles sont les fonctionnalités de base qu’une infrastructure d’édition devrait posséder ?
- Comment puis-je attribuer un identifiant pérenne à un contenu publié ?
- Quels sont les formats de métadonnées de publication les plus utilisés pour l’exportation ?
- Quels sont les protocoles normalisés pour récupérer les métadonnées des infrastructures d’édition ?
- Quelles sont les meilleures pratiques pour préserver dans la durée les contenus et leurs métadonnées ?
Licence
Ce document est sous licence Creative Commons Attribution 4.0 International License