Metadados
Resumo
Os metadados são cruciais para a descoberta e a divulgação dos resultados publicados. Para garantir que os seus conteúdos serão indexados por motores de pesquisa, agregadores e outros serviços e que chegarão ao público a que se destinam, os editores e os prestadores de serviços devem seguir um conjunto de normas e diretrizes que determinam a forma como os metadados devem ser estruturados, selecionados e distribuídos.
Texto principal
No contexto da publicação académica em acesso aberto, os metadados são elementos digitais de informação que descrevem os resultados publicados (artigos, livros, revistas, etc.). Os metadados são normalmente estruturados de acordo com um modelo de metadados que se baseia numa norma de metadados. Isto assegura que a informação fornecida é significativa tanto para humanos como para máquinas e suficiente para uma identificação inequívoca dos resultados publicados. (Avanço, 2023a; 2023b)
Os metadados mais comuns para os resultados publicados incluem:
- Título(s) (de um artigo / contribuição e a fonte da publicação).
- Nomes completos e afiliações dos autores.
- Resumos.
- Palavras-Chave (controladas ou texto-livre).
- Nome do editor.
- Data da publicação.
- Números internacionais normalizados (ISSN, eISSN, ISBN, ISMN etc.).
- Identificadores persistentes para a publicação (DOI), autores e colaboradores (ORCID), afiliações do autor (ROR), e organizações financiadoras (ROR) e outros identificadores persistentes relevantes.
Os metadados podem também incluir funções de autor (por exemplo, de acordo com a taxonomia CRediT),informações sobre financiamento (por exemplo, o nome do financiador e a identificação da subvenção), informações sobre direitos de autor e licenças, declarações de conflito de interesses e referências bibliográficas. No caso de artigos de revistas ou capítulos de livros, os metadados podem incluir informações sobre o volume ou a edição e a paginação.
Os números normalizados e os identificadores persistentes (PID) das publicações são particularmente úteis para identificar os resultados publicados, uma vez que são registados em registos curados, juntamente com outros metadados que descrevem uma publicação. Graças a este facto, é possível recuperar outros metadados relevantes com base em números padrão ou PIDs. Por exemplo, se um DOI for conhecido, será possível obter o tipo de publicação, o seu título, o editor e a data de publicação, o ISSN e o título da revista, se se tratar de um artigo de revista, etc.
Ao apresentar os metadados nas plataformas de publicação em linha, os editores devem facilitar aos utilizadores a procura de informações relevantes sobre uma produção específica (por exemplo, um artigo de revista) numa única página, sem terem de as procurar noutro local. Para tal, seguindo as recomendações dos motores de busca gerais, como o Google, cada item publicado (artigo, capítulo, livro, etc.) deve ter uma página de destino específica (com um URL único) que apresente os metadados acima referidos e uma ligação para o texto integral.
Para além de disponibilizarem estas informações aos utilizadores humanos, os editores devem garantir que também estão acessíveis a vários motores de pesquisa e agregadores, o que pode aumentar a visibilidade e a utilização do conteúdo publicado. Os motores de pesquisa e os agregadores exigem que os metadados sejam expostos num formato específico (e.g. XML, JSON, HTML, CSV) através de um protocolo adequado de intercâmbio de metadados (Open Access Initiative Protocol for Metadata Harvesting – OAI-PMH, REST API, HTTPS, etc.). Além disso, os metadados legíveis por máquina são também relevantes para os utilizadores humanos que pretendam exportá-los para análise ou importá-los para gestores de referências.Os metadados devem também ser incluídos no texto integral em formatos legíveis por humanos e por máquinas (e.g. incorporados em PDF ou em JATS XML).
A criação de metadados legíveis por máquina exige conhecimentos técnicos, mas, felizmente, os editores não têm de fazer tudo de raiz, uma vez que existem soluções de software gratuitas e de código aberto. Plataformas como a Open Journal Systems ou a Janeway incluem soluções prontas a utilizar para apresentar metadados em páginas de destino para humanos e expô-los para máquinas em vários formatos. No caso dos livros, uma abordagem semelhante está a ser implementada pelo sistema de gestão de metadados Thoth Open Metadata de código aberto e liderado pela comunidade.
Para além de garantirem o cumprimento dos requisitos técnicos para a partilha de metadados, os editores devem também permitir o fluxo contínuo de metadados, libertando-os no domínio público (e.g.utilizando a licença Creative Commons CC0 Public Domain Dedication). Ao fazê-lo, permitem que vários agregadores recolham e divulguem os seus metadados sem terem de pedir autorização ou lidar com questões de licenciamento complicadas. Os metadados de domínio público desempenham um papel fundamental na criação de plataformas de descoberta não comerciais (e.g. OpenAIRE Explore, GoTriple, OpenAlex) e de índices de citação (Peroni & Shotton, 2020). Esta é mais uma razão pela qual os editores devem sempre depositar metadados completos sobre as publicações, incluindo referências bibliográficas, junto de uma agência de registo (e.g. CrossRef, DataCite) em conformidade com as recomendações da Initiative for Open Citations (I4OC) e da Initiative for Open Abstracts (I4OA).
Artigos relacionados com o Conjunto de Ferramentas
- Software e interoperabilidade
- Preservação e formatos de conteúdo
- Práticas de Ciência Aberta
- Visibilidade, indexação, comunicação, marketing e impacto
Diretrizes e Materiais de Formação relacionados
Referências
- Avanço, K. (2023a). What is metadata for publication and how is it used? Part 1: introduction to metadata’. Billet. The Road to FAIR (blog). https://roadtofair.hypotheses.org/499
- Avanço, K. (2023b). What is metadata for publication and how is it used? Part 2: metadata standards’. Billet. The Road to FAIR (blog). https://roadtofair.hypotheses.org/696
- Crossref Metadata Search. https://search.crossref.org/
- Datacite. https://schema.datacite.org/
- DOI Foundation. Digital Object Identifier (DOI). https://www.doi.org/
- GoTriple. https://www.gotriple.eu/
- Initiative for Open Citations (I4OC). https://i4oc.org/
- Initiative for Open Abstracts (I4OA). https://i4oa.org/
- Janeway. https://janeway.systems/
- NISO. (n.d.). Contributor Roles Taxonomy (CRediT). https://credit.niso.org/
- NISO. (n.d.) Journal Article Tag Suite (JATS XML). https://jats.nlm.nih.gov/index.html
- OpenAlex. https://openalex.org/
- OpenAIRE explore. https://explore.openaire.eu/
- Open Archives Initiative. (n.d.). Protocol for Metadata Harvesting. https://www.openarchives.org/pmh/
- Open Journal Systems (OJS). https://pkp.sfu.ca/software/ojs/
- ORCID. https://orcid.org/
- Peroni, S., & David S. (2020). ‘OpenCitations, an infrastructure organization for open scholarship’. Quantitative Science Studies 1(1): 428–44. https://doi.org/10.1162/qss_a_00023
- Research Organization Registry (ROR). https://ror.org/
- Thoth Open Metadata. https://thoth.pub
Leituras complementares
- Edmunds, J. (2023). Metadata and Libraries. https://openaccessbooksnetwork.hcommons.org/2023/11/16/open-metadata-and-libraries/
- van Gerven Oei, V. W. J. (2020). Open metadata in Thoth. https://doi.org/10.21428/785a6451.eb0d86e8
Glossário
- Formato de ficheiro
- Interoperabilidade
- Metadados
- Protocolo de intercâmbio de metadados
- Norma de metadados
Perguntas Mais Frequentes
- Quais são as funcionalidades básicas que uma infraestrutura de publicação deve ter [as infraestruturas de publicação suportam fluxos de trabalho de edição e apresentação]?
- Como é que posso atribuir identificadores persistentes a conteúdos publicados?
- Quais são os formatos de metadados comuns utilizados para exportar metadados de publicações?
- Quais são os protocolos padrão para a recuperação de metadados das infra-estruturas de publicação?
- Quais são as melhores práticas para documentar e preservar conteúdos e metadados ao longo do tempo?
Licenciamento
Este documento está licenciado ao abrigo de uma Creative Commons Attribution 4.0 International License