Tamanho Fonte:
Uma ferramenta para a extração e avaliação da completude dos metadados em bibliotecas digitais abertas
Última alteração: 2025-04-15
Resumo
A crescente produção de artigos científicos reforça a importância dos metadados para a organização em repositórios digitais. Este trabalho apresenta um sistema web que extrai e indexa metadados da SOL, a biblioteca digital da SBC, utilizando padrões como Dublin Core e Schema.org. O sistema automatiza a validação de links, identifica páginas individuais ou coleções de artigos, realiza "web scraping" e organiza os metadados em um banco de dados. Testado com 49 artigos científicos, o sistema demonstrou alta precisão na extração e organização de dados, contribuindo para a melhoria da utilização e busca de informações acadêmicas.
Palavras-chave
Metadados; Web Scrapping; Biblioteca Digital