Conferências Acesso Aberto, 16ª Conferência Lusófona de Ciência Aberta

Tamanho Fonte: 
Um Sistema de Visualização de Métricas de Repositórios Institucionais Integrado ao DSpace 8
Diogo Soares Moreira, Angela Emi Yanai, Gustavo Augusto Palmeira Oliveira, Douglas Farias Teles, Acsa Costa de Oliveira dos Santos, Jakeline Gimaque de Oliveira

Última alteração: 2025-04-15

Resumo


Os Repositórios Institucionais (RIs) são plataformas digitais que armazenam e disponibilizam os resultados de pesquisas científicas e tecnológicas de uma instituição. Eles desempenham um papel crucial na gestão do conhecimento, permitindo que os resultados das pesquisas sejam acessíveis a uma audiência mais ampla. Segundo Lynch (2003), os RIs são uma infraestrutura essencial para a pesquisa acadêmica na era digital, pois facilitam o acesso livre e a preservação de documentos acadêmicos.

Ademais, a gestão eficaz de um RI requer a implementação de métricas e indicadores que permitam avaliar a produção científica e tecnológica de uma instituição. A visualização desses indicadores é fundamental para a análise e gestão da atividade científica, como destacado por Marcondes e Sayão (2009). Estudos como o de Reis, Spinola e Amaral (2017) têm mostrado que a visualização de indicadores bibliométricos e altmétricos ainda é incipiente em muitos RIs. Isso indica uma necessidade de desenvolver sistemas que possam extrair, processar e visualizar esses dados de maneira eficaz, permitindo uma melhor compreensão da dinâmica da atividade científica.

Neste trabalho, é proposto um sistema integrado de visualização de métricas alternativas, e integrado ao DSpace 8, para construção de indicadores para repositórios. Este sistema foi implementado a parte, fora do DSpace, de modo a facilitar a integração entre coleta de métricas e visualização de forma aberta e transparente para usuários de um RI, o módulo proposto foi construído como uma aplicação separada, feita na linguagem de programação python.

Essa aplicação atua em duas frentes: i) extrator de dados do repositório para uma base de dados intermediária feita em MongoDB e ii) api de dados, fornecendo via api REST dados para a ferramenta DSpace, sendo necessário ajustes no código do DSpace para realização de consultas a esta api.

A extração de dados é realizada periodicamente através de jobs agendados que executam consultas SQL diretamente no banco de dados PostgreSQL do DSpace. Estes dados são processados e transformados em métricas analíticas como produção por comunidade ao longo do tempo, distribuição por tipo de documento, entre outros. O MongoDB foi escolhido para armazenar estes dados preprocessados devido à sua flexibilidade com documentos e capacidade de consulta eficiente para análises complexas. A API Flask foi desenvolvida para servir dois tipos de endpoints: os que retornam dados em formato JSON para consumo pelo frontend Angular do DSpace, e endpoints que geram diretamente imagens de gráficos prontos para uso, facilitando a integração com os relatórios. O Redis é utilizado como camada de cache, reduzindo o tempo de resposta para consultas frequentes.

Por fim, a integração com o DSpace 8 é feita através de widgets incorporados via AngularJS. Atualmente a solução encontra-se em fase de testes com previsão de ser colocada em produção no 2o. semestre de 2025.



Palavras-chave


DSpace; visualização de métricas; repositórios institucionais