, CONFOA 2011

Tamanho da fonte: 
Serviço Centralizado de Estatísticas de Utilização em Repositórios
Hélder Silva, Miguel Ferreira, José Carlos Ramalho

Última alteração: 2011-10-10

Resumo


Os repositórios institucionais são uma ferramenta de referência incontornável no processo de investigação científica, constituindo atualmente um indicador da maior importância no cálculo do ranking das melhores universidades do mundo [1].

Atualmente em Portugal, presenciamos a uma mudança de paradigma no que diz respeito à organização e gestão de repositórios institucionais. Passamos do repositório isolado, gerido apenas no contexto da sua instituição acolhedora, para um contexto de consórcio onde vários repositórios cooperam, partilhando ideias, políticas e tecnologias, contribuindo deste modo para o crescimento do conhecimento das comunidades em que estão inseridos [2].

Com esta mudança de paradigma, torna-se relevante explorar os desafios de gestão que o novo contexto apresenta. Para gerir de forma eficaz um consórcio, é fundamental a existência de indicadores que auxiliem na tomada de decisão por parte dos gestores do consórcio, administradores dos repositórios e que atendam às necessidades de informação que as entidades de fomento possuem no que diz respeito ao impacto dos seus investimentos em cultura, investigação, inovação e desenvolvimento.

Um conjunto de indicadores da maior importância diz respeito a estatísticas de utilização dos repositórios. Por estatísticas de utilização entende-se toda a informação respeitante a ações de utilização do sistema por parte dos seus utilizadores, e.g. visualizações de metadados, downloads, depósitos de novos documentos, alterações efectuadas a metadados, etc. Para um gestor de topo, conhecer a utilização que um repositório está a ter e poder comparar esses valores com os vários repositórios participantes no consórcio é uma ferramenta fundamental para determinar os pontos críticos onde é necessário reforçar investimentos, criar novas políticas ou desenvolver novas ações de formação/promoção.

Nesta comunicação pretende-se apresentar o Serviço Centralizado de Estatísticas de Utilização em Repositórios (SCEUR). Trata-se de um projeto inserido no âmbito da iniciativa Repositório Científico de Acesso Aberto de Portugal (RCAAP) [3] que pretende ser uma ferramenta por excelência no auxílio das tarefas de gestão de um consórcio de repositórios institucionais.

O projeto SCEUR partiu de dois objetivos fundamentais:
  1. A construção de uma arquitetura que permitisse recolher e processar dados estatísticos de utilização em repositórios, disponibilizando também serviços adicionais que permitissem apresentar de uma forma intuitiva esses mesmos dados.
  2. Disponibilizar serviços de valor acrescentado para o utilizador como a geração de gráficos em tempo-real, a subscrição do envio periódico de gráficos e estatísticas por correio-eletrónico, oferecer a capacidade de embeber gráficos em sites Web externos à ferramenta, gerar gráficos personalizados com base em parâmetros configuráveis, etc.

O SCEUR recorre a protocolos amplamente conhecidos e vulgarmente usados na interoperabilidade entre sistemas, como é o caso do OAI-PMH [4], para proceder à recolha de informação estatística proveniente dos repositórios. Uma nova interface OAI-PMH foi desenvolvida para os repositórios institucionais baseados na plataforma DSpace [5]. Este add-on permite ao repositório exteriorizar os seus eventos de utilização no formato CTXO [6] possibilitando ao serviço SCEUR a recolha dos eventos de forma periódica e o cálculo de estatísticas relevantes para a gestão do consórcio. O add-on desenvolvido para o DSpace está disponível em código-aberto no sítio Web do projeto RCAAP [7]. Futuramente, este serviço irá implementar também o protocolo SUSHI [8].

O SCEUR disponibiliza aos seus utilizadores dois serviços complementares:                                                                                                                                                                

  1. SCEUR dashboard
  2. SCEUR workbench

O primeiro permite consultar um conjunto pré-definido de estatísticas de utilização sobre os repositórios que pertencem ao consórcio RCAAP. O segundo, e fazendo alusão ao nome, trata-se de uma "bancada de trabalho" que permite ao utilizador configurar e gerar as estatísticas que pretende consultar.

Estão ao seu dispor as seguintes opções:

  • O tipo de evento de utilização que se quer analisar, i.e. downloads, depósitos ou visualização de metadados.
  • Quais os repositórios que se pretendem consultar. O sistema permite agrupar vários repositórios e obter um gráfico comparativo.
  • O intervalo de tempo que pretendemos analisar, e.g. entre datas, último mês, último ano, etc.
  • O tipo de estatística que se pretende obter, i.e. evolução ou ranking.

O utilizador pode ainda configurar parâmetros relacionados com a apresentação gráfica das estatísticas, como é o caso das dimensões do gráfico, cores, título entre outros. O serviço disponibiliza também a capacidade de exportação de dados em Comma Separated Values (CSV) para tratamento estatístico através de ferramentas especializadas e a subscrição do envio periódico por correio-eletrónico da estatística produzida.

Referências

[1] http://www.webometrics.info/

[2] J.M. Moreira, J. Carvalho, R. Saraiva. and E. Rodrigues. Repositório Científico de Acesso Aberto de Portugal: uma ferramenta ao serviço da ciência portuguesa. 2010.

[3] http://www.rcaap.pt/

[4] C. Lagoze and H.V. de Sompel. The Open Archives Initiative: Bulding a low-barrier interoperability framework. Digital Libraries, Joint Conference on, 0:54-62, 2001.

[5] M. Smith, M. Barton, M. Bass, M. Branshofsky, G. McClellan, D. Stuve, R. Tansley, and J.H. Walker. DSpace: An open source dynamic digital repository. D-Lib Magazine, 9(1), 2003.

[6] N.I.S. Organization. ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services. Technical report, 2004.

[7] http://projecto.rcaap.pt/

[8] M.H. Needleman. The NISO Standardized Usage Statistics Harvesting Initiative (SUSHI). Serial Review, 32(3):216-217, 2006.


Palavras-chave


Estatísticas de utilização; Repositórios institucionais; Open Access; OAI-PMH; SUSHI; Interoperabilidade; RCAAP; SCEUR