Tamanho da fonte:
Planejamento e desenvolvimento de serviço de informação em pesquisa agropecuária: Caso do Sistema Aberto e Integrado de Informação em Agricultura (Sabiia)
Última alteração: 2011-10-10
Resumo
1. Introdução
A experiência com o planejamento e o desenvolvimento de um serviço de informação em pesquisa agropecuária baseado em padrões abertos interoperáveis e software livre é o tema apresentado nesse trabalho. No contexto da organização, tratamento e disseminação da informação na Internet, o Sistema Embrapa de Bibliotecas (SEB), em cooperação com o projeto Acesso Aberto à Informação Científica na Embrapa (liderado pela Embrapa Informação Tecnológica) e a Embrapa Informática Agropecuária, definiram como objetivo estratégico a construção do repositório digital Infoteca-e (Informação Tecnológica em Agricultura), repositório institucional Alice (Acesso Livre à Informação Científica da Embrapa) e do provedor de serviços: Sabiia (Sistema Aberto e Integrado de Informação em Agricultura), com o propósito de favorecer a transferência de tecnologias produzidas pela Embrapa, o aumento da visibilidade da produção científica dos pesquisadores, e da própria instituição, por meio da maximização do acesso à sua própria produção intelectual, e por consequência, a ampliação dos resultados de pesquisa realizados na Embrapa, como também, acessar diversas fontes de informações técnico-científicas de interesse da pesquisa agropecuária.
No modelo metodológico proposto no âmbito do projeto, definiu-se a constituição de uma rede de informação técnico-científica na área de pesquisa agropecuária e áreas afins. Sua estruturação leva em consideração a infraestrutura funcional da iniciativa de arquivos aberto (sobre a qual o movimento de acesso aberto à informação científica torna-se factível) que é constituída basicamente dos elementos: i) provedores de dados, ii) provedores de serviços e iii) protocolo de comunicação aberto que permite a exposição e coleta de metadados.
O provedor de serviços de informação em pesquisa agropecuária, como um dos elementos do modelo metodológico de gestão da informação científica, constitui-se como o elemento centralizador e canalizador da informação científica interna e da informação científica externa à Embrapa. Por meio do mecanismo de busca oferecido, os usuários recuperam publicações técnico-científicas sobre agricultura e áreas afins em diversas instituições nacionais e internacionais. Portanto, a rede de informação técnico-científica reúne informações de publicações de provedores de dados agropecuários (como periódicos científicos, repositórios digitais institucionais, temáticos e de eventos, bibliotecas digitais e outros) possibilitando o acesso ao texto integral (como livros, capítulos de livros, artigos em periódicos, folhetos, teses, anais, proceedings de eventos, entre outros).
2. Objetivos
No que concerne aos objetivos gerais do provedor de serviços destacam-se: i) identificar e coletar metadados de provedores de dados da área de pesquisa agropecuária e áreas afins disponíveis em ambiente de acesso aberto no Brasil e no mundo; ii) disponibilizar os metadados coletados em um sistema de recuperação de informação (mecanimo de busca); iii) expor os metadados coletados para outros provedores de serviços ou sistema de informação que porventura tenham interesse em coletá-los; iv) monitorar permanentemente o surgimento de novos provedores de dados; v) estabelecer e reavaliar, quando se fizer necessário, política de desenvolvimento da coleção que compõe o sistema.
3. Público-alvo
O serviço de informação desenvolvido é destinado à comunidade de pesquisadores da Embrapa e às comunidades científicas da área de pesquisa agropecuária e áreas correletas em geral. Neste sentido estão incluídas universidades (pesquisadores, alunos de graduação e pós-graduação), instituições de pesquisa, laboratórios, agências de fomento, formuladores de políticas de C&T na área, dentre outros.
4. Política de desenvolvimento da coleção
O provedor de serviços da Embrapa lida exclusivamente com a informação de natureza técnico-científica, ou seja, aquele que serve de insumo e é resultante das atividades de pesquisa, desenvolvimento e inovação. Neste âmbito estão presentes tanto as diversas manifestações da comunicação científica, como artigos de periódicos científicos, trabalhos apresentados em congressos, relatórios técnicos ou de pesquisa, teses, dissertações, capítulos de livros, livros, conjuntos de dados de pesquisa, simulações, e outros. Para que qualquer provedor de dados seja coletado é necessário atender aos critérios gerais:
Pertencer à area de pesquisa agropecuária ou área correleta;
Fornecer acesso ao texto completo à maior parte dos conteúdos. No caso de repositórios institucionais, por orientação de políticas da instituição, eventualmente determinados conteúdos não estão disponíveis em seu inteiro teor, constituindo assim uma exceção;
Não apresentar ou não permanecer apresentando erros XML ou de caracteres como UTF-8;
Utilizar o protocolo OAI-PMH para intercâmbio de dados contendo, pelo menos, os seguintes metadados: título, autor, data, assunto e link para acessar o texto completo do documento.
5. Atores envolvidos no processo e suas respectivas responsabilidades
A sistematização preconizada propôs o envolvimento de diferentes atores que possuem responsabilidades específicas.
5.1 A Embrapa
Possui dois papéis no escopo do sistema: i) é a instituição que coordena e mantém o provedor de dados, especificamente por meio da Embrapa Informação Tecnológica (unidade coordenadora) e da Embrapa Informática Agropecuária (unidade responsável pelo desenvolvimento tecnológico); ii) instituição provedora de dados para o sistema: repositório institucional e periódicos científicos. A Embrapa não se responsabiliza pela qualidade científica dos conteúdos oferecidos por provedores de dados externos.
5.2 Provedores de dados
Instituições que mantém “arquivos” digitais de acesso aberto (repositórios institucionais, repositórios temáticos, bibliotecas digitais, periódicos científicos eletrônicos, e outros) que serão coletados pelo provedor de serviços da Embrapa. Tais instituições estão sendo beneficiadas na medida em que seus conteúdos estão automaticamente disponíveis e acessíveis à um público especializado, aumentando exponencialmente sua visibilidade. Os provedores de dados devem comprometer-se à oferecer acesso ao texto completo à maior parte de seus conteúdos, conforme pressupõe a filosofia de acesso aberto.
5.3 Usuários
Pesquisadores e estudantes de outras universidades e instituições de pesquisa. Sobre os usuários não recai responsabilidade alguma.
6. Levantamento de provedores de dados
Um exame preliminar identificou um total de 261 provedores de dados em áreas de interesse da Embrapa. Dentre eles, 52 periódicos nacionais, 74 periódicos estrangeiros, 27 repositórios institucionais e temáticos, 4 repositórios de conferências, e 104 periódicos nacionais e estrangeiros disponíveis no SciELO. Dos 261 provedores de dados identificados e selecionados, cerca de 121 (46%) provedores de dados disponibilizam seus metadados para uso por outros sistemas de informação.
7. Resultados e discussão
O Sabiia (Sistema Aberto e Integrado de Informação em Agricultura) foi lançado oficialmente no aniversário da Embrapa em Abril de 2011, o sistema está disponível no endereço: htt://www.embrapa.br/sabiia com aproximadamente 215.000 documentos indexados em 121 provedores de dados. O intercâmbio de dados entre provedores de dados e provedores de serviços previsto pelo protocolo OAI-PMH, possibilitam a criação de novos serviços de valor agregado. O Sabiia é um exemplo prático de criação de serviço com valor agregado, onde metadados expostos em escala planetária por diversos provedores de dados OAI-PMH do setor agropecuário e área afins são centralizados, unificados e disponibilizados em uma única interface para consulta.
A adoção de padrões abertos e interoperáveis, associada ao acesso livre e irrestrito aos dados e informações configuram uma nov oportunidade para construção de aplicações digitais e democratização do acesso aos resultados de pesquisas e do conhecimento em geral.
A experiência com o planejamento e o desenvolvimento de um serviço de informação em pesquisa agropecuária baseado em padrões abertos interoperáveis e software livre é o tema apresentado nesse trabalho. No contexto da organização, tratamento e disseminação da informação na Internet, o Sistema Embrapa de Bibliotecas (SEB), em cooperação com o projeto Acesso Aberto à Informação Científica na Embrapa (liderado pela Embrapa Informação Tecnológica) e a Embrapa Informática Agropecuária, definiram como objetivo estratégico a construção do repositório digital Infoteca-e (Informação Tecnológica em Agricultura), repositório institucional Alice (Acesso Livre à Informação Científica da Embrapa) e do provedor de serviços: Sabiia (Sistema Aberto e Integrado de Informação em Agricultura), com o propósito de favorecer a transferência de tecnologias produzidas pela Embrapa, o aumento da visibilidade da produção científica dos pesquisadores, e da própria instituição, por meio da maximização do acesso à sua própria produção intelectual, e por consequência, a ampliação dos resultados de pesquisa realizados na Embrapa, como também, acessar diversas fontes de informações técnico-científicas de interesse da pesquisa agropecuária.
No modelo metodológico proposto no âmbito do projeto, definiu-se a constituição de uma rede de informação técnico-científica na área de pesquisa agropecuária e áreas afins. Sua estruturação leva em consideração a infraestrutura funcional da iniciativa de arquivos aberto (sobre a qual o movimento de acesso aberto à informação científica torna-se factível) que é constituída basicamente dos elementos: i) provedores de dados, ii) provedores de serviços e iii) protocolo de comunicação aberto que permite a exposição e coleta de metadados.
O provedor de serviços de informação em pesquisa agropecuária, como um dos elementos do modelo metodológico de gestão da informação científica, constitui-se como o elemento centralizador e canalizador da informação científica interna e da informação científica externa à Embrapa. Por meio do mecanismo de busca oferecido, os usuários recuperam publicações técnico-científicas sobre agricultura e áreas afins em diversas instituições nacionais e internacionais. Portanto, a rede de informação técnico-científica reúne informações de publicações de provedores de dados agropecuários (como periódicos científicos, repositórios digitais institucionais, temáticos e de eventos, bibliotecas digitais e outros) possibilitando o acesso ao texto integral (como livros, capítulos de livros, artigos em periódicos, folhetos, teses, anais, proceedings de eventos, entre outros).
2. Objetivos
No que concerne aos objetivos gerais do provedor de serviços destacam-se: i) identificar e coletar metadados de provedores de dados da área de pesquisa agropecuária e áreas afins disponíveis em ambiente de acesso aberto no Brasil e no mundo; ii) disponibilizar os metadados coletados em um sistema de recuperação de informação (mecanimo de busca); iii) expor os metadados coletados para outros provedores de serviços ou sistema de informação que porventura tenham interesse em coletá-los; iv) monitorar permanentemente o surgimento de novos provedores de dados; v) estabelecer e reavaliar, quando se fizer necessário, política de desenvolvimento da coleção que compõe o sistema.
3. Público-alvo
O serviço de informação desenvolvido é destinado à comunidade de pesquisadores da Embrapa e às comunidades científicas da área de pesquisa agropecuária e áreas correletas em geral. Neste sentido estão incluídas universidades (pesquisadores, alunos de graduação e pós-graduação), instituições de pesquisa, laboratórios, agências de fomento, formuladores de políticas de C&T na área, dentre outros.
4. Política de desenvolvimento da coleção
O provedor de serviços da Embrapa lida exclusivamente com a informação de natureza técnico-científica, ou seja, aquele que serve de insumo e é resultante das atividades de pesquisa, desenvolvimento e inovação. Neste âmbito estão presentes tanto as diversas manifestações da comunicação científica, como artigos de periódicos científicos, trabalhos apresentados em congressos, relatórios técnicos ou de pesquisa, teses, dissertações, capítulos de livros, livros, conjuntos de dados de pesquisa, simulações, e outros. Para que qualquer provedor de dados seja coletado é necessário atender aos critérios gerais:
Pertencer à area de pesquisa agropecuária ou área correleta;
Fornecer acesso ao texto completo à maior parte dos conteúdos. No caso de repositórios institucionais, por orientação de políticas da instituição, eventualmente determinados conteúdos não estão disponíveis em seu inteiro teor, constituindo assim uma exceção;
Não apresentar ou não permanecer apresentando erros XML ou de caracteres como UTF-8;
Utilizar o protocolo OAI-PMH para intercâmbio de dados contendo, pelo menos, os seguintes metadados: título, autor, data, assunto e link para acessar o texto completo do documento.
5. Atores envolvidos no processo e suas respectivas responsabilidades
A sistematização preconizada propôs o envolvimento de diferentes atores que possuem responsabilidades específicas.
5.1 A Embrapa
Possui dois papéis no escopo do sistema: i) é a instituição que coordena e mantém o provedor de dados, especificamente por meio da Embrapa Informação Tecnológica (unidade coordenadora) e da Embrapa Informática Agropecuária (unidade responsável pelo desenvolvimento tecnológico); ii) instituição provedora de dados para o sistema: repositório institucional e periódicos científicos. A Embrapa não se responsabiliza pela qualidade científica dos conteúdos oferecidos por provedores de dados externos.
5.2 Provedores de dados
Instituições que mantém “arquivos” digitais de acesso aberto (repositórios institucionais, repositórios temáticos, bibliotecas digitais, periódicos científicos eletrônicos, e outros) que serão coletados pelo provedor de serviços da Embrapa. Tais instituições estão sendo beneficiadas na medida em que seus conteúdos estão automaticamente disponíveis e acessíveis à um público especializado, aumentando exponencialmente sua visibilidade. Os provedores de dados devem comprometer-se à oferecer acesso ao texto completo à maior parte de seus conteúdos, conforme pressupõe a filosofia de acesso aberto.
5.3 Usuários
Pesquisadores e estudantes de outras universidades e instituições de pesquisa. Sobre os usuários não recai responsabilidade alguma.
6. Levantamento de provedores de dados
Um exame preliminar identificou um total de 261 provedores de dados em áreas de interesse da Embrapa. Dentre eles, 52 periódicos nacionais, 74 periódicos estrangeiros, 27 repositórios institucionais e temáticos, 4 repositórios de conferências, e 104 periódicos nacionais e estrangeiros disponíveis no SciELO. Dos 261 provedores de dados identificados e selecionados, cerca de 121 (46%) provedores de dados disponibilizam seus metadados para uso por outros sistemas de informação.
7. Resultados e discussão
O Sabiia (Sistema Aberto e Integrado de Informação em Agricultura) foi lançado oficialmente no aniversário da Embrapa em Abril de 2011, o sistema está disponível no endereço: htt://www.embrapa.br/sabiia com aproximadamente 215.000 documentos indexados em 121 provedores de dados. O intercâmbio de dados entre provedores de dados e provedores de serviços previsto pelo protocolo OAI-PMH, possibilitam a criação de novos serviços de valor agregado. O Sabiia é um exemplo prático de criação de serviço com valor agregado, onde metadados expostos em escala planetária por diversos provedores de dados OAI-PMH do setor agropecuário e área afins são centralizados, unificados e disponibilizados em uma única interface para consulta.
A adoção de padrões abertos e interoperáveis, associada ao acesso livre e irrestrito aos dados e informações configuram uma nov oportunidade para construção de aplicações digitais e democratização do acesso aos resultados de pesquisas e do conhecimento em geral.
Palavras-chave
Repositórios institucionais; Repositórios Digitais; Comunicação Científica; Acesso Aberto; Acesso Livre; Padrões Abertos; OAI-PMH; Provedores de Serviços; Software Livre; Pesquisa Agropecuária;