Tamanho da fonte: 
A importância das palavras-chave dos artigos científicos depositados no repositório Estudo Geral: estudo comparativo com os termos atribuídos na MEDLINE
Ana Miguéis, Ana Luísa Silva, Bruno Neves, Álvaro Trindade, José Augusto Bernardes

Última alteração: 2013-07-29

Resumo


Objetivos: Este trabalho tem por objetivo analisar as palavras-chave usadas pelos autores da Universidade de Coimbra, nos artigos publicados na área das Ciências da Saúde, comparando-as com os termos da linguagem documental Medical Subject Headings (MeSH), que são empregues na análise de conteúdo desses mesmos artigos. No âmbito dos artigos científicos, as palavras-chave expõem a abrangência de um assunto e os seus conceitos principais, que se podem revelar úteis para a indexação em mecanismos de pesquisa ou para a categorização do texto. A investigação sobre a importância e caraterísticas das palavras-chave tem incidido sobre vários aspetos, como, o da eficiência na recuperação da informação; o uso para a extração automática a partir de diferentes metodologias e algoritmos; o uso por parte dos autores e editores; mais recentemente, a sua utilização nos comportamentos de etiquetagem (metatags); e a comparação com os títulos, resumos e textos integrais, o que confirma do interesse que despertam. Mas, na revisão da literatura, foram poucos os trabalhos encontrados que abordassem a comparação das palavras-chave fornecidas pelos autores de artigos científicos e os descritores empregues pelos indexadores, analisando o contributo que podem dar para a escolha dos termos de indexação.

Metodologia: Após a revisão bibliográfica exploratória na literatura especializada, delimitou-se o corpus, constituído por 290 artigos científicos publicados em revistas internacionais, da comunidade da Faculdade de Farmácia, depositados no Estudo Geral, editados entre 1996 e 2012, e depositados até final de dezembro de 2012. O acesso a estes artigos científicos, armazenados em repositórios de acesso aberto, faz-se a partir dos metadados e do conteúdo de texto integral, aplicando técnicas que representam e expõem as relações semânticas entre documentos, em que os dados são relacionados. Os objetivos específicos a alcançar pretendiam: (i) identificar e aferir o número de palavras-chave colocadas na versão depositada no Estudo Geral e na versão publicada pela editora; e o número de descritores atribuídos pela MEDLINE; (ii) verificar as palavras-chave, usadas pelos autores, que coincidem ou se relacionam com os termos do MeSH. No início da recolha da informação definiram-se algumas condições prévias, nomeadamente, fazer uma primeira comparação com as palavras-chave presentes na versão publicada pelo editor da revista, identificando-se, primeiro, os nomes das publicações periódicas a que pertenciam e confirmando-se, de seguida, o número de palavras-chave existentes em ambos os recursos. Num momento posterior e, reunidas todas as palavras-chave existentes para cada um dos artigos, compararam-se, então, com os com os descritores MeSH atribuídos aos títulos indexados na base de dados MEDLINE. As palavras-chave recolhidas a partir dos metadados dos registos dos artigos depositados no repositório e da versão final da editora, foram organizadas, para cada artigo, numa grelha, juntamente com os termos eleitos pela MEDLINE. Para além destes elementos, foram adicionados campos de descrição, como, título, autor e ano de publicação. Na determinação quantitativa das relações identificadas entre as palavras-chave e os descritores MeSH, foram consideradas as relações de equivalência (idênticas), e as relações associativas (relacionadas).

Resultados e discussão: Os resultados obtidos confirmam o entendimento de que as palavras-chave recolhidas nos metadados dos artigos depositados no Estudo Geral, ainda que sendo as mesmas, são apenas cerca de metade de todas as palavras-chave presentes na versão publicada pela editora da revista. Este facto determinou que a análise dos resultados incidisse apenas nas palavras-chave existentes na versão da editora, comparando-as com os descritores MeSH atribuídos aos títulos indexados na base de dados MEDLINE. Nesta comparação verificou-se que o número de palavras-chave é significativamente mais baixo do que os termos empregues pela MEDLINE. No que se refere à frequência do número de palavras-chave por artigo, a maioria dos artigos não apresenta mais que seis palavras-chave, sendo bem mais dilatada a frequência da atribuição dos descritores da MEDLINE. Do ponto de vista semântico, no que respeita às relações de equivalência e de associação entre as palavras-chave e os descritores da MEDLINE, mais de metade das palavras-chave apresentavam relações de equivalência ou associativas, em proporções semelhantes. Do mesmo modo, a frequência das relações estabelecidas pelas palavras-chave situa-se, maioritariamente, entre 1 a 2 conceitos equivalentes e 1 a 2 conceitos associados por artigo, o que confirma a importância das palavras-chave escolhidas pelos autores para a representação da informação.

Conclusões: Face aos resultados apurados, pode-se afirmar que as palavras-chave representam uma importante fonte de acesso aos artigos científicos, o que foi comprovado no estudo realizado dos artigos indexados pela base de dados MEDLINE. Assim, nos 290 artigos analisados, o número de relações equivalentes e associativas é aproximado, ainda que as percentagens não sejam muito elevadas, indo ao encontro dos resultados obtidos por outros autores, e permitem concluir por uma influência direta ou indireta na escolha dos descritores, que promove a utilização das palavras-chave na aprendizagem da indexação por assuntos e nos esforços a desenvolver para automatizar o processo de indexação automática. Ao utilizar o Estudo Geral como suporte a este trabalho, defende-se o propósito de chamar a atenção para o repositório institucional da Universidade de Coimbra e para a importância dos autores, enquanto intervenientes ativos no processo de representação e recuperação da informação, através das palavras-chave registadas nos seus artigos. Reconhecer a importância das palavras-chave para a representação e recuperação de informação, é uma forma de promover o autodepósito e de estimular o completo preenchimento dos metadados dos documentos depositados, como forma de contribuir para uma maior visibilidade, probabilidade de aumento de citações e impacto da produção científica dos autores depositantes, e da própria instituição.


Palavras-chave


Recuperação da informação; Linguagens de indexação; Palavras-chave; Artigos científicos; Medical Subject Headings