Jorge Morato, Juan Llorens, Sonia Sánchez-Cuadrado, Gonzalo Génova. "Guidelines for the Development of an Automatic System to Measure Bibliometric Indicators", Proceedings of The 7th World Multiconference on Systemics, Cybernetics and Informatics-SCI'2003, July 27-30, 2003, Orlando, Florida, USA, vol. XII, pp. 374-379.

 

Abstract

Bibliometric indicators have been widely used in the last thirty years. Recent progress in automatic document analysis has enabled powerful tools to extract, measure and develop these variables. Taking advantage of the large amount of data processed, an automatic program has been developed to collect bibliometric variables, jointly with contextual information. A holistic approach is proposed to analyze sets of variables as a whole. Some relationships with metadata and linguistic variables are examined like words frequency (negative particles, acronyms, pronouns, etc.) and average words in different locations. The system has been tested within differente contexts, type documents, and document structures.

Resumen

Los indicadores bibliométricos han sido ampliamente usados en los últimos treinta años. Los recientes progresos en el análisis automático de documentos han dado lugar a potentes herramientas que extraen, miden y desarrollan estas variables. Aprovechando la gran cantidad de datos procesados, hemos desarrollado un programa automático que reúne variables bibliométricas, juntamente con información contextual. Proponemos un enfoque holístico para analizar los conjuntos de variables como un todo. Examinamos algunas relaciones con metadatos y variables lingüísticas, tales como frecuencia de palabras (partículas negativas, acrónimos, pronombres, etc.) y promedio de palabras en distintos lugares. El sistema ha sido probado en diferentes contextos, tipos de documentos y estructuras de documentos.