Propuesta de procedimiento para la construcción semiautomática de tesauros en Bibliotecas Universitarias
Resumen
Objetivo Se proponen procedimientos de índole teóricos en la indización, y a la vez introduciéndose en parcelas de las Ciencias de la Computación para resolver problemas de la Red TIC del Proyecto VLIR desde una óptica multidisciplinar, dada las características imponen el reto de intentar desarrollar cualquier proceso normativo en el terreno de la indización para un entorno complejo y pluridisciplinar, siendo la primera vez que se asume un trabajo en Ciencias de la Información en la Universidad Central “Marta Abreu” de Las Villas (UCLV). Diseño/Metodología/Enfoque se utilizaron las técnicas de origen matemático: la Ley de Zip, TF-IDF, N-grams y Stop World Elimination, aportando un enfoque mixto predominantemente cuantitativo. La descripción sirve de guía para la construcción de léxicos especializados, al incluir los mecanismos de construcción basados en las reglas exigidas a nivel internacional. Resultados/Discusión: Desde el diagnóstico de los Procesos de Indización en las Bibliotecas asociadas a la Red TIC del Proyecto VLIR, se aplicaron métodos y técnicas en la recopilación de información permitieron obtener resultados relacionados a la experiencia en los procesos de indización y construcción de tesauros en las diversas universidades del país. Conclusiones: La creación de un procedimiento que proporcione la transformación de los vocabularios controlados en un lenguaje interoperable, facilita la indización y la recuperación eficiente de la información. Originalidad/Valor: El impacto social de uso estriba en que al contener datos estandarizados en formato SKOS, las plataformas que usa y desarrolla la red podrán interpretar con otras plataformas con fines similares dando visibilidad a la ciencia de la Red TIC.
Palabras clave
Texto completo:
PDFReferencias
Atkins, B. (1992). Tools for Computer-aided Corpus Lexicography: The Hector Project II. Akadémiai Kiadó, 41(1-4), 5-71.
Biber, D.; Conrad, S.; & Reppen, R. (1998). Corpus linguistics investigating language structure and use. Tesol Quaterly, 32(4), 789-790. https://doi.org/10.2307/3588017
Bowker, L.; Pearson, J. (2002). Working with specialized language. Routledge, Londres: Language & Literature.
Carras, C. (2004). Tesauros y Ontologías. 3 de abril de 2018 http://personales.upv.es/ccarrasc/doc/2003-004/tesaurosonto/principal.html#Presentacion
Cavieres, A.; Fredes, S.; Ramírez, A. (2010). Tesauros y Web Semántica: Diseño metodológico para estructurar contenidos Web mediante SKOS-Core. Serie Bibliotecología y Gestión de Información, (57), 1-64.
Chen, Z.; Liu, S.; Wenyin, L.; Pu, G.; Ma, W. Y. (2003). Building a Web Thesaurus from Web Link Structure. Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval. ACM, 48-55. https://doi.org/10.1145/860435.860447
Codina, L.; Pedraza, R. (2011). Tesauros y ontologías en sistemas de información Documental. El Profesional de la Información, 20(5), 555-563. https://doi.org/10.3145/epi.2011.sep.10.
EAGLES (1994). "Corpus Typology: a framework for classification". Informe Interno N. 2.1. En: Sinclair, John M., EAGLES Document 080294, pp. 1-18. Corpus Linguistics Group: Universidad de Birmingham,UK.
EAGLES, (1996). Preliminary Recommendations on Corpus Typology". 26 de marzo 2018 http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html
EAGLES. (1996). Text Corpora Working Group Reading Guide". 26 de marzo 2018 http://www.ilc.cnr.it/EAGLES/corpintr/corpintr.html
Fernández, A. M. (2010). La Construcción de tesauros académicos: un modelo general y un método inductivo con aplicación al “e-learning”. [Tesis de doctorado inédita]. Madrid, España: Universidad Complutense de Madrid.
Gil, I. (2017). SISA--Automatic Indexing System for Scientific Articles: Experiments with Location Heuristics Rules versus TF-IDF Rules. Knowledge Organization. 44(3),139-163.
González, J. A.; Díaz, I.; Lloréns, J., Morato, J.; Velasco, A. (1999). 5 de diciembre de 2017. Generación automática de tesauros. Propuesta de un método lingüístico-estadístico. Revista Ciencias de la Información. http://cinfo.idict.cu/index.php/cinfo/article/download/274/273
Lamarca, M. J. (2013). Hipertexto, el nuevo concepto de documento en la cultura de la imagen. [Tesis Doctoral inédita]. Madrid, España: Universidad Complutense de Madrid.
Lanquillón, C. (2002). Enhancing Text Classification to Improve Information Filtering. Künstliche Intelligenz, (2), 37-58.
Lunh, H. (1958). The Automatic creation of Literature abstracts. Journal of Research of Development, 2(2), 159-165. https://doi.org/159-165. 10.1147/rd.22.0159
Martín, C. (2009). Temas de Biblioteconomía: Lenguajes documentales Principales tipos de clasificación Encabezamientos de materia, descriptores y tesauros. 6 de mayo 2018 http://eprints.rclis.org/14817/1/lendoc.pdf
Mcenenry, A.; Wilson, A. (1996). Corpus Linguistics. Edinburgh, Scotland: Edinburgh University Press.
Montejo, A. (2001). Proyecto de indexado automático para documentos en el campo de la Física de Altas Energías. Procesamiento del Lenguaje Natural, (27), 295-296.
Moreiro, J. A.; Díaz, I.; Lloréns, J.; Morato, J.; Velasco, M. (1999). Generación automática de tesauros. Propuesta de un método lingüístico-estadístico. Ciencia de la información, 30(4), 51-60.
Organización Internacional de Normalización, (2014). Información y documentación. Tesauros e interoperabilidad con otros vocabularios. Parte 1: Tesauros para la recuperación de la información. Madrid, España:
Asociación Española de Normalización y Certificación (AENOR).
Pastor, J. A. (1992). Diseño, desarrollo e implementación de un sistema gestor de automatización de tesauros. [Tesis de licenciatura inédita]. Murcia, España: Universidad de Murcia.
Pastor, J. A. (2009). Diseño de un sistema colaborativo para la creación y gestión de tesauros en Internet basado en SKOS. [Tesis de doctorado inédita]. Murcia, España: Universidad de Murcia.
Pastor, J. A. (2015). Los Tesauros en la Web Semántica: SKOS y la norma ISO 25964. Disponible en: https://digitum.um.es/xmlui/bitstream/10201/46824/1/norma-iso-web-semantica.pdf [Fecha de consulta 01/04/2018].
Pastor, J. A.; Martínez, F. J. (2010). Manual de SKOS (Sistema para la organización del conocimiento simple). Anales de Documentación, 13, 285-320.
Pérez, M. C. (2002). Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento. Estudios de Lingüística del Español, (18), 0-0.
Qiao, B.; Fang, K.; Chen, Y.; Zhu, X. (2017). Building thesaurus-based knowledge graph based on schema layer. Cluster Computing, 20(1), 81-91.
Ramírez, G.; Torres, A. (2017). Mejora de las búsquedas en CMS donde predomina el contenido no estructurado. [Tesis de Licenciatura inédita]. Buenos Aires, Argentina: Universidad Nacional de La Plata.
Rijsbergen, C. J. (1979). Information Retrieval. London, England: Butterworths-Heinemann.
Ruckhaus, E.; (2005). Lógicas Descriptivas y Ontologías. 10 de abril de 2018 https://ldc.usb.ve/~ruckhaus/materias/ci7453/clase51.pdf
Sahami, M.; Dumais, S.; Heckerman, D.; Hovitz, E. (1988) 5 de abril de 2018 A Bayessian approach to filtering junk a-mail. Disponible en: http://robotics.stanford.edu/users/sahami/papersdir/
Salton, G.; M. J. McGillm (1986). Introduction to modern information retrieval. Nueva York, United States: McGraw-Hill.
Stein, B. (1987). Methdologies for Documentary process. Journal of Documentation, 3(13).
Zipf, G. K. (1949). Human Behaviour and the Principle of Least Effort. Reading. Massachusetts, United States: Digital Library of India.
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.
Revista indizada en: Scopus, Web of Science (Emerging Sources Citation Index), DIALNET, EBSCO (Academic Search Complete,
Academic Search Premier, Academic Search Ultimate, Fuente Académica Plus), PROQUEST (Library and Information Science
Abstracts, Library Science), REDIB, CLASE, BIBLAT, INFOBILA, Ulrichs Web, Latindex, DOAJ, Index Copernicus, JournalsTOC,
ERIH Plus, E-LIS, MIAR, e-Libros, BASE,
Google Scholar, y otros.
Redes Sociales
Indicadores de impacto según Google Scholar:
Índice h: 8; Índice i10: 3
Revista certificada por el CITMA
Revista. Bibliotecas. Anales de investigación by Biblioteca Nacional de Cuba José Martí is licensed under aCreative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional License.
Creado a partir de la obra en anales.bnjm.cu
ISSN: 0006-176X, EISSN: 1683-8947