Propuesta de procedimiento para la construcción semiautomática de tesauros en Bibliotecas Universitarias

Andisleydis Acosta Bravo, Asleni Díaz Jiménez, Amed Abel Leiva Mederos

Resumen


Objetivo Se proponen procedimientos de índole teóricos en la indización, y a la vez introduciéndose en parcelas de las Ciencias de la Computación para resolver problemas de la Red TIC del Proyecto VLIR desde una óptica multidisciplinar, dada las características imponen el reto  de  intentar desarrollar cualquier proceso normativo en el terreno de la indización para un entorno complejo y pluridisciplinar, siendo la primera vez que se asume un trabajo en Ciencias de la Información en la Universidad Central “Marta Abreu” de Las Villas (UCLV). Diseño/Metodología/Enfoque se utilizaron las técnicas de origen matemático: la Ley de Zip, TF-IDF, N-grams y Stop World Elimination, aportando un enfoque mixto predominantemente cuantitativo. La descripción sirve de guía para la construcción de léxicos especializados, al incluir los mecanismos de construcción basados en las reglas exigidas a nivel internacional. Resultados/Discusión: Desde el  diagnóstico de los Procesos de Indización en las Bibliotecas asociadas a la Red TIC del Proyecto VLIR, se aplicaron  métodos y técnicas en la recopilación de información permitieron obtener resultados relacionados a la experiencia en los procesos de indización y construcción de tesauros en las diversas universidades del país. Conclusiones: La creación de un procedimiento que proporcione la transformación de los vocabularios controlados en un lenguaje interoperable, facilita la indización y la recuperación eficiente de la información. Originalidad/Valor: El impacto social de uso estriba en que al contener datos estandarizados en formato SKOS, las plataformas que usa y desarrolla la red podrán interpretar con otras plataformas con fines similares dando visibilidad a la ciencia de la Red TIC.


Palabras clave


lenguajes controlados; lenguaje interoperable; modelos computacionales; procedimiento para la automatización de tesauros; bibliotecas

Texto completo:

PDF

Referencias


Atkins, B. (1992). Tools for Computer-aided Corpus Lexicography: The Hector Project II. Akadémiai Kiadó, 41(1-4), 5-71.

Biber, D.; Conrad, S.; & Reppen, R. (1998). Corpus linguistics investigating language structure and use. Tesol Quaterly, 32(4), 789-790. https://doi.org/10.2307/3588017

Bowker, L.; Pearson, J. (2002). Working with specialized language. Routledge, Londres: Language & Literature.

Carras, C. (2004). Tesauros y Ontologías. 3 de abril de 2018 http://personales.upv.es/ccarrasc/doc/2003-004/tesaurosonto/principal.html#Presentacion

Cavieres, A.; Fredes, S.; Ramírez, A. (2010). Tesauros y Web Semántica: Diseño metodológico para estructurar contenidos Web mediante SKOS-Core. Serie Bibliotecología y Gestión de Información, (57), 1-64.

Chen, Z.; Liu, S.; Wenyin, L.; Pu, G.; Ma, W. Y. (2003). Building a Web Thesaurus from Web Link Structure. Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval. ACM, 48-55. https://doi.org/10.1145/860435.860447

Codina, L.; Pedraza, R. (2011). Tesauros y ontologías en sistemas de información Documental. El Profesional de la Información, 20(5), 555-563. https://doi.org/10.3145/epi.2011.sep.10.

EAGLES (1994). "Corpus Typology: a framework for classification". Informe Interno N. 2.1. En: Sinclair, John M., EAGLES Document 080294, pp. 1-18. Corpus Linguistics Group: Universidad de Birmingham,UK.

EAGLES, (1996). Preliminary Recommendations on Corpus Typology". 26 de marzo 2018 http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html

EAGLES. (1996). Text Corpora Working Group Reading Guide". 26 de marzo 2018 http://www.ilc.cnr.it/EAGLES/corpintr/corpintr.html

Fernández, A. M. (2010). La Construcción de tesauros académicos: un modelo general y un método inductivo con aplicación al “e-learning”. [Tesis de doctorado inédita]. Madrid, España: Universidad Complutense de Madrid.

Gil, I. (2017). SISA--Automatic Indexing System for Scientific Articles: Experiments with Location Heuristics Rules versus TF-IDF Rules. Knowledge Organization. 44(3),139-163.

González, J. A.; Díaz, I.; Lloréns, J., Morato, J.; Velasco, A. (1999). 5 de diciembre de 2017. Generación automática de tesauros. Propuesta de un método lingüístico-estadístico. Revista Ciencias de la Información. http://cinfo.idict.cu/index.php/cinfo/article/download/274/273

Lamarca, M. J. (2013). Hipertexto, el nuevo concepto de documento en la cultura de la imagen. [Tesis Doctoral inédita]. Madrid, España: Universidad Complutense de Madrid.

Lanquillón, C. (2002). Enhancing Text Classification to Improve Information Filtering. Künstliche Intelligenz, (2), 37-58.

Lunh, H. (1958). The Automatic creation of Literature abstracts. Journal of Research of Development, 2(2), 159-165. https://doi.org/159-165. 10.1147/rd.22.0159

Martín, C. (2009). Temas de Biblioteconomía: Lenguajes documentales Principales tipos de clasificación Encabezamientos de materia, descriptores y tesauros. 6 de mayo 2018 http://eprints.rclis.org/14817/1/lendoc.pdf

Mcenenry, A.; Wilson, A. (1996). Corpus Linguistics. Edinburgh, Scotland: Edinburgh University Press.

Montejo, A. (2001). Proyecto de indexado automático para documentos en el campo de la Física de Altas Energías. Procesamiento del Lenguaje Natural, (27), 295-296.

Moreiro, J. A.; Díaz, I.; Lloréns, J.; Morato, J.; Velasco, M. (1999). Generación automática de tesauros. Propuesta de un método lingüístico-estadístico. Ciencia de la información, 30(4), 51-60.

Organización Internacional de Normalización, (2014). Información y documentación. Tesauros e interoperabilidad con otros vocabularios. Parte 1: Tesauros para la recuperación de la información. Madrid, España:

Asociación Española de Normalización y Certificación (AENOR).

Pastor, J. A. (1992). Diseño, desarrollo e implementación de un sistema gestor de automatización de tesauros. [Tesis de licenciatura inédita]. Murcia, España: Universidad de Murcia.

Pastor, J. A. (2009). Diseño de un sistema colaborativo para la creación y gestión de tesauros en Internet basado en SKOS. [Tesis de doctorado inédita]. Murcia, España: Universidad de Murcia.

Pastor, J. A. (2015). Los Tesauros en la Web Semántica: SKOS y la norma ISO 25964. Disponible en: https://digitum.um.es/xmlui/bitstream/10201/46824/1/norma-iso-web-semantica.pdf [Fecha de consulta 01/04/2018].

Pastor, J. A.; Martínez, F. J. (2010). Manual de SKOS (Sistema para la organización del conocimiento simple). Anales de Documentación, 13, 285-320.

Pérez, M. C. (2002). Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento. Estudios de Lingüística del Español, (18), 0-0.

Qiao, B.; Fang, K.; Chen, Y.; Zhu, X. (2017). Building thesaurus-based knowledge graph based on schema layer. Cluster Computing, 20(1), 81-91.

Ramírez, G.; Torres, A. (2017). Mejora de las búsquedas en CMS donde predomina el contenido no estructurado. [Tesis de Licenciatura inédita]. Buenos Aires, Argentina: Universidad Nacional de La Plata.

Rijsbergen, C. J. (1979). Information Retrieval. London, England: Butterworths-Heinemann.

Ruckhaus, E.; (2005). Lógicas Descriptivas y Ontologías. 10 de abril de 2018 https://ldc.usb.ve/~ruckhaus/materias/ci7453/clase51.pdf

Sahami, M.; Dumais, S.; Heckerman, D.; Hovitz, E. (1988) 5 de abril de 2018 A Bayessian approach to filtering junk a-mail. Disponible en: http://robotics.stanford.edu/users/sahami/papersdir/

Salton, G.; M. J. McGillm (1986). Introduction to modern information retrieval. Nueva York, United States: McGraw-Hill.

Stein, B. (1987). Methdologies for Documentary process. Journal of Documentation, 3(13).

Zipf, G. K. (1949). Human Behaviour and the Principle of Least Effort. Reading. Massachusetts, United States: Digital Library of India.




Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.

 Revista indizada en: Scopus, Web of Science (Emerging Sources Citation Index), DIALNET, EBSCO (Academic Search Complete, 
Academic Search Premier, Academic Search Ultimate, Fuente Académica Plus), PROQUEST (Library and Information Science
Abstracts, Library Science), REDIB, CLASE, BIBLAT, INFOBILA, Ulrichs Web, Latindex, DOAJ, Index Copernicus, JournalsTOC,
ERIH Plus, E-LIS, MIAR, e-Libros, BASE,
Google Scholar, y otros.


                           Redes Sociales
 
              
  
Indicadores de impacto según Google Scholar:
Índice h: 8; Índice i10: 3
Revista certificada por el CITMA

 

           Revista. Bibliotecas. Anales de investigación by Biblioteca Nacional de Cuba José Martí is licensed under aCreative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional License.  

Creado a partir de la obra en anales.bnjm.cu

 ISSN: 0006-176X, EISSN: 1683-8947   
                               Licencia de Creative Commons