2. UNIVERSIDAD DEL QUINDÍO
Ciencias de la información CIDBA
ASIGNATURA: LENGUAJES, ANÁLISIS Y RECUPERACIÓN DE LA INFORMACIÓN
Grupo 04 del cuarto semestre, integrantes
Gloria Patricia Aguillón
Iván Darío Clavijo Ramos
Jackeline García Chaverra
Diana Milena Ramos Arévalo
4. ANÁLISIS DOCUMENTAL.
El análisis documental es una operación intelectual que da lugar a un subproducto o
documento secundario que actúa como intermediario o instrumento de búsqueda obligado
el documento original y el usuario que solicita información. El calificativo de intelectual se
a que el documentalista debe realizar un proceso de interpretación y análisis de la
de los documentos y luego sintetizarlo.
Ejemplo:
Artículo: El análisis documental: Indización y resumen en bases de datos especializadas.
Primer nivel: descripción Responsable Rubio Liniers, María Cruz
Título El análisis documental: Indización y resumen
bases de datos especializadas.
Editor CINDOC-CSIC
Fecha Febrero 25 de 2005
Extensión 13 páginas
5. Segundo nivel: indización
“Maternidad y paternidad prematura”
Tercer nivel: condensación
“La precocidad que viven muchos adolescentes en la actualidad, los cuales no están preparados
psicosocialmente para asumirla la sexualidad con madurez, da como resultado embarazos no deseados
que terminan afectando a todo el núcleo familiar e impactando la crianza de sus hijos”
LA INDIZACIÓN Y LOS LENGUAJES DOCUMENTALES
Indización: Extracción de los conceptos representativos de un documentos utilizando como medio un
lenguaje controlado.
Ejemplos:
• 1. Véase (V.) o Use
Remite de un término no aceptado a uno aceptado, por lo general un sinónimo o cuasi-sinónimo.
Locos
V. Enfermos mentales
6. • 2. Véase además (V.a.)
Remite de un término aceptado a otros términos también aceptados que tienen relación semántica con
él.
Endogamia
V.a. Etnología
Matrimonio
LENGUAJES DOCUMENTALES
El proceso se podría representar de la siguiente manera: el autor crea la obra con un código
determinado, el analista (o agentes software de información) lo traduce a su código (adaptado
para la búsqueda y recuperación de la información) y el receptor utiliza ese nuevo código
para encontrar la obra original.
Los lenguajes documentales son, pues, los que establecen la comunicación entre el documento
original y el usuario, haciendo de puente o intermediario entre las informaciones contenidas en
los documentos y las informaciones solicitadas por los usuarios.
7. TIPOS DE LENGUAJES DOCUMENTALES
Al combinar las características de control y coordinación es posible establecer cuatro grupos:
• Lenguajes libres y precoordinados: el sistema Precis.
• Lenguajes controlados y precoordinados: las clasificaciones y las listas de encabezamientos de materia.
• Lenguajes libres y postcoordinados: las listas de descriptores libres y las listas de palabras clave.
• Lenguajes controlados y postcoordinados: los tesauros.
8. Lenguajes Precoordinados:
Ejemplos:
1. Las clasificaciones
2. Los encabezamientos de materia
3. El sistema Precis
Lenguajes Postcoordinados:
Ejemplo:
1. Los tesauros.
2. Listas de descriptores libres
3. Las listas de palabras clave.
son los que coordinan los términos de un tema, Permite
realizar una clasificación utilizando una lista de
encabezamiento de materias, utilizados en bibliotecas
Es una lista de descriptores libres o lista de palabras claves,
permite gran número de vías de acceso a los documentos.
Artículo seleccionado: “Fenómenos de la digitalización multimedia y la configuración de
un nuevo perfil de comunicación”
Palabras claves:
Multimedia
Información
Comunicación masiva
Tecnología
Innovación
9. Los lenguajes controlados y la indización
Dependiendo de su estructura, los lenguajes documentales pueden ser
Lenguajes de estructura jerárquica,
Lenguajes de estructura asociativa o combinatoria
Lenguajes de estructura sintáctica
Las clasificaciones
600 Tecnología
620 Técnica
621. Física aplicada
621.3 Electrotecnia
621.38. Electrónica
621.388 Televisión
621.388 5 Sistema de comunicación
632.388 57 Televisión por cable
Clasificación de jerarquías:
Se caracterizan porque cada clase o concepto se divide sucesivamente en subclases mutuamente excluyentes.
Como resultado de esto, ocurre que entre las subdivisiones de esta clasificación existen sólo relaciones de
jerarquía y coordinación.
10. Ejemplo: Recursos Web
Usabilidad
o Bitácoras
Español
Inglés
o Portales
Español
Inglés
o Listas de Correo
Español
Inglés
Web Semántica
o Bitácoras
Español
Inglés
o Portales
Español
Inglés
o Listas de Correo
Español
11. Las clasificaciones jerárquicas son predominantemente enumerativas, se hacen al desarrollar el vocabulario,
es decir, se precoordina antes de la indización.
Ejemplo:
Tuberías
Tuberías Circulares
Tuberías De Plástico
Tuberías Metálicas
Tuberías No Circulares
Tuberías Para Agua
Tuberías Para Vapor
Se elaboran partiendo del principio que establece la subdivisión de materias, en materias más específicas,
cuanto sea necesario. Así se elabora una estructura jerárquica de tipo ramificada.
Los aspectos fundamentales de las relaciones entre las subdivisiones de la clasificación son la Jerarquía o
Subordinación y la Coordinación. La Jerarquía es la relación en que una clase es subclase de otra más amplia.
12. PRINCIPALES SISTEMAS DE CLASIFICACIÓN
Entre los principales sistemas de clasificación utilizados en el mundo, podemos destacar:
• Clasificación expansiva de Cutter (1891)
Este sistema fue formulado por Charles Ami Cutter. Dividió las materias en grandes grupos (7
que pueden ampliarse (de 8 a 27, según la necesidad de la biblioteca). Es una de las más antiguas e
influyó sobre otras posteriores, especialmente sobre la Library of Congress Classification (LCC).
La mayoría de las bibliotecas de los Estados Unidos utilizan el sistema propuesto por la Biblioteca del
Congreso de dicho país. Inicialmente fue propuesta en 1897 por Hebert Putnam y Charles Ammi Cutter
para ser usada en la Biblioteca del Congreso y reemplazar así la que había propuesto Thomas Jefferson
El sistema de clasificación es de carácter enumerativo aunque divide algunas materias en categorías
amplias. Proporciona una guía de los libros que están realmente en la biblioteca, no una clasificación
universal.
14. • Clasificación Decimal de Dewey (1873)
La Clasificación Decimal de Dewey es una clasificación bibliotecaria fundamentalmente en numerativa,
dio origen a la Clasificación Decimal Universal (CDU).
La clasificación Decimal Dewey (CDD) y/o Sistema de Clasificación Decimal de Dewey, es un
de clasificación de bibliotecas desarrollado por Melvil Dewey, bibliotecario del Amherst College en
Massachusetts, EE. UU. desde 1876 ha sido varias veces modificado y ampliado en sus 22 ediciones que
ocurrido hasta 2004. Durante este tiempo y desde 1894 también se han desarrollado 14 ediciones
abreviadas.
15. La clasificación Dewey se basa en un modelo jerárquico decimal que toma los temas más amplios y
va subdividiendo hasta los más concretos; él propone diez clases principales y divide a su vez en
Divisiones y cada una de estas en diez secciones; Así, cada nivel inferior estará subordinaciones al
superior, algo que se denomina Fuerza Jerárquica.
800 - Literatura
880 - Literatura eslava
882 - Literatura rusa
y así sucesivamente
Como puede observarse, cada nivel es una especialidad del anterior. La
notación que emplea está elaborada fundamentalmente en números arábigos,
aunque en varias partes del esquema se sugiera el uso de letras del alfabeto
para la distinción en algunas temáticas, como en el caso de la literatura.
16. Ejemplo por jerarquía:
LINGÜÍSTICA
Véase además LINGÜÍSTICA ESTRUCTURAL
LINGÜÍSTICA HISTÓRICA
NEUROLINGÜÍSTICA
PSICOLINGÜÍSTICA
La clasificación Decimal Universal o CDU propuesta por Melvil Dewey es un sistema de clasificación del
conocimiento que nace de la necesidad de ordenar y catalogar las obras en las bibliotecas. Este sistema se
basa en la ordenación del conocimiento a través de dígitos. A un grupo principal se le asigna un dígito, del 0
al 9, y a cada nivel que deba ser creado dentro del grupo se le añade un nuevo dígito.
Un ejemplo de tres niveles es el siguiente:
3 - Ciencias sociales
34 - Derecho
341 - Derecho internacional.
17. Las 10 grandes clases que lo conforman son
(basadas en la Edición 21):
000 - Obras generales.
100 - Filosofía y psicología.
200 - Religión, teología.
300 - Ciencias sociales, ciencias políticas.
400 - Lenguaje y Lingüística.
500 - Ciencias puras (Matemáticas, ciencias naturales, etc)
600 - Ciencias aplicadas: medicina, tecnología.
700 - Bellas artes, juegos, deportes.
800 - Literatura.
900 - Geografía, historia.
18. ENCABEZAMIENTOS DE MATERIA
Un encabezamiento de materia es la expresión lingüística (palabra o conjunto de palabras) que
representa el contenido temático de un documento y que se utiliza para hacer búsquedas en
catálogo, bibliografía o índice.
LISTAS ALFABÉTICAS DE MATERIA. También llamadas LEM:
Este tipo de lista presenta los encabezamientos para representar el tema(s) de un documento a partir
un lenguaje documental cuyo vocabulario principal consta de un conjunto de palabras, combinaciones
de palabras y frases organizadas en orden alfabético y designa las materias de alguna rama de la
En el contexto de los lenguajes documentales, las listas de encabezamientos de materia (LEM) son
lenguajes controlados precoordinados, formados por un conjunto de términos extraídos del lenguaje
natural.
.
19. CLASIFICACIONES FACETADAS:
Este tipo de clasificación se usa para organizar conjuntos de objetos que pueden estar en un sitio
productos, documentos, etc., que son lo suficientemente homogéneos como para ser descritos por
atributos o propiedades (facetas y categorías) y sus valores (pertenencia a categorías), en otras
por un conjunto de metadatos facetados.
Ejemplo: TUBERÍAS
Por su forma (faceta)
TUBERÍAS CIRCULARES
TUBERÍAS NO CIRCULARES
Por material (faceta)
TUBERÍAS DE PLÁSTICO
TUBERÍAS METÁLICAS
Por su aplicación (faceta)
TUBERÍAS PARA AGUA
TUBERÍAS PARA VAPOR
20. TESAURO PARA LA INDIZACIÓN DE DOCUMENTACIÓN
La explosión de la información, su diversificación y especialización, desbordaron la
capacidad de los lenguajes clasificatorios para representar y recuperar el contenido de los
documentos. La aparición del sistema Unitérmino de Taube (1951-1953), la elaboración del
KWI C de Luhn (1959) y la indización por conceptos (descriptores) de Mores (1960)
revolucionaron las técnicas de indización y pusieron las bases teóricas y metodológicas para
creación en los años 60 de los primeros tesauros.
• Por su función, se pueden definir como instrumentos de control terminológico.
el vocabulario significa identificar dentro de un campo semántico todos los conceptos que son
representados por más de un término. La identificación de términos equivalentes hace posible
minimizar la 22 pérdida de información en las búsquedas realizadas en un sistema
documental automatizado.
• Por su estructura, los tesauros permiten conocer todos los términos relacionados con un
concepto determinado, lo que ayuda a añadir más términos adecuados para enriquecer
los análisis de contenido de los documentos como las estrategias de búsqueda para recuperar
información.
21. TESAURO PARA LA INDIZACIÓN DE DOCUMENTACIÓN
SOBRE PATRIMONIO CULTURAL
Tesauro HEREIN (Documentación sobre patrimonio cultural). Multilingüe (actualmente disponible en
10 lenguas de la Unión Europea): http://www.europeanheritage.net
Ejemplo de Lenguaje Postcoordinado.
22. Los encabezamientos de materia
Ejemplos:
Una colección de historias ambientadas en Los Ángeles.
Los Ángeles (Calif.) – Novela
Una colección de obras de teatro cuyos personajes principales son
empleados domésticos.
Empleados domésticos – Teatro
Colección de poemas sobre el beisbol boricua
Béisbol – Puerto Rico - Poesía
24. RESUMEN
El resumen es la representación abreviada, precisa y objetiva del contenido de un documento original,
elaborado con una doble finalidad: representar dicho documento y permitir determinar la pertinencia
interés del mismo para el usuario. A estos dos factores se une la importancia actual de servir como
elemento de recuperación en las bases de datos documentales.
Ejemplo de Resumen
Como lo menciona su definición, es la representación abreviada del contenido de un documento sin
interpretación ni crítica.
El siguiente ejemplo es un tipo de resumen Informativo o analítico teniendo en cuenta que facilita la
máxima información posible cuantitativa o cualitativa, o ambas, contenida en un documento. Se
para describir trabajos experimentales y originales dedicados a un solo tema.
25.
26. Los objetivos del resumen son:
Informar al usuario sobre el contenido preciso de los documentos. Proporciona al usuario los
elementos decisorios sobre la conveniencia de consultar el original íntegro o de desechar su
selección por no ser de interés. Determina la pertinencia del documento.
Es utilizable para la recuperación automatizada.
Para los documentos escritos en lenguas de difícil acceso, resulta fundamental para conocer la
existencia y tema de una investigación, y decidir la conveniencia o no de su traducción.
Para las personas con un interés marginal por el tema les es suficiente con leer el resumen.
27. Listado en orden alfabético de
términos desconocidos con su
respectivo significado y ejemplo
28. Abstracción: Es una descripción de especificación que enfatiza algunos de los detalles o propiedades de
algo. La abstracción consiste en captar las características esenciales de un objeto, así como su
comportamiento. Es un método por el cual abstraemos valga la redundancia, una determinada entidad
de la realidad de sus características y funciones que desempeñan, estos son representados en clases por
medio de atributos y métodos de dicha clase.
Ej. ¿Qué podemos abstraer de las bases de datos? Artículos científicos, libros electrónicos,
artículos académicos.
Acotación: Se llaman acotaciones a una serie de anotaciones que se colocan marginalmente en los
textos. Estas anotaciones consisten en textos colocados entre signos, que pueden ser:
Paréntesis = ( )
Corchetes = [ ] y en algunos casos
Paréntesis “ ”.
El objetivo de las acotaciones es enfatizar una idea que aclarará el texto general y suelen
escribirse en negrillas o con letra cursiva, dentro de los signos de separación.
Ej. Contrato (Contrato laboral, contrato de arrendamiento, contrato de compraventa)
29. Adscripción: es un término procedente de adscriptĭo, un vocablo latino. El concepto alude al acto y el
resultado de adscribir (realizar una inscripción, sumar algo, incorporar a alguien a una entidad).
Ej: Hemos realizado una adscripción al seguro social.
Concreción: Hacer una cosa exacta y precisa. / Reducir una exposición escrita o hablada a lo esencial /
Limitarse a tratar una sola cosa, excluyendo las demás.
Ej.: Vamos a viajar solo a Cartagena
Disentir: La palabra disenso refiere el desacuerdo, la desavenencia, entre dos o más personas acerca de
una cuestión en particular. Es decir, el disenso es la falta de acuerdo sobre algo.
Ej.: Disenso contigo sobre la presentación en power point yo quiero que lo hagamos en
powtoon
Encorsetado: Someter a unas normas de conducta demasiado rígidas.
Ej.: Hay que ha
Normalización: es el proceso de elaborar, aplicar y mejorar las normas que se aplican a distintas
actividades científicas, industriales o económicas, con el fin de ordenarlas y mejorarlas.
Ej. Presentar el trabajo con las normas APA
30. Significación: del latín significatio, es la acción y efecto de significar. Este verbo refiere a manifestar
o hacer saber algo. Dicho de una palabra o expresión, está vinculado a ser el signo de un
pensamiento o de algo material mientras que, aplicado a una cosa, refiere a ser, por naturaleza o
convención, una representación de otra cosa distinta.
Síntesis: Se denomina síntesis a una exposición abreviada acerca de un tema específico. Las
síntesis se realizan generalmente con la finalidad de extraer ideas principales de una exposición
mayor, generalmente para estudio o para una exposición sucinta.
Ej.: Realizaremos una síntesis de cada lectura para presentar el trabajo
31. Tesauro: es una noción que procede del vocablo latino thesaurus, aunque su origen etimológico
más lejano se halla en el griego. El concepto refiere a un tesoro, teniendo en cuenta su acepción
como una antología, un catálogo o un índice.
35. Exhaustividad
Actas Estilo Polisemias
Ambigüedad Exhaustividad Ponencia
Análisis Documental Factores Presentación
Año Homonimias Proceso
Artículos Identificación Publicación
Autor Identificación Recuperación
Bases De Datos Identificadores Registro
Bibliotecas Indización Resumen
Calidad Indización Resumidores
Campos Información Revistas
Características Lectura Selección
Clasificaciones Legislación Servicios
Coherencia Lenguajes Singulares
Compilador Libros Sinonimias
Congreso Literatura Síntesis
Conservación Metodología Síntesis
Contenido Métodos Sistemas
Descripción Monografías Tesauros
Descriptores Necesidades Texto
Documentación Normas Título
Documentales Palabras Clave Toponimias
Documento Párrafo Unitérminos
Elaboración Periodo Usuarios
Encabezamientos Pertinencia Vocabularios
Especificidad Plurales Volumen
36. Especificidad
Análisis de contenido Clasificaciones especializadas
Análisis documental Clasificaciones universales
Análisis documental Lenguaje controlado
Análisis formal Lenguaje natural
Artículos de revistas Lenguajes documentales
Base de datos especializada Lista de autoridades
Bibliotecas generales Metodología de indización
Centros de documentación Normas de indización
38. ARBOLEDA, O. Principios de análisis de información. Bogotá: Instituto Interamericano de Ciencias Agrícolas
de la OEA, 1980. 32p.
BENITO, M. Sistemas de clasificación: manual de aprendizaje de la clasificación Decimal Universal y breve
introducción a la Clasificación Decimal Dewey. Barcelona: Taranco, 1999. 126p.
Dewey, Melvin. Sistema de clasificación decimal Dewey. Edición 21. Santafé de Bogotá. Rojas Eberhard
Editores, 2000
DIEZ, C. Técnicas y régimen de uso de la CDU: clasificación decimal Universal. 1 ed. España : Trea, 1999. 134
p.
GARCIA, F. El análisis documental: fundamentos de tratamiento y recuperación documental, 1995. 30p.
HASSAN, Y. (2003). Clasificaciones Facetadas y Metadatos (I): Conceptos Básicos. Recuperado de:
http://www.nosolousabilidad.com/articulos/clas_facetadas1.htm
39. IZQUIERDO, M. Nuevos retos en el análisis documental de contenido: la gestión de la forma
documental del contenido. En: SCIRE: Representación y Organización del Conocimiento España Vol. 10,
No. 01, Ene.- Jun. 2004. p. 31-50
MARTÍN, C. (2009). Lenguajes documentales Principales tipos de clasificación Encabezamientos de
materia, descriptores y tesauros. Recuperado de: http://eprints.rclis.org/14817/1/lendoc.pdf
MARTÍNEZ, A.; VALDEZ, J. Indización y clasificación en bibliotecas, Buenos Aires : Alfagrama Ediciones,
2008. 232 p
MOREIRO, J. El contenido de los documentos textuales: su análisis y representación mediante el
lenguaje natural. España: Trea, 2004. 291p
MORTIMER, M. Clasificación decimal Dewey. Ed. 21 / editada por Octavio Rojas L., Bogotá : Rojas
Eberhard Editores, c2002. 130 p.
SANCHEZ, M.; VEGA, J. Algunos aspectos teórico conceptuales sobre el análisis documental y el análisis
de información. En: Ciencias de la información Cuba Vol. 34, No. 02, Ago. 2003. p. 49-60
41. Abstracción (2016) En Wikilibros Libros libres para un mundo mejor. [En línea] Recuperado de:
https://es.wikibooks.org/wiki/Fundamentos_de_programaci%C3%B3n /La_
Abstracci%C3%B3n_y_el_Encapsulamiento.
Acotación (2013) Revista Ejemplode.com. [En línea] Recuperado de:
http://www.ejemplode.com/41-literatura/3083-ejemplo_de_acotaciones.html).
Adscripción (2007-2017). En Definición ABC Tu diccionario hecho fácil. [En línea]
Recuperado de: https://www.definicionabc.com
Castillo, L. (23 de agosto de 2017). Análisis Documental-Biblioteconomía . Obtenido de
Resumen: http://www.uv.es/macas/T5.pdf
Concreción (2005) En thefreedictionary [En línea] Recuperado de:
http://es.thefreedictionary.com/concret%C3%A9
Disentir (2007-2017). En Definición ABC Tu diccionario hecho fácil. [En línea] Recuperado de:
https://www.definicionabc.com
Especificidad (2017). En Wordreference Online lenguaje Dictionaries. [En línea] Recuperado de:
http://www.wordreference.com/definicion/especificidad
42. Encorsetado (2017) En Wordreference Online lenguaje Dictionaries. [En línea] Recuperado
de: http://www.wordreference.com/definicion/encorsetado
Normalización (2017). En Wikipedia La enciclopedia libre. [En línea] Recuperado de:
https://es.wikipedia.org/wiki/Normalizaci%C3%B3n
Síntesis (s/f.). Definición MX. [En línea] Recuperado de: https://definicion.mx/sintesis/
Tesauro (s/f.). Definición MX. [En línea] Recuperado de: https://definicion.mx/tesauro/