AUTORA: DIANA ISABEL LOOR MORAN
SEPTIMO SEMESTRE
INGENIERIA EN SISTEMAS
TUTOR RESPONSABLE: ING. PATRICIO QUIROZ
STO,DGO. -ECUADOR
ANÁLISIS DOCUMENTAL
Es una de las operaciones fundamentales de la cadena documental. Se trata
de una operación de tratamiento.
El análisis documental es un conjunto de operaciones encaminadas a
representar un documento y su contenido bajo una forma diferente de su forma
original, con la finalidad posibilitar su recuperación posterior e identificarlo.
El análisis documental es una operación intelectual que da lugar a un
subproducto o documento secundario que actúa como intermediario o
instrumento de búsqueda obligado entre el documento original y el usuario que
solicita información. El calificativo de intelectual se debe a que el
documentalista debe realizar un proceso de interpretación y análisis de la
información de los documentos y luego sintetizarlo.
1. ANÁLISIS FORMAL o EXTERNO
Recoge elementos objetivos del documento:
1-
tipo de documento
2- Autor
3- Título
4-Editorial
5- Número de edición
6-
Lugar, editorial y fecha edición
7-Número de páginas o volúmenes, ilustrac.
8-
Idioma original y otros elementos
1.1. ANÁLISIS DE CONTENIDO O INTERNO
- Operación intelectual del profesional que determina el contenido general del documento y se identifican los elementos que interesan al proceso de recuperación.
- Se ocupa del mensaje
1.2. ANÁLISIS DOCUMENTAL
- CLASIFICACIÓN ( CDD-CDU)
- INDIZACION
- RESUMEN
- ENCABEZAMIENTO DE MATERIA
- TESAURO
DOCUMENTOS
Un documento es un objeto que
ofrece una información
1.3. TIPOS DE DOCUMENTOS
- Textuales
- Libros
- Publicaciones seriadas
- Tablas estadísticas
- Documentos administrativos
- Textos legales
- Catálogos
- Documentos comerciales
TIPOS DE DOCUMENTOS
- NO TEXTUALES
- Iconográficos: imágenes, mapas, planos, gráficos,esquemas,fotografías, diapositivas
- Sonoros: discos, CD. Dvd
- Audiovisuales: películas
- Electrónicos: paginas Web, publicaciones periódicas digitales, libros digitales
1.4. ¿Qué son los lenguajes documentales y para
qué sirven? sirven?
Son
herramientas orientadas a la representación del contenido temático de los
documentos (colección) de una unidad de información con el objeto de facilitar
su posterior recuperación.
El uso de
estos lenguajes permite utilizar un vocabulario común y sistematizado
(normalización y control) en los procesos clave del tratamiento y difusión
documental (análisis de contenido y búsqueda y recuperación de información).
Son, en
síntesis, el instrumento a través del cual se expresa e interactúa el sistema
(biblioteca) con su comunidad usuaria desde el punto de vista del acceso
temático.
La única
razón por la cual se clasifica (analizar y representar el contenido documental)
y se utilizan lenguajes documentales es para la recuperación de información
desde el punto de vista temático, sea ésta manual o automatizada.
Todas las
acciones y decisiones que tomemos en este sentido deben tener por objetivo
facilitar y optimizar este proceso y optimizar el uso de nuestra colección.
El establecimiento previo de criterios (políticas) de acuerdo al tipo
de biblioteca en que nos situemos resulta de vital importancia. Éstos, además,
deben fundarse en la practicidad y funcionalidad, obviando la pureza técnica a
favor de los usuarios a los que está destinado el servicio.
1.5. ¿Qué tipo de lenguajes existen?
En cuanto a su contenido y alcance:
• Enciclopédicos
• Especializados
En cuanto a su nacionalización:
• Controlados
• Libres
En cuanto a su estructura:
• Jerárquicos
• Combinatorios
1.6. ¿Qué son los lenguajes controlados?
Son vocabularios que controlan las ambigüedades propias del lenguaje y
que resultan perniciosas (falta de precisión) tanto para la representación de
un tema como para la búsqueda y recuperación de información. Estas ambigüedades
están caracterizadas principalmente por la sinonimia, la polisemia y la
homonimia.
La sinonimia: genera “silencios” en la recuperación ya que un mismo
tema puede figurar de diversas formas (términos).
La polisemia: genera “ruido” en la recuperación ya que un mismo término
o frase puede tener significados distintos.
La homonimia: es un caso similar al anterior, dándose la
particularidad de términos o frases que se escriben exactamente igual pero
pueden adquirir diversos significados de acuerdo al contexto.
El análisis documental está constituido por varias operaciones fundamentales y
diferentes. Gráficamente puede expresarse del siguiente modo
En el análisis documental se produce un triple proceso:
Un proceso de comunicación, ya que posibilita y permite la recuperación
de información para transmitirla
Un proceso de transformación, en el que un documento primario
sometido a las operaciones de análisis se convierte en otro documento
secundario de más fácil acceso y difusión
Un proceso analítico-sintético, porque la información es estudiada,
interpretada y sintetizada minuciosamente para dar lugar a un nuevo
documento que lo representa de modo abreviado pero preciso
El análisis documental surge con fines de orientación científica e informativa y
sus productos, los documentos secundarios:
Representan sintéticamente a los originales
Contienen una información concentrada del documento original
Pueden ser consultados con facilidad ofreciendo las primeras noticias de
la existencia de aquellos.
La finalidad última del análisis documental es la transformación de los
documentos originales en otros secundarios, instrumentos de trabajo,
identificativos de los primeros y gracias a los cuales se hace posible tanto la
recuperación de éstos como su difusión.
Toda la información registrada, en el soporte que sea, puede ser objeto del
análisis documental: un artículo original de una revista científica, una noticia de
prensa, un reportaje de revista, una obra musical, un registro sonoro, una
imagen de vídeo, una película, una fotografía, una página web.
El análisis documental representa la información de un documento en un
registro estructurado, reduce todos los datos descriptivos físicos y de contenido
en un esquema inequívoco.
2.- La descripción física o análisis formal:
Se trata de la descripción bibliográfica del documento.
Es el proceso de descripción física o externa de un documento,
permite la identificación inequívoca del documento.
Actúa sobre el soporte e identifica los datos externos de un
documento que lo distinguen de otro, proporcionando una
identificación individual.
Permiten localizar la fuente donde está publicado el documento.
Datos a consignar: Dependerá del tipo de documento, de lo que
se considere unidad documental y del soporte.
Ejemplo para la descripción física de un artículo de revista.
- Título del artículo Autor/es Título de la publicación
- Número de la publicación
- Fecha publicación Mes ( o periodo) Año de publicación
- Página inicial
- Página final
La necesidad del control bibliográfico internacional obligó a la IFLA a redactar
unas normas específicas internacionales: las ISBD.
2.1.-Análisis de contenidos o análisis interno:
Opera sobre el contenido temático del documento y logra una
representación de la información tratada.
El análisis de contenido se divide a su vez en:
(con palabras clave
y con descriptores)
Indizar significa construir índices y significa seleccionar
expresiones o términos para representar el contenido o los temas
de que trata un documento y también las solicitudes de
información.
La indización supone caracterizar y representar el contenido de
documentos y preguntas mediante términos apropiados, con el fin
de permitir el almacenamiento (generación de índices) y posterior
recuperación de la información.
Existen dos modalidades distintas pero complementarios en la
indización: las palabras clave y los descriptores. Se consignarán
en campos diferentes.
Palabras clave: términos elegidos por el indizador para designar
los diferentes aspectos temáticos. No suele existir control estricto
del vocabulario empleado. Los sinónimos, cuasisinónimos y
variaciones ortográficas suelen ser palabras clave. Se emplea con
frecuencia, de forma incorrecta, como sinónimo de descriptor.
Las palabras clave con una frecuencia alta terminan siendo
candidatas a descriptor y finalmente pasan a ser descriptores
2.3.- Resumen o descripción sustancial
Se refiere al análisis de los contenidos de los documentos. Es la
representación abreviada del contenido de un documento sin
interpretación ni crítica. Existen distintos tipos de resúmenes. Los
más conocidos son:
Indicativo o descriptivo: Resumen que indica el tipo de
documento, los principales temas tratados y cómo se
tratan. Se utilizan para resumir estudios generales,
revisiones y monografías completas.
Informativo o analítico: Resumen que facilita la máxima
información posible cuantitativa o cualitativa, o ambas,
contenida en un documento. Se utilizan para describir
trabajos experimentales y originales dedicados a un solo
tema.
Selectivo: Resumen que refleja sólo aquellas partes del
texto que parecen esenciales para una categoría de
usuarios determinada.
Se pueden realizar también resúmenes de tipo mixto con
partes indicativas y partes informativas.
2.4.- Clasificación
Clasificar es “ordenar o disponer por clases”. Se entiende por
clasificación documental el proceso de análisis por el cual un
documento es identificado y ordenado por clases, definidas éstas
según el contenido del propio documento.
La clasificación exige un esfuerzo de síntesis, encaminado a
detectar y aislar el tema principal (el más amplio y genérico) en
que se puede encuadrar el documento y no los conceptos clave
del documento.
Su principal objetivo es permitir el agrupamiento de materias
específicas en clases mayores o más genéricas para facilitar la
organización, almacenamiento y recuperación de la información a
partir de un tema amplio.
3. Análisis documental de recursos en Internet
La recuperación rápida y pertinente de documentos web mediante un sistema
automático de búsqueda, como pueden ser los buscadores, o mediante los
directorios clasificatorios, se hace cada vez más complicada, debido al gran
número de páginas existentes y de la poca fiabilidad que están mostrando los
métodos basados en indización y recuperación automática.
Los lenguajes de marcas (HTML Hypertext Markup Language, XML eXtesible
Markup Language, que a su vez derivan del metalenguaje de marcas SGML
Standard Generalized Markup Language) sobre los que se asienta el diseño de
páginas web permiten la incorporación de etiquetas en las que el propio autor
del documento puede asignar las materias que considere más apropiadas para
representar el contenido de la página que está creando, incorporar un resumen
o una descripción del documento web y aportar otros datos informativos sobre
la página en cuestión. Se trata de los metadatos.
Se han llevado a cabo, en este sentido (metadatos), diversas iniciativas para
intentar facilitar una fiable recuperación de la información y para normalizar la
información que se puede incluir en una página web para describirla.
Destacaremos después la iniciativa que ha tenido más repercusión: El Dublín
Core Metadata.
3.1. ¿Qué son los metadatos?
Se podrían definir como el conjunto de etiquetas y datos que se incluyen dentro
del documento web para informar sobre éste. (Definición propia)
El término metadato aplicado a la información distribuída en Internet se define
como “datos acerca de datos”.
El término hace referencia a cualquier dato usado para ayudar a identificar,
describir y localizar los recursos electrónicos en un entorno de red.
Son propiedades identificativas o descriptivas que se pueden asociar a un
recurso de información electrónico. Se expresan mediante pares atributo –
valor.
Son utilizados para suministrar información sobre datos producidos. Intentan
responder a las preguntas quién, que, cuando, dónde, por qué y como, sobre
cada una de las facetas relativas a los datos que se documentan.
Tim Berners-Lee, el creador de la www, da la definición más exacta de
metadatos: “Información legible por ordenador sobre recursos web”.
Los metadatos han evolucionado desde formatos de estructura muy simple a
formatos más complejos. Y se han movido desde estándares emergentes
propietarios a estándares internacionales. Los metadatos siempre han podido
y se pueden compartir con otros.
La información que contienen los metadados es variada: información
descriptiva similar a la que realizamos en Documentación (autor, fecha de
creación, título; fecha de actualización...); información sobre los contenidos
(palabras clave, resumen...); información que ayude a la aplicación cliente a
tomar una decisión sobre el formato o sobre la localización; información o
valoración sobre los contenidos (si incluye materiales no adecuados para
menores)...
3.2. ¿Quién asigna los metadatos?
La idea que hay detrás de los estándares de metadatos es crear una estructura
simple que permita al propio creador del documento asignar sus metadatos.
Los metadatos acompañan al documento web por eso solo los puede asignar el
creador. Existen programas informáticos que ayudan a crear los metadatos.
Las diferentes comunidades de usuarios y las distintas áreas de aplicación
(bibliotecas digitales; información iconográfica; recursos geográficos o
geoespaciales; recursos electrónicos gubernamentales;...) requieren diferentes
elementos y niveles de complejidad
3.3. Dublin Core Metadata
De todos los modelos de metadatos existentes el Dublin Core Metadata es el
de más amplia aceptación, el más extendido en la actualidad. Además es un
modelo de propósito general, es decir, está destinado a la representación y
descripción de documentos electrónicos que, independientemente de su
temática o de su finalidad informativa, proporciona datos de diverso tipo sobre
los recursos.
3.3.1 Análisis documento
Parte en que se encarga de examinar documentos y extraer datos más relevantes de la información analizada.
3.3.2 Análisis de contenido El análisis de contenido de la información implica la identificación y representación del contenido de los textos mediante dos técnicas fundamentales: la indización y el resumen.
3.3.3 Indización Indizar es extraer una serie de conceptos que responden a los temas tratados en el documento, y que servirán como puntos de acceso para su recuperación.
3.3.4 Resumen El resumen es la representación abreviada, precisa y objetiva del contenido de un documento original, y elaborado con una doble finalidad: representar dicho documento y permitir determinar la pertinencia e interés del mismo para el usuario.
3.3.5 Resumen indicativo
Indica el tipo de documento, los principales temas tratados
3.3.6 Resumen informativo
Facilita la máxima información posible cuantitativa o cualitativa, o ambas, contenida en un documento.
3.3.7 Resumen selectivo
Como su palabra lo indica se encarga de tomar las partes más destacadas del contenido.
3.3.8 Resumen de conclusiones
Que tiene por finalidad completar la orientación del lector
3.3.9 Extracto
Texto constituido por frases seleccionadas de un documento.
BIBLIOGRAFIA: AENOR. Norma UNE 50-103-90 Documentación. Preparación de resúmenes.
En: Documentación. Recopilación de normas UNE. Madrid : AENOR, 1994.
Este blogg me proporciona de una manera mas detallada e informativa, el conocimiento de aquellos conceptos relevantes al análisis documental.
ResponderEliminarMuchas gracias, muy buena explicación.
ResponderEliminarAhora bien me gustaría ver diferencias entre 5 y 6 CDU
Bien sintético.
saluda
Flor Balestra