lunes, 9 de diciembre de 2013
TEMA PREPARADO PARA EL FINAL DE CLASIFICACION II. BIBLIOTECARIO DOCUMENTALISTA.
I
TEMA PARA FINAL CLASIFICACION II
LANCASTER: “EL CONTROL DEL VOCABULARIO E LA RECUPERACIÓN DE INFORMACIÓN”
CAPÍTULO I
En sistemas de recuperación de información es esencial el control del vocabulario para representar las materias. Se trata de los distintos aspectos del control del vocabulario en el contexto de la recuperación de información. Se centra en el Tesauro, que es el sistema de control más utilizado en los últimos veinte años. Sin embargo, también se consideran otros aspectos, como el funcionamiento de sistemas de recuperación de información sin control de vocabulario.
Los principales elementos de un sistema de recuperación de información son: ENTRADA (INPUT): documentos adquiridos (en su sentido más amplio, impresos o de cualquier otro tipo) por el centro de documentación que maneja el sistema. Implica la existencia de criterios y políticas de selección, que a su vez determinan un conocimiento detallado y exacto de las necesidades de información de la comunidad a la que se dirige el sistema. Una vez adquiridos los documentos, estos deben ser “organizados” y “controlados” para que puedan ser identificados y localizados en respuesta a diferentes tipos de demandas. ACTIVIDADES DE ORGANIZACIÓN Y CONTROL incluyen: clasificación, catalogación, indización y el resumen. Dos elementos importantes son la descripción física del documento (catalogación descriptiva) y la elección de los puntos de acceso (autores, títulos) para su inclusión en catálogos y bibliografías.
El proceso de indización indica dos fases intelectuales bastante diferentes; “análisis conceptual” de un documento y la “traducción” de aquel a un vocabulario determinado. Para efectuar un análisis conceptual adecuado, el indizador debe comprender la materia del documento y debe tener un buen conocimiento de las necesidades de los usuarios del sistema. La segunda fase del proceso de indización es la traducción. En la mayoría de los sistemas se cuenta con un “vocabulario controlado”, conjunto limitado de términos que deben utilizarse para representar las materias de los documentos.
Este vocabulario puede ser: -lista de encabezamiento de materias; -un esquema de clasificación; -un tesauro; -o simplemente una lista autorizada de frases o palabras clave.
Luego de la indización, los documentos son almacenados (en base de datos de los documentos) y los registros de indización se organizan en una segunda base de datos para poder ser buscados fácilmente para distintos tipos de peticiones. La base de datos de los registros de indización o “representaciones de los documentos” era un fichero o índice impreso, pero en la actualidad, es un fichero automatizado (1995) sobre cinta magnética o disco considerada como “índice” del documento almacenado. En una descripción bibliográfica de cada documento de la colección, se ven varios puntos de acceso para que la representación sea recuperable, no solo por los términos que describen las materias, sino por autor y título.
En una base de datos bibliográfica de documentos, los contenidos se indizan para hacerlos accesibles y el “almacenamiento de documentos” es sustituido por listas automatizadas de datos (ej: físicos, químicos, numéricos y estadísticos).
En un sistema, las fases de la salida (output) son muy similares a las que se dan en la entrada. Los usuarios realizan diferentes peticiones al centro de documentación y los documentalistas preparan estrategias de búsqueda para esas peticiones. También, dentro de esas estrategias de búsqueda se consideran las fases de análisis conceptual y de traducción. La primera fase es un análisis de la petición para determinar lo que realmente busca el usuario y la segunda es la traducción del análisis conceptual al vocabulario del sistema. El análisis conceptual de la petición es traducido al lenguaje del sistema como ESTRATEGIA DE BÚSQUEDA (representación de la petición), así como el registro de indización puede considerarse la representación del documento. La diferencia entre ambos es que en aquella existe “lógica” (relaciones lógicas entre los términos) y en el registro de indización, las relaciones lógicas entre los términos estarán más implícitas que explícitas.
Finalizada la estrategia de búsqueda, se “compara” con las representaciones de los documentos de la base de datos. En la fecha de esta exposición de Lancaster, esta búsqueda se realiza on-line, desde una terminal, en una biblioteca, aunque la base de datos esté a mucha distancia (actualmente se puede utilizar INTERNET). Las representaciones de los documentos que se ajustan a la estrategia de la búsqueda y satisfacen los requerimientos lógicos de la búsqueda son recuperados y ofrecidos al usuario (impresos o por pantalla). El proceso culmina cuando el usuario queda satisfecho con los resultados de la búsqueda.
El papel central del vocabulario en un sistema de recuperación de la información destaca que los indizadores tienen que utilizar los términos de este vocabulario para representar las materias de los documentos. En las estrategias de búsqueda se utilizarán los mismos términos para interrogar la base de datos. Sin control de vocabulario surgirán varios problemas: los términos pueden significar casi lo mismo, sinónimos o cuasi-sinónimos. Si estas variaciones terminológicas no se hacen equivalentes en el contexto de un campo temático determinado, se relacionarían los sinónimos escogiendo uno de ellos y remitiendo a él desde los demás, ej: LÁMINAS---PLANCHAS. Otro problema que se presenta es que algunos términos son ambiguos fuera de su contexto (ej: ARTICULACIONES---enlace entre dos piezas de una máquina o instrumento o uniones anatómicas. Se reduce tal ambigüedad con un calificador entre paréntesis.
El mayor problema es que en una lista alfabética los términos con significados cercanos aparecerán separados. Ej.: TIPOS DE UNIÓN. Útil sería para la búsqueda de información que todos los términos con significados relacionados estuvieran unidos de algún modo.
Se puede observar (según Láncaster) dos tipos de relaciones:
1.-Relación permanente (relación paradigmática o relación a priori) entre una cosa y tipos de esa cosa. (género y especies). Ej.: FRACTURA y ROTURA son tipos de AVERÍA.
2.-Relación transitoria (relación sintagmática o a posteriori). Ej.: la AVERÍA puede estar ocasionada por la CORROSIÓN, pero no siempre se debe a ella ni la CORROSIÓN conduce siempre a una AVERÍA).
Así se demuestran claramente los objetivos del control del vocabulario en un sistema de recuperación de información:
• 1.-Facilitar la representación consistente de las materias por los indizadores y usuarios que recuperan, evitando la dispersión de los elementos relacionados. Esto se consigue con el control (agrupación) de los sinónimos y cuasisinónimos y la distinción de los homógrafos.
• 2.-Facilitar la realización de una búsqueda amplia sobre una materia enlazando los términos con relaciones paradigmáticas o sintagmáticas.
La indización es más consistente cuando el vocabulario está controlado. Los indizadores estarán de acuerdo sobre los términos necesarios para representar determinada materia, si éstos son seleccionados de una lista previa, pueden utilizar cualquier término. Igual en el proceso de búsqueda, donde es más fácil identificar los términos apropiados a una necesidad de información si son seleccionados y extraídos de una lista determinada. Por lo tanto el vocabulario controlado facilita la coincidencia entre el lenguaje de los indizadores y el de los usuarios que hacen la búsqueda.
Un vocabulario controlado solo necesita un con junto de términos que puedan ser utilizados por el indizador y el usuario. Normalmente los términos están sujetos a algún tipo de estructura para que aquellos que tienen significados cercanos aparezcan juntos o relacionados de alguna forma. Ello ayuda al indizador y al usuario que hacen la búsqueda para poder seleccionar los términos adecuados para representar una determinada materia y también ayuda al usuario a identificar los términos necesarios para realizar la búsqueda amplia sobre alguna materia.
CAPÍTULO II
SISTEMAS PRECOORDINADOS Y POSTCOORDINADOS_
Clasificación, presente en todas las actividades de recuperación de información. INDIZACIÓN es proceso de clasificación. INDIZADOR, que determina, que, por ejemplo, un documento trata del efecto de la TELEVISIÓN sobre los HÁBITOS DE LECTURA DE LOS PREESCOLARES y asigna al documento los temas: PREEESCOLARES, TELEVISIÓN Y HÁBITOS DE LECTURA, asigna a tres clases representadas por esos términos, el indizador agrupa el documento junto a otros que previamente han sido incluidos en una u otra de esas clases. Los términos utilizados por el indizador para representar las materias se pueden considerar como denominaciones que identifican a varias clases: son IDENTIFICADORES DE CLASE, habitualmente TÉRMINOS DE INDIZACIÓN o DESCRIPTORES. A todo el conjunto de términos que describen las materias de una base de datos, se le puede llamar: LENGUAJE DE INDIZACIÓN. El VOCABULARIO CONTROLADO es un tipo de lenguaje de indización en el que la terminología está controlada.
La clasificación también se manifiesta en el modo en que se interroga una base de datos. La estrategia de búsqueda supone decidir qué clases representadas en una base de datos, pueden contener elementos relevantes para una determinada necesidad de información e interrogar al sistema de forma que esos elementos puedan ser recuperados. Esto es, la capacidad de combinar clases para que los únicos elementos recuperados sean aquellos que satisfagan una determinada condición lógica. Ej: si se quiere información sobre los HÁBITOS DE LECTURA de los PREESCOLARES solo deberán recuperarse los elementos que aparezcan tanto en la clase PREESCOLARES como en la clase HÁBITOS DE LECTURA.
Para una recuperación efectiva de la información es esencial que las clases puedan combinarse entre sí con total flexibilidad. Ej: un documento indizado con los términos: LAGOS, CONTAMINACIÓN DEL AGUA, COMPUESTOS DE MERCURIO y PECES.
Probablemente el documento tratará del efecto sobre los peces, de la contaminación de los lagos, causada por compuestos de mercurio. No solo se debería recuperar este documento con respecto a una búsqueda sobre ese tema concreto, representado por la interrelación de las cuatro clases, sino también en respuesta a una búsqueda con cualquier nivel de relación entre las cuatro clases: Ej: PECES Y COMPUESTOS DE MERCURIO; CONTAMINACIÓN DEL AGUA Y LAGOS ; COMPUESTOS DE MERCURIO Y CONTAMINACION DEL AGUA Y PECES. Cualquiera de estas relaciones se pueden considerar relevantes. Esta es la diferencia fundamental entre los sistemas de recuperación pre-coordinados y los post-coordinados. Especificando la distinción entre ellos: ej, un documento fue indizado con cuatro términos (asignado a cuatro clases). En un sistema post-coordinado se conserva la multidimensionalidad de la relación entre las cuatro clases: no es preciso un orden de clases ya que todos tienen el mismo peso y permite recuperar el documento independientemente de cual sea la combinación de los cuatro términos que se plantea en la búsqueda. Es así para todos los sistemas automatizados. En cambio en una entrada en la que estén presentes todos los términos de indización ordenados en una secuencia lineal, accediendo al documento a través del primer término de la cadena, ej: entrada del índice: PECES, LAGO, COMPUESTOS DE MERCURIO, CONTAMINACION DEL AGUA. Esto se reemplaza solo si el usuario busca en el índice el término peces, ya que los otros términos son subdivisiones o modificadores de él y es el tipo de índice pre-coordinado en el que las clases se combinan en una cierta secuencia durante la construcción del índice. El usuario no puede combinar libremente las clases, asi no puede recuperar documentos que no estén explícitos en el índice.
En un índice pre-coordinado pueden multiplicarse las entradas y existen procedimientos para conseguir, en forma sistemática, el nro. de entradas necesarias (o una única entrada con referencias cruzadas) con ordenador. Ej.: método con rotación sistemática. La multiplicación de entradas en un índice pre-coordinado puede proporcionar múltiples puntos de acceso, pero por razones de espacio y costo, hay un límite en el nro. de puntos de acceso posibles, lo que no ocurre en el índice post coordinado. Además, aparte del nro. de puntos de acceso, un índice pre-coordinado no le da al usuario la posibilidad que le ofrece el post-coordinado de manipular las clases libremente. Por esa razón se llama también manipulable (post-coordinado ) y no manipulable (pre-coordinado). Esto último se puede encontrar en un esquema de clasificación. El control del vocabulario es aplicable tanto a los sistemas pre-coordinados como a los post-coordinados. A continuación se estudian los sistemas post-coordinados.
CAPÍTULO III
_ESTRUCTURA Y PRESENTACIÓN DEL VOCABULARIO_
Existen dos partes complementarias del vocabulario controlado: organizaci.on sistemática de los términos y una lista alfabética de esos términos. Esas partes pueden estar separadas o completamente integradas.
_CLASIFICACIONES ABIERTAS_
Una forma de presentación sistemática del vocabulario es como “estructura arbórea”. Como si fuera un árbol genealógico familiar. Se pueden observar relaciones de género-especie. Ej.: “cámaras de filmación” es una de las cuatro especies de “cámaras”, “cámaras cinematográficas”, “sumergibles”, tiene dos genéricos: “cámaras sumergibles” y “cámaras cinematográficas”. Si un vocabulario se dispusiera así, cada árbol o página entera ocuparía una página separada. El resultado sería un Atlas con un “mapa” de terminología de una materia en cada página. El mapa se identifica con otro con referencias cruzadas que asocian los términos relacionados entre sí (Ej.: mapa de carreteras se envía de una parte a otra). Mapa “cámaras” se puede asociar a otro mapa. “fotografía”; “cámaras sumergibles” a “exploración submarina”, etc.
También es necesario el INDICE ALFABETICO. Se indica la referencia al mapa en la que está incluido un determinado término y también proporciona relaciones cruzadas a los mapas relacionados. Ej.: FOTOGRAFÍA va unido a CÁMARAS, CÁMARAS SUMERGIBLES a BUCEO, etc. Estas relaciones existen mediante la abreviatura TR: TÉRMINO RELACIONADO. También hay control de sinónimos. Ej.: CÁMARAS SLR Y CÁMARAS REFLEX DE UN OBJETIVO son considerados como sinónimos. El usuario que entre en la lista y por el primer término, será enviado (USE) al segundo. Esta relación es recíproca. Ej.: CÁMARAS REFLEX DE UN OBJETIVO se indica mediante UP (USADO POR) ya que este término se utiliza en lugar de CÁMARAS SLR. Los términos con significados poco claros van acompañados de notas de aplicación que es una definición breve de cómo es utilizado el término en el contexto del vocabulario del sistema (NA).
Los objetivos de un vocabulario controlado son: sinónimos controlados y los términos relacionados aparecen juntos para facilitar al indizador y al que recupera la selección de los términos más apropiados para representar una determinada materia y ayudar al usuario a identificar todos los términos necesarios para realizar una búsqueda sobre un tema. Cuando existe una estructura arbórea en el lenguaje de indización, se contempla la relación paradigmática y los términos relacionados establecen la relación sintagmática. Además, el vocabulario tiene disposición sistemática y disposición alfabética.
El vocabulario controlado así mostrado puede considerarse como un tipo de esquema de clasificación con un índice alfabético complementario. Es modo aceptable para el control del vocabulario pero: 1.- una excepción es que en la estructura arbórea si hay jerarquías muy extensas puede traer problemas en esa estructura, ej: “cámaras” puede ser un elemento de una jerarquía mucho mas extensa y .2- al ser extenso el vocabulario, la forma de disposición puede ser antieconómica por gran espacio ocupado. Existen otros esquemas de clasificación en donde se muestra una estructura en forma sistemática, pero es confusa y ambigua porque los términos pueden aparecer en dos lugares. Ej.: “cámaras cinematográficas sumergibles esta subordinado tanto a “cámaras cinematográficas” como a “cámaras sumergibles. Otra confusión es el sistema de numeración “notación” que aparece junto a los términos, solo sirve para mantener la secuencia de la estructura sistemática impresa y actuar como una nota para representar los términos (especialmente en los lomos de libros de estanterías). Igualmente el vocabulario satisface los requisitos de vocabulario controlado.
Una tercera forma de presentación sería reordenando los términos en orden alfabético y entremezclando con los de otras jerarquías. En este caso el género de un término aparece como “término genérico" ( TG) Y cada especie del término como (“TE)”término específico “.
Ej.: “cámaras réflex” es una especie de “cámaras fotográficas” (o sea: “cámaras fotográficas”, es su genérico, TG y “cámaras réflex” tiene dos específicos (TE). Estas relaciones son recíprocas: “cámaras” aparece como TG de “cámaras sumergibles” y “cámaras sumergibles” como TE de “cámaras”. Aunque la ordenación es alfabéticamente abierta, las relaciones TG/TE constituyen una clasificación cerrada. Para llegar a esta ordenación se desarrolló primero la jerarquía mostrada en la estructura arbórea que puede ser obtenida de la reordenación de los términos de esta estructura en orden alfabético, entremezclándolos con los de otras jerarquías y a la inversa. Además se puede informatizar para obtener la estructura TG/TE de la última estructura, a partir de la estructura arbórea y viceversa.
Se incorpora también el control de sinónimos (reenvío USE), la estructura TR y notas de aplicación y así se satisfacen los requisitos de un vocabulario controlado. La presentación es alfabética con jerarquía cerrada, marcada por estructura de referencias cruzadas y así se satisfacen los requisitos en una disposición única: se combinan las disposiciones sistemática y alfabética. Si no es con estructura arbórea, por supuesto, no puede contemplarse la jerarquía completa de un vistazo y solo se establece a partir de las relaciones TG/TE.
Un tesauro correctamente elaborado normalmente es alfabéticamente abierto y sistemáticamente cerrado.
II
_CONSTRUCCIÓN DE LOS TESAUROS_
Se recoge material (términos) y su organización para la construcción de un instrumento eficaz en la recuperación de información. Considerando si es necesario elaborar un nuevo tesauro, el centro de documentación considera la posibilidad de adoptar o adaptar algún otro tesauro a sus propias necesidades. Otra posibilidad sería elaborar un microtesauro que se ajuste a la estructura jerárquica de un tesauro más general. Seria menos costoso que elaborar un nuevo tesauro y se favorece la compatibilidad y evita la proliferación de vocabularios similares que se confunden entre sí.
CAPITULO VI
_ORGANIZACIÓN DE LOS TÉRMINOS : LA RELACIÓN JERÁRQUICA
Recogidos los términos, hay que organizarlos en una estructura lógica, por ejemplo: la terminología sobre biblioteconomía aparece dividida según una serie de aspectos o facetas. Unos conjuntos son grandes si la faceta es amplia, otros pueden ser bastante pequeños. Puede ser necesario crear un pequeño conjunto de contenido general para colocar aquellos términos que no encajen bien en ninguna de las facetas principales. Luego de identificar las facetas, hay que organizar en forma jerárquica cada una de ellas. No se puede llegar a tener una estructura de tesauro adecuada sin haber elaborado previamente un esquema de clasificación. Observando las jerarquías parciales de dos facetas de biblioteconomía, se forma una verdadera clasificación de parte de la terminología sobre biblioteconomía, la asociación de una notación con los términos no es un elemento esencial del esquema de clasificación. La estructura clasificatoria es abierta y los niveles se identifican; se estructura el tesauro ordenando los términos alfabéticamente y utilizar los reenvíos TG/TE debajo de cada término para indicar las relaciones jerárquicas establecidas. Ej.:
BIBLIOTECAS ACADÉMICAS
TG BIBLIOTECAS
CLASIFICACION CERRADA: TE BIBLIOTECAS DE COLEGIOS UNIVERSI
BIBLIOTECAS UNIVERSITARIAS
BIBLIOTECAS DE COLEGIOS UNIVERSIT
TG BIBLIOTECAS ACADÉMICAS
BIBLIOTECAS ACADÉMICAS BIBLIOTECAS DE
COLEGIOS
CLASIFICACION ABIERTA UNIVERSITARIOS
BIBLIOTECAS UNIVERSITARIAS
Una presentación que no ocupe espacio y no mezcle los niveles jerárquicos para no producir confusión, para ello se debe evitar presentación en términos específicos de forma alfabética-sistemática. Ej.:
BIBLIOTECAS
TE BIBLIOTECAS ACADÉMICAS
BIBLIOTECAS DE COLEGIOS UNIVERS
BIBLIOTECAS UNIVERSITARIAS
…y un tesauro pensado para funcionar on-line no presentaría problemas de espacio. Se estructuran todos los niveles de la jerarquía debajo de cada término, facilitando al usuario una ampliación de la consulta. La relación TG/TE siempre debe ser genero/especie. Los términos específicos deben representar un “tipo” de término genérico y la mayoría de los términos de un tesauro tendrá un solo TG, aunque habrá casos en los que un término puede aparecer en más de una jerarquía, sobre todo en tesauro multidisciplinario. Ej.: DIAMANTES TE DE INSTRUMENTOS CORTADORES y DE PIEDRAAS PRECIOSAS. Toda decisión depende del campo cubierto por el tesauro. Ej.: ORO sería TE de MATERIALES PARA EMPASTE no METALES o METALES PRECIOSOS. La relación jerárquica está bastante bien definida y se pueden formular directrices precisas para asegurar la relación TG7TE aplicado correctamente. Ej.:
JUGUETES
TE (POR MATERIALES)
JUGUETES DE GOMA
JUGUETES DE MADERA
JUGUETES DE METAL
CAPÍTULO VII
_ORGANIZACIÓN DE LOS TÉRMINOS: LA RELACIÓN ASOCIATIVA_
La relación asociativa (TR) término relacionado no es relación jerárquica y NO debe ser utilizada para relacionar términos que aparecen en la misma jerarquía. Los significados de los términos de la misma jerarquía quedan poco claros por separado. Ej.: (BURROS como TR de MULAS y viceversa. Aún así parece redundante. Esta relación es sintagmática o a posteriori. No es posible establecer normas precisas, a diferencia de la relación jerárquica. Lo que se puede precisar es que los términos cuyos significados están relacionados, pero que aparecen en diferentes jerarquías son de relación TR.
Tipos de relaciones entre términos:
• Entre una cosa y su aplicación: ADHESIVO
TR UNIONES
Y a la inversa:
UNIONES
TR AHESIVO
• Entre efecto y causa: y viceversa:
FRACTURA QUEBRADIZA
TR FRAGILIDAD POR EL HIDROGENO
• Entre cosa y propiedad íntimamente asociada a ella:
GOMA
TR ELASTICIDAD
• Entre materia prima y producto:
CAOLIN
TR PORCELANA
• Entre dos actividades complementarias:
ENSEÑANZA
TR APRENDIZAJE
• Entre ciertos opuestos:
VIDA
TR MUERTE
• Entre actividad y propiedad asociada a ella:
FLEXIÓN
TR PLASTICIDAD
• Entre actividad y producto de actividad:
CONSTRUCCIÓN
TR ESTRUCTURAS
• Entre cosa y partes que no pueden separarse:
AVIONES
TR FUSELAJE
Se pregunta si es probable que alguien que busque información indizada con el primer término (A), también esté interesado en el segundo (B). Si así es, se relacionan A y B como TR, si ambos términos no fueron ya relacionados con TG o TE.
Es relación recíproca y para buen mantenimiento del tesauro, ver si hay reenvío inexistente, en ese caso B se elimina.
Distinción entre relaciones TG/TE y TR: se considera al tesauro como instrumento superior a las listas de encabezamientos de materias, donde ambas relaciones están incluidas en la referencia: VER TAMBIÉN.
Ej.: FRACTURA
Ver también
AGRIETAMIENTO
FRACTURA QUEBRADA
FRAGILIDAD
FRAGILIDAD POR EL HIDRÓGENO
Lo habitual en los encabezamientos de materias, es que el reenvío se haga del general al específico, pero raramente en sentido inverso. Ej.:
Se encuentra el reenvío UNIONES ver también SOLDADURA, pero no: SOLDADURA ver también UNIONES. En otras palabras: no se hace explícitamente recíproca la relación. Diferente de un tesauro bien estructurado, la lista de encabezamientos de materias no es clasificación jerárquica estricta y no se establece esta clasificación a partir de una lista de encabezamiento de materia.
CAPÍTULO X
_HOMOGRAFÍA Y NOTAS DE APLICACIÓN_
Homógrafo: cadena de caracteres con más de un significado y más de una pronunciación.
Homónimo: más de un significado con una única pronunciación (ej.: “planta”)
Homófono: cadena de caracteres diferentes pero que se pronuncian igual (vaca-baca). Este no constituye problemas, pero sí los homógrafos y homónimos.
La homografía es problema en caso de términos simples. Ej.: DIAFRAGMA recupera MÚSCULO DIAFRAGMÁTICO o puede ser ANTICONCEPTIVO o DIAFRAGMA FOTOGRÁFICO. En la recuperación de información es raro que se manejen palabras aisladas. La ambigüedad se reduce cuando el tesauro trata de campo temático limitado. Ej.: no es necesario explicar el término DIAFRAGMA cuando el tesauro se refiere a la fotografía. En otro ejemplo, cuando pueda darse esa ambigüedad, se resuelve con calificador entre paréntesis.
TANQUES (CONTENEDORES)
TANQUES (VEHÍCULOS)
El calificador entre paréntesis se diferencia de la nota de aplicación porque los calificadores forman parte del descriptor y una verdadera nota de aplicación está separada de él, precedida de la abreviatura NA. Ej:
ROMANCE GÓTICO
NA: TIPO DE NOVELA, POPULAR A FINALES DE SIGLO 18 Y PRINCIPIOS DEL 19…
No todos los descriptores necesitan una nota de aplicación, sino solo aquellos cuyo alcance puede ser poco claro para el usuario. La nota de aplicación no tiene necesidad de ser una verdadera definición, sino una mera indicación de cómo debe ser usado el término. Usos diferentes:
• Limitación positiva del alcance de un término:
REEDUCACION PROFECIONAL
NA: FORMACION PARA UN CAMBIO EN LA OCUPACIÓN
• Limitación negativa:
LICENCIA
NA: EXCLUYE HABILITACIONES ESCOLARES Y CERTIFICADOS DOCENTES
• Definición verdadera:
ERROR ESPACIAL
NA: TENDENCIA A SER INFLUIDO POR LA POSICION ESPACIAL
• Combinación de definición y limitación positiva:
PLAYBACK
NA: REGISTRO SONORO O VISUAL QUE EVALÚA O REACCIONA ANTE EL RESULTADO DE SU PROPIO REGISTRO.
El contexto en el que aparece un término en un tesauro también reduce la ambigüedad y la necesidad de calificadores o notas de aplicación. Ej.:
TANQUES relacionado genérico: ARMAS (el contexto aclara su significado).
CAPITULO XI
_PRESENTACION DEL TESAURO_
Un descriptor con todos los elementos previamente identificados.
Entrada del tesauro:
INSTRUMENTOS INDICADORES DE POSICIÓN
NA Instrumentos utilizados para la localización de aviones barcos y otros objetos en relación a un punto o puntos de referencia específico.
UP Indicadores de posición
TG INSTRUMENTOS
TE INDICADOR PANORÁMICO
INDICADORES DE POSICION DEL BLANCO
INDICADORES DE POSICION TERRESTRE
TR DETECCION
RASTREO
Todas las entradas tendrán todos los elementos.
La mayoría de los términos tendrán un TG y muchos tendrán uno o más TE. La existencia de otras relaciones es menos frecuente. Los elementos aparecen en el orden recomendado por las normas dentro de cada relación (TG,TE,TR). Los términos se ordenan alfabéticamente. La presentación alfabética de los términos en un tesauro bien construido refleja correctamente la clasificación jerárquica. Pero la disposición alfabética tiene limitaciones: es difícil proporcionar un panorama completo de todos los términos en una jerarquía larga o en una categoría amplia de materias. Para mostrar un panorama completo, normalmente la presentación alfabética va acompañada de otros tipos de presentaciones (ej.: sistemática, jerárquica, etc. También lista permutada del tipo kwoc o kuic.
_PRESENTACION GRAFICA_
En el tesauro convencional la parte alfabética es la importante y las demás son complementarias de ella. Otra forma de presentación del tesauro es la gráfica. Se presenta como ejemplo un tesauro donde se encuentra en forma gráfica en lo que se llama diagrama de flechas, los términos de la jerarquía CAMARAS. De esta jerarquía, el término más general CAMARAS aparece en el centro y siguiendo las flechas se identifican los distintos niveles jerárquicos. CAMARAS con cuatro términos específicos, uno de ellos, CAMARAS FOTOGRAFICAS, tiene a su vez cuatro términos específicos; uno de ellos otros cuatro y así sucesivamente. De forma inversa, CAMARAS DE 35 MM es una subdivisión de CAMARAS MINIATURA, que es una subdivisión de CAMARAS FOTOGRAFICAS y ésta lo es de CAMARAS, que es el término superior.
Varios términos de la estructura están unidos a otras estructuras (ej.: CÁMARAS CINEMATOGRÁFICAS con CINEMATOGRAFÍA) de igual modo que un atlas donde se remite de un mapa a otro. Por ello a este tipo de estructura se le llama muchas veces: mapa terminológico.
III
_PRESENTACION GRÁFICA DE TESAUROS_
También es necesario contar con índice alfabético de los mapas que incluyan todos los elementos de un tesauro. Ej.:
BUCEO T 473
TR: CÁMARAS SUMERGIBLES E417
CÁMARAS CINEMATOGRÁFICAS
TG: CÁMARAS DE FILMACIÓN
TE: CAMARAS CINEMATOGRÁFICAS SUMERGIBLES
TR: CINEMATOGRAFIA
Se han propuesto varias formas de representaciones gráficas
Ejemplos:
• CIRCULAR THESAURUS: uno de los primeros tesauros y el primero de su tipo. Posee términos dispuestos en círculos concéntricos que representan c/u un nivel de jerarquía, con el término superior en el centro.
• EURATOM THESAURUS: incluye presentaciones gráfica y alfabética. La gráfica es un diagrama de flechas que representan las relaciones jerárquicas y asociativas dentro de cada grupo de palabras clave y sustituyen a las referencias cruzadas de un tesauro convencional. Algunas flechas envían a palabras clave relacionadas de otros gráficos. La dirección de las flechas va del nivel más genérico al más específico. Las palabras clave relacionadas pertenecientes al mismo nivel genérico, están unidas con flechas de dos direcciones. En su segunda edición, este tesauro sufrió una modificación en la disposición que determina que los términos relacionados semánticamente se agrupan en conjuntos (campos) alrededor de las palabras clave que aparecen en mayúscula.
La presentación gráfica es efectiva en cualquier forma de comunicación en un tesauro como en el esquema de clasificación por facetas, aproxima físicamente los términos relacionados y permite, al indizar o ver de forma rápida el panorama completo de esas asociaciones. La presentación alfabética no lo permite y para tener una visión general se tiene que ir atrás y adelante en función de los envíos entre los términos relacionados. Pero en jerarquías muy largas, con muchas relaciones y niveles se hace difícil presentar de forma gráfica y ocupan mucho espacio.
La presentación gráfica utiliza polígonos, subpolígonos y sub-subpolígonos para tratar de indicar claramente los distintos niveles jerárquicos. Polígonos relacionados van unidos por una “relación asociativa” (tipo de relación TR). Una página completa de esta presentación gráfica puede incluir varios polígonos interrelacionados.
EL TESAURO CON FACETAS
Las presentaciones complementarias alfabética y gráfica representan un intento de combinar las ventajas del tesauro convencional y las del esquema d e clasificación jerárquica. Otro intento en ese sentido es el tesauro con facetas que combina el tesauro alfabético con un esquema jerárquico con facetas.
En un tesauro con facetas, se complementan estas dos partes. La parte con facetas incluye la relación jerárquica (estructura TG/TR. Ej.:
L BIBLIOTECAS
La BIBLIOTECAS ACADÉMICAS
Lac BIBLIOTECAS ESCOLARES
Lkf BIBLIOTECAS URBANAS*
…y el resto de las relaciones aparecen en la otra parte. Esta última da la notación de cada término para que el usuario pueda ir a la parte con facetas y ver allí la correspondiente relación jerárquica. Ej.:
BIBLIOTECAS MUNICIPALES
USE BIBLIOTECAS
URBANAS LCD*
En la clasificación por facetas cada término aparece solamente una vez; sin embargo, si un término pertenece a mas de una jerarquía, en el tesauro aparecen las relaciones secundarias mediante TG (A) (término genérico es adicional). Ej.:
BIBLIOTECAS INDUSTRIALES
L1
TG (A) SERVICIOS DE INFORMACION DE LAS INDUSTRIAS
El tesauro con facetas presenta una ventaja ya que puede utilizarse para la ordenación de libros en las estanterías de una biblioteca especializada, además de para la indización de documentos en una base de datos.
El primer tesauro con facetas se debe a Aitchison (1969). La utilización conjunta del esquema de clasificación y del tesauro permite contemplar todas las “uniones jerárquicas múltiples” de los términos. En el Thesaurofacet, la parte del tesauro hace la función del índice alfabético de materias que normalmente tienen las clasificaciones por facetas convencionales.
Además, la clasificación por facetas reemplaza a la estructura jerárquica tradicional de un tesauro mediante los envíos TG/TE. El Thesaurofacet se beneficia de la meticulosidad del análisis por facetas, presentando de forma consistente las relaciones más importantes entre los términos y proporcionando un estricto control de los sinónimos. La estructura de facetas facilita la búsqueda genérica y la del tesauro hace posible el acceso inmediato a un término específico y proporciona relaciones entre los términos que no aparecen en la parte con facetas. Este tipo de tesauro puede ser utilizado tanto en sistema precoordinado (usando síntesis notacional) como en uno postcoordinado. El conjunto de su estructura es ingeniosa y su elaboración cuidadosa. Sin embargo se puede plantear la duda de si realmente es necesaria una estructura tan sofisticada para la mayoría de las aplicaciones en la recuperación de información.
_EVALUACIÓN DE LOS TESAUROS_
En un tesauro pueden valorarse ciertos aspectos globales, evaluándose superficialmente con un simple examen. Ej.: ¿Contiene una adecuada introducción que informe de su ámbito de aplicación y que explique sus características distintivas? ¿incluye presentaciones alternativas (secciones alfabética y jerárquica complementarias)? En un nivel superior: son correctas las relaciones TG/TE Y TR (los términos poco usuales o ambiguos son aclarados por su contexto, con calificadores, o mediante notas de aplicación? También se puede valorar que todas las relaciones tengan sus recíprocas. Se puede evaluar el tesauro, como experto, comprobando si distintas materias están representadas en él y si los términos que las representan son suficientemente específicos. Se podría hacer esta comprobación sobre una muestra aleatoria de artículos o resúmenes determinando si las palabras clave aparecen en el tesauro. Se puede comprobar si el tesauro cumple las normas internacionales sobre las convenciones singular/plural, formas de las palabras, entradas directas y otros aspectos de consistencia. También pueden considerarse aspectos estéticos de composición y tipografía.
Se realizan pruebas estadísticas para evaluación de tesauros. Se evaluaron varios vocabularios controlados mediante una razón de relación y una medida de accesibilidad: la primera es la razón entre términos con referencias cruzadas (es decir, términos unidos al menos a otro término, ej.: con TR, TE O TR y el número total de términos del vocabulario.) La medida de accesibilidad es la media de reenvíos a los descriptores del vocabulario. Ej.: una medida de accesibilidad de 2,923 indica que cada término del vocabulario tiene una medida de reenvíos de aproximadamente otros tres términos. Estas medidas indican la amplitud de las uniones (es decir, referencias cruzadas) entre los términos de un vocabulario. Altas cifras seguro que corresponderán a tesauro mas útil. Estos tipos de medidas (cuantitativas), han sido desarrolladas por Van Dijk donde la razón de relación es sustituida por la de conexión: (b-a)/b_a es el nro. de descriptores del vocabulario que aparecen aislados (no unidos a otros) y b el nro. total de descriptores del vocabulario. Más cerca de la unidad, mejor tesauro. La medida de accesibilidad se convierte en razón de enriquecimiento cuyo valor recomendado está entre 2 y 5 e indica que demasiados reenvíos por descriptor (+ de 5) serían un estorbo + que una ayuda.
Se propusieron nuevas medidas:
1. Razón de equivalencia: es la razón entre el nro. de no descriptores y descriptores, que es una medida de la riqueza del vocabulario de entrada. Se recomienda este valor más que uno (más términos de entrada que descriptores.
2. Razón de reciprocidad: grado en que las relaciones TG; TE Y TR tienen reenvíos recíprocos.
3. Definición representada por: (b-a)/b donde a es el nro. de descriptores que posiblemente sean ambiguos porque no tienen notas de aplicación, calificadores o relaciones jerárquicas que los definan y b es el nro. total de descriptores del vocabulario.
4. Flexibilidad: proporción de palabras en los descriptores compuestos, que aparecen en el vocabulario como descriptores o no descriptores. Valor recomendad es de 0,6 o mayor.
5. Nivel de precoordinacion: es el nro. medio de palabras por descriptor. Varía según los tesauros ingleses, franceses y alemanes.
6. El tamaño de los grupos de términos (los grupos que forman la estructura sistemática del tesauro). Se recomienda 30 a 40 términos por grupo.
Algunas de estas medidas son ingeniosas y otras triviales (razón de reciprocidad) e incluso arbitrarias (flexibilidad). Los valores recomendados son arbitrarios y se establecieron a partir de tesauros considerados “buenos” y a los que se le aplicaron las distintas medidas.
No se puede evaluar un tesauro si no es en condiciones de uso real. La prueba definitiva la dará la existencia de términos suficientemente específicos para representar adecuadamente la materia de los documentos y las peticiones, el grado de ambigüedad sintáctica en la base de datos y la utilidad del tesauro para encontrar todos los términos necesarios para realizar la correcta búsqueda.
RESUMEN DE TODA LA MATERIA PARA EL FINAL DE CLASIFICACION II. BIBLIOTECARIO DOCUMENTALISTA.
RESUMEN FINAL CLASIFICACIÓN II
UNIDAD I: TRATAMIENTO LÓGICO FORMAL PARA RECUPERACIÓN DE INFORMACIÓN. AUTORES DE CORRIENTE ESPAÑOLA Y TEORÍAS O POSTURAS DE REGIÓN MECOSUR.
Autores Pinto Molina, García Gutiérrez, Izquierdo Arroyo sostienen que los lenguajes documentales son puntos de acceso. Los tesauros: una interrelación semántica a restablecer (herramienta mediadora).
Dos teorías desarrolladas en la corriente española: “Análisis Documental” AD (Pinto Molina),” Lingüística Documental” LD (García Gutiérrez e Izquierdo Arroyo).
Pinto Molina: Teoría del Análisis Documental AD
Definición: Conjunto de operaciones (unas de orden intelectual y otras mecánicas y repetitivas) que afecta al contenido y a la forma de los documentos originales, reelaborándolos y transformándolos en otros de carácter instrumental o secundario que faciliten al usuario la identificación precisa, la recuperación y la difusión de aquellos. Esta transformación es el resultado de un proceso general de carácter analítico, aunque en un momento final es sintetizador o creativo que permite la conformación definitiva del documento secundario.
El respaldo científico del AD es la ciencia “madre”
DOCUMENTACIÖN
Y la ciencia “nodriza”
LINGÜÍSTICA
Establece interdisciplinariedad con Lingüística, Terminología, Tecnología.
El objeto de AD es doble:
DOCUMENTO PREGUNTA NECESARIA PARA LOCALIZAR EL
DOCUMENTO
Otra dualidad que se manifiesta: dos elementos que constituyen el concepto de documento:
CONTENIDO FORMA
DOS VÍAS DE ANÁLISIS
ANÁLISIS FORMAL ANÁLISIS DE CONTENIDO
CATALOGACIÓN - INDIZACIÓN Y RESUMEN: ambos generan docum. Secundario
Debido a la inconsistencia terminológica, la terminología es primordial en el tratamiento documental, que, según García Gutiérrez es la “operación intelectual o técnica utilizada para aplicar técnicas específicas normalizadas (análisis) a un colectivo documentario para hacerlo controlable y utilizable (recuperación).”
El AD equivale a la primera parte del tratamiento documental y los productos de AD son los documentos secundarios: instrumentos de búsqueda entre el documento original y el usuario. El AD es el núcleo central de tareas documentales. La teoría que sustenta actividades y la metodología para llevarlas a la práctica, es la dicotomía esencial del AD
DOCTRINA TÉCNICA
METODOLOGÍA (TÉCNICA) PARA LLEVAR
A LA PRÁCTICA LA DOCTRINA
García Gutiérrez: nueva disciplina
LINGÜÍSTICA DOCUMENTAL
El autor realiza importantes reflexiones sobre el tratamiento documental: concepto de análisis de contenido del documento
Definición de Lingüística Documental: disciplina ligada a los procesos informativos-documentales (científicos-informativos y profesionales) que tiene por objeto el establecimiento de un efectivo control documental mediante la utilización de mecanismos léxicos.
Según este autor existen dos elementos constitutivos del tratamiento documental
Análisis documental búsqueda y recuperación
Actividades metódicas, sistemáticas y dinámicas
La definición de análisis documental que aporta el autor consiste en que esta disciplina es una técnica documental que permite, mediante una operación intelectual objetiva, la identificación y la transformación de los documentos en productos que faciliten la consulta de los originales, en áreas de control documental y con el objeto último de servicio a la comunidad científica.
El concepto que se destaca es la normalización, mediante lenguajes controlados (ejercer control) que son tesauros que se basan en lenguajes científicos para controlar.
El control es una cuestión terminológica relacionada con mecanismos léxicos y es concepto central en la teoría: control del contenido documental mediante los lenguajes documentales. Objeto de estudio: contenido del documento
Izquierdo Arroyo: redefine el concepto de: Lingüística documental
El objeto de estudio es el contenido analítico de cualquier documento. Demarcar: semiótica (imagen es la solución). La semiótica documental se basa en gráficos y signos, genera medio de comunicación entre el contenido gráfico del documento y la recuperación. Demarcación con doble faz: demarcación externa como disciplina que la separa de otras y demarcación interna como disciplina que se divide en partes, LD: teoría, técnica y normativa.
Definición: definición pragmática de lingüística documental: es una disciplina teórico-práctica que se ocupa del problema que plantea el almacenamiento racional y ulterior recuperación del contenido analítico de cualquier documento. Su propósito es resolver dicho problema mediante agentes cualificados y especializados que sirven sistemáticamente, corporativa e institucionalmente y en régimen normalizado de unos medios semióticos llamados lenguajes documentales.
Marcos teóricos utilizados en región Mercosur
Inglesa: ligada a clasificación (no usa término indización).
Brasil: Fujita.
Corriente norteamericana Cutter, Láncaster. Clasificación e indización manual y automatizada.
Guimaraez: área de derecho con doctrina propia.
Franco-española: García Gutiérrez: análisis documental, archivología, lingüística, terminología.
Corriente nueva alemana ISKO: organización de trabajo sobre tratamiento del conocimiento. Se trabaja sobre texto, lenguaje documental.
Líneas de investigación del área técnica: a) Organización del conocimiento, recuperación de información, b) articulación entre archivología , museología, etc.
UNIDAD II: LENGUAJES DOCUMENTALES
La colección define el lenguaje controlado a utilizar. El lenguaje controlado es lenguaje jerárquico.
Tesauros: concebidos para ser automatizados, con estructura combinatoria. Post-coordinación significa que es lenguaje post-coordinado y significa la combinación que realiza el usuario a la salida del sistema en la recuperación o en el manejo de la demanda. En contraposición con CDU que posee estructura jerárquica pero Pre-coordinación que significa combinación previa que realiza el catalogador. Fue creado para trabajar en papel.
El tesauro es una herramienta terminológica formada por conjunto de términos (descriptores), para control de vocabulario. Posee recortes disciplinarios que conforman un universo cerrado (no así CDU).
El tesauro contiene descriptores
PALABRA CLAVE CONTROLADA
Existen accidentes perniciosos y sin precisión para la recuperación de información (ambigüedades)
SINONIMIA: genera silencios. POLISEMIA: genera ruidos. HOMONIMIA:
(Se recupera solo una parte. (Se recuperan más registros Genera pala-
El silencio es lo que no se re- de los que se necesitan. bras o frases
cupera). Significados distintos.) (que se escri-
ben igual pero tienen
distintos significados)
CONCEPTOS DE “LENGUAJE NATURAL” Y “LENGUAJE CONTROLADO” DESDE UN ENFOQUE DOCUMENTAL
El lenguaje natural es el lenguaje libre, cercano al usuario, que se representa rápido y no en forma lógica y sistemática como el lenguaje controlado. De fácil actualización, funcionales a Opac’s y catálogos en línea. Sus desventajas son la ambigüedad (con alto grado en las ciencias sociales), distorsión (debido a la ambigüedad), dificultad en el control (inflación terminológica), búsquedas fallidas (muchos silencios y ruidos).
El lenguaje controlado es un control lingüístico semántico en base a relaciones internas, formado por descriptores, para control del vocabulario, con una representación lógica y sistemática, que reduce la ambigüedad y aporta precisión. Sus desventajas son: el tiempo que requiere su representación, problemas para su actualización, es poco amigable para el usuario, inconvenientes en Opac’s.
El tesauro propiamente dicho es presentación alfabética: descriptores ordenados alfabéticamente, debajo de cada uno se encuentran las relaciones semánticas que ls vinculan con términos (resto de descriptores). Otra ordenación es la representación sistemática. También puede ser facetado, por puntos de vista, de función (Ranghanatan) o una combinación de ambos.
PARTES QUE CONSTITUYEN EL TESAURO Y ELEMENTOS QUE ACOMPAÑAN AL DESCRIPTOR EN EL CUERPO DEL SISTEMA.
El tesauro se divide en tres partes: INTRODUCCIÓN, CUERPO, ÍNDICES.
• INTRODUCCIÓN. En la introducción se determina su autoría, fuentes terminológicas, metodología de construcción, formas de actualización (es “herramienta viva”, según García Gutiérrez, descripción del tipo de siglas y su uso, sugerencias para el indizador.
• CUERPO. En el cuerpo los nombres de los campos semánticos NO son descriptores y NO se usan como tales. Se encuentra una presentación sistemática que tiene como objetivo estructurar la disciplina o campo semántico en facetas para ayudar al indizador, a orientarlo en la materia o disciplina a encontrar (relación de pertenencia), a qué área, dominio o faceta pertenece el descriptor (mono- pertenencia o poli-pertenencia). También se da la relación de cercanía o asociativa entre dos descriptores de distinto campo semántico (ej: pienso un concepto
aparece otro
• INDICES PERMUTADOS. Kwic: en contexto. Significa que ordena los descriptores tantas veces como palabras significativas tengan
Kwoc: fuera de contexto. Significa que saca fuera la palabra o descriptor que alfabetiza.
Los elementos que acompañan al descriptor en el cuerpo del sistema son: teniendo en cuenta que el tesauro es un control lingüístico semántico en base a relaciones internas que son relaciones semánticas entre descriptores, se puede comenzar detallando que los descriptores son palabras claves controladas y para evitar los accidentes perniciosos para la recuperación y evitar ambigüedades, estos elementos son destacados como:
RELACIONES SEMÁNTICAS DE EQUIVALENCIA: vinculan los términos desde el significado. Controlan sinonimia (accidente). USE, USADO POR
RELACIÓN SEMÁNTICA DE EQUIVALENCIA INTERLINGÜÍSTICA: en tesauros bilingües, traducción inglés-castellano
RELACIÓN SEMÁNTICA DE EQUIVALENCIA INTRALINGÜÍSTICA: dentro del idioma , controla la sinonimia.
RELACIONES JERÁRQUICAS: término genérico “TG”
Término específIico “TE”
Género-especie-----todo-parte
RELACIONES ASOCIATIVAS: término relacionado “TR”
Afinidad a un mismo nivel, se evocan
mutuamente.
RELACIÓN DE PERTENENCIA: primera relación de pertenencia entre área temática y término. La relación semántica de pertenencia depende de que el tesauro tenga presentación sistemática con un link de la presentación alfabética a la sistemática y viceversa).
NOTAS DE ALCANCE: calificador. Simple palabra o frase para especificar homógrafos. Modalidad de desambigüación. Forma de controlar polisemia.
Por lo tanto, el tesauro propiamente dicho es presentación alfabética: descriptores ordenados alfabéticamente, debajo de cada uno se encuentran las relaciones semánticas que los vinculan con términos (resto de descriptores) y otra ordenación puede ser sistemática. También puede ser facetado, o puntos de vista (autor Ranghanatan) o una combinación de ambos.
EVALUACIÓN DE TESAURO:
Analizar: autoría, fuentes terminológicas, metodología de construcción, formas de actualización, descripción de tipos de siglas (uso), sugerencias para el indizador.
TESAURO EN LÍNEA:
Analizar: interfaz, hipertexto, perfiles para usuarios
Interactúan, visualización gráfica con nodos (costosa), base de datos con interfaz de búsqueda, se analizan búsquedas de usuarios, sistema de metadatos, etiquetas o metaetiquetas, opac.
Evaluación: link que mueve de la presentación alfabética a la sistemática. Se evalúa el soft que se utiliza: +rico +descriptores
+sinónimos preocupa exhaustividad
Evaluar actualización, ver si posee monopertenencia o polipertenencia, ver nivel de coordinación, si posee link a diccionario, si incluye organizaciones e instituciones
Macrotesauro: se usa para ampliar conceptos, no para indizar.
Evaluar si autoriza sigla con nota de alcance, si está asociado con base de datos.
Si el tesauro lo indica pueden estar los descriptores auxiliares aparte.
TESAURO IMPRESO TESAURO EN LÍNEA
VENTAJAS VENTAJAS
• No depende de luz (o de tecnología)
• Trasladable
• Respaldado por instituciones • Recursos externos, hipertextuales
• Actualización rápida y económica
• Usuarios simultáneos
• Vinculación con base de datos
DESVENTAJAS DESVENTAJAS
• Costosos
• Actualización lenta
• Uso de una persona por vez • Necesita equipamiento
• Depende de tecnología
• No ofrece visión de conjunto
TESAURO, AUTOR: VAN SLYPE
Tesauro de descriptores con fuerte estructura semántica. Sus campos semánticos son un conjunto de unidades léxicas ligadas por estructura de relaciones.
ELEMENTOS DEL TESAURO:
TÍTULOS (temas o facetas) NO utilizados para indizar, agrupa descriptores.
DESCRIPTORES: palabras o expresiones del lenguaje para indizar.
NO DESCRIPTORES: equivalentes o no preferentes, sinónimos o cuasisinónimos, NO INDIZAN.
DESCRIPTORES AUXILIARES: combinados con descriptores libres para formar compuestos o términos complejos.
SUBDIVISIÓN DE GRUPO DE DESCRIPTORES: por facetas :se distribuyen en subconjuntos o por temas o disciplinas (más usado).
DEFINICIÓN DE DESCRIPTOR
Término que se toma a partir de un conjunto de sinónimos, cuasisinónimos y términos emparentados para representar un concepto que intervenga en documentos y consultas en sistemas documentales.
• MODALIDAD DE DESAMBIGÜACIÓN: SINONIMIA se elimina por relación de equivalencia.
• POLISEMIA se elimina por relaciones semánticas, pertenencia o grupo de pertenencia a semántico y relaciones jerárquicas.
MODIFICADOR ENTRE PARÉNTESIS: se considera descriptor y se encuentra a la derecha del término ambiguo.
NOTA EXPLICATIVA: precisar significación al descriptor polisémico.
NOTA DE APLICACIÓN: nota histórica, notación.
DEFINICIÓN DE NO-DESCRIPTOR: término incluido en tesauro, y términos emparentados con uno o más descriptores de ese tesauro por relación de equivalencia semántica para intervenir en los documentos o consultas, no para indizar, mejoran coherencia.
Los descriptores auxiliares deben ser usados con independencia de otros descriptores
Ej. Tipo y cálculo
Cambio Se colocan en tema o facetas específicas
Tipo de cambio
TIPOS DE RELACIONES SEMÁNTICAS:
JERARQUÍA: asimétrica, entre dos descriptores. Polijerarquía, género específico, partitivo
ASOCIACIÓN: simétrica, no jerárquica
PERTENENCIA: relación asimétrica. Enlaza mono y polipertenencia o jerarquía
EQUIVALENCIA INTERLINGÜÍSTICA: biunívoca y simétrica. Biyectividad. Correspondencia entre dos tesauros de distinta lengua. Similitud (no traducción).
EQUIVALENCIA INTRALINGÜÍSTICA: asimétrica, entre descriptor y no descriptor. Sinonimia, antonimia, monoequivalencia, pluriequivalencia.
TESAURO, AUTOR: TAMAYO
Sistema de organización del conocimiento. Descriptores e identificadores y no-descriptores. Equivalencia
Tres tipos de relaciones Jerarquía
Asociación
Sintaxis postcoordinada: se coordinan en el momento de recuperación: Fichas Uniterm (Taube), estrategias de búsqueda.
HISTORIA: 1951-57 (Dupont), Uniterm: creado por Taube ´59, compuesto por tres formas gramaticales: Frase nominal sustantiva sin artículo
Frase nominal sustantiva y dos adjetivos
Frase proposicional
Identificadores: nombres propios, calificadores, nota de alcance.
Relaciones: equivalencia (USE-UP), jerarquía (TG/TE), asociación (TR).
Descriptores ordenados secciones Alfabética Descriptor: nexo o notación
Sistemática NA
UP
Descriptores ordenados secciones Alfabética TG
Sistemática TE
TR
NO DESCRIPTOR
USE DESCRIPTOR
Otro gráfico: flechas
INDIZAR CON TESAURO TRES PASOS DE DESCRIPCIÓN DE CONTENIDO
ANÁLISIS
CONCEPTUAL TRADUCCIÓN REGISTRO EN
DE CONCEPTOS CATÁLOGO
A DESCRIPTORES BIBLIOGRÁFICO
USO DE MARC O MARC 21
TESAURO, AUTORES: ALONSO-MOREIRA GONZALEZ
Tesauro como herramienta de precisión.
Se integran en sistema de gestión de información para mejorar pertinencia de búsquedas por las relaciones asociativa y contextuales que presentan.
Tesauros conceptuales (relaciones asociadas entre descriptores y relaciones cruzadas entre descriptores y no-descriptores. Transforman en tesauros hipertextuales HTML o XML los conectan y siguen transformándolos en ontología terminológica. Red semántica neuronal es red neuronal documental, en donde despliega elementos textuales. Años ´80 en EEUU, neurordenadores en American Petroleum, Nasa, Medlar (sistema CATLIN , medicina).
Sistema de gestión de la información SGD, vocabulario controlado para especificidad
ONTOLOGÍAS, AUTORES: CODINA-PEDRAZA
Web semántica, es proyecto. Evolución del tesauro y experimentación. Se basa en términos de lenguaje libre. Inferencia del usuario y se establece ontología con algoritmo.
LANCASTER: EL CONTROL DEL VOCABULARIO EN LA RECUPERACIÓN DE INFORMACIÓN. (TESAURO)
SISTEMA + UTILIZADO
En el proceso de indización, dos fases intelectuales diferentes
ANÁLISIS
CONCEPTUAL TRADUCCIÓN
En análisis conceptual, luego de la indización documentos almacenados.
En traducción, se construye un índice, salida similar a la entrada en sus fases.
Papel central del vocabulario en un sistema de recuperación de información: sinónimos o cuasi-sinónimos. Términos ambigüos: calificador entre paréntesis
Dos tipos de relaciones PERMANENTE: género-especie=PARADIGMÁTICA O
A PRIORI
TRANSITORIA: término relacionado=SINTAGMÁTICA O
A POSTERIORI
Objetivos del control del vocabulario Control=SINÓNIMOS-CUASISINÓNIMOS-
HOMÓGRAFOS.
Búsqueda ampliada=RELACIONES
Coincidencia e indización=USUARIOS
SISTEMAS PRE-COORDINADOS O POST-COORDINADOS
Clasificación en todas las actividades de recuperación=INDIZACIÓN
El indizador agrupa, ej: pre-escolares- televisión- hábitos de lectura corresponde
a TRES CLASES
IDENTIFICADORES DE CLASE
TÉRMINOS DE INDIZACION O DESCRIPTORES
LENGUAJE DE INDIZACIÓN O VOCABULARIO CONTROLADO
TERMINOLOGÍA CONTROLADA
CLASIFICACIÓN modo de interrogar la base de datos: combinación de clases para recuperar, ej:pre-escolares-televisión, etc. FLEXIBILIDAD
Diferencia fundamental entre sistemas de recuperación post-coordinados y pre-coordinados
MULTIDIMENSIONALIDAD
SE PIERDE MANIPULABLE
IMPRESO SISTEMAS AUTOMATIZADOS
NO MANIPULABLE Ej: peces, contaminación, agua,
Ej: 1er. Término: peces lagos, compuesto mercurio.
USUARIO MANIPULA
SECUENCIA DURANE LA CONSTRUCCIÓN CLASES LIBREMENTE
DEL INDICE. PUNTOS DE ACCESO LIMITADO ORGANIZACIÓN
SISTEMATICA-ALFABÉTICA
CLASIFICACIONES ABIERTAS Y CERRADAS ESTRUCTURA Y
PRESENTACION DEL VOCABULARIO
ESTRUCTURA ARBÓREA
(contempla relación paradigmática: a priori)
TR (establece relación sintagmática, a posteriori)
ÍNDICE ALFABÉTICO
APARECE EN FORMA SISTEMÁTICA(+COMPLETA) UP NA: satisface objetivos
de vocabulario controlado
SANGRADO PARA REPRESENTAR RELACIONES JERARQUICAS
NOTACIÓN: SECUENCIA DE ESTRUCTURA SISTEMÁTICA
OTRA POSIBILIDAD:
REORDENAR LOS TÉRMINOS EN
CONTROL DE SINÓNIMOS, ej: ORDEN ALFABÉTICO Y ENTREMEZ-
Cámaras réflex de un objetivo CLARLOS CON LOS DE OTRAS
UP: CÁMARAS SLR JERARQUÍAS.
TG: CÁMARAS REFLEX CÁMARAS
TR: BUCEO GÉNERO: TG (equipo óptico)
NA: CÁMARAS PANORÁMICAS ESPECIE: TE (cámara fotogr.)
(CÁMARAS CON UN OBJETIVO ESPECIAL) RELACIÓN: TR (fotografía)
TG/TE:
CLASIFICACIÓN CERRADA
ORDENACIÓN ALFABÉTICAMENTE ABIERTA
TESAURO CORRECTAMENTE ELABORADO ALFABÉTICAMENTE ABIERTO
SISTEMÁTICAMENTE CERRADO
Es menos costoso elaborar un microtesauro ajustado a la estructura jerárquica que favorece la compatibilidad, que elaborar nuevo tesauro en un centro o adaptar otro tesauro a las necesidades.
ORGANIZACIÓN DE TÉRMINOS
RELACIÓN ASOCIATIVA RELACIÓN JERÁRQUICA
TR (no es jerárquica) NO Puede haber más de una jerarquía
Relacionar términos que Tesauro multidisciplinario
Aparecen en la misma Tesauro odontología una jerarquía
Jerarquía. Términos relacionados TG/TE(GÉNERO ESPECIE)
En diferente jerarquía. REENVÍO (ALFABÉTICA –SISTEMÁTICA)
EJ: Burros BIBLIOTECAS
TR mulas (y viceversa) TE BIBLIOTECAS ACADÉMICAS
HOMOGRAFÍAS Y
Relación SINTAGMATICA O NOTAS DE APLICACIÓN:
A POSTERIORI Homógrafo (ej: diafragma, puede ser
Músculo, fotográfico o anticonceptivo.
Es recíproca (mantenimiento del tesauro) Homónimo (ej:planta ),ambos traen
Problemas en la recuperación.
(“véase además” en CDU, no reenvía) Homófono (ej:vaca-baca, sin problemas
En la recuperación, excepto interface
Oral de Base de Datos.
Campo temático limitado en tesauro
(ambigüedad reducida).
Cuando se da la ambigüedad
Se usa una verdadera nota de aplicación separada del descriptor y predicha de NA: ej: romance gótica NA: tipo de novela. Existen varias: limitación, positiva, negativa, definición verdadera. También se usa el calificador entre paréntesis (notas de aplicación en miniatura que forman parte del descriptor).
PRESENTACIÓN DEL TESAURO:
MAS USUAL:
GRÁFICA (EUROPA) NA----
FLECHAS UP----
MAPA TERMINOLÓGICO EURATOM TG---
TE--- UNO O MAS
TR---
PRIMER
ORDEN ALFABÉTICO
CORRECTA CLASIFICACIÓN JERÁRQUICA
TESAURO CON FACETAS: combina tesauro alfabético con un esquema jerárquico (facetas).
NOTACION: para ir de una presentación a la otra
Se utiliza para ordenación de libros en estanterías indización de docum en base
AMBAS COMPATIBLES
EVALUACIÓN DEL TESAURO
INTRODUCCIÓN
TIPOS DE REPRESENTACIONES
CORRECTAS RELACIONES JERÁRQUICAS Y ASOCIATIVAS
TÉRMINOS AMBIGÜOS ACLARADOS
VER RELACIONES RECÍPROCAS (ORDENADAS Y NO DEBEN FALTAR)
PALABRAS CLAVE EVALUANDO CON COMPARACIÓN DE ARTÍCULOS Y RESÚMENES
EVALUAR SI RESPONDE A NORMAS INTERNACIONALES
ASPECTOS ESTÉTICOS DE COMPRENSIÓN Y TIPOGRAFÍA
SE EVALÚA EN CONDICIONES DE USO REAL
TÉRMINOS UTILIDAD PARA
ENCONTRAR TÉRMINOS PARA
ESPECÍFICOS PARA BÚSQUEDA CONCRETA
AMBIGÜEDAD
EN BASE DE DATOS
NRO TOTAL DE TÉRMINOS
MEDIA DE REENVIOS A DESCRIPTORES
RAZÓN DE EQUIVALENCIA (RIQUEZA)
RAZÓN DE RECIPROCIDAD
UNIDAD III: INDIZACIÓN
Es un método, cuyo sub-producto es el índice.
Proceso analítico-sintético que representa el análisis temático del documento. Sintetiza la representación del contenido.
Indización es extraer términos, descriptor, palabra clave controlada.
Analista examina documentos
Dos formas de indizar
Con la búsqueda del usuario que indiza y traduce
Las políticas de indización deben ser rigurosas para facilitar la indización
SELECTIVIDAD—EXHAUSTIVIDAD (PROFUNDIDAD)
INDIZACIÓN SOCIAL: repositorios, comités de usuarios, E Lis en bibliotecología.
DOS MODOS DE INDIZAR:
• EXTRACCIÒN: análisis explícito. Ambos en texto
• ASIGNACIÓN: análisis implícito subjetivo con palabras clave.
REGLAS BÁSICAS PARA LA INDIZACIÓN
Partiendo de que la indización es un análisis conceptual, se representa el contenido a través de los conceptos.
Con los artículos científicos nace este lenguaje combinatorio: palabras claves se transforman en descriptor (palabra clave controlada), por ello es indización coordinada.
El usuario las coloca en un índice y las poscoordina. Así, el PRODUCTO de la indización es el ÍNDICE. SELECTIVA: hasta 5 términos o palabras clave
La indización puede ser (menos nivel de profundidad)
EXHAUSTIVA: + de 5 términos, hasta 11 o 12, etc. (se
agregan otros conceptos, + nivel de secundarios, profun-
didad , según García Gutiérrez.
FRASE DOCUMENTAL
Se realiza el análisis y da como resultado la frase documental.
Parámetros o reglas de la indización: selectiva y exhaustiva, forman la política de indización, según Lancaster.
La indización exhaustiva no conviene estando solo en la biblioteca. Se piensa en lo económico para la decisión-. Los niveles de redundancia tienen que ver con el conocimiento del área que se tenga y con la práctica. Cuando hay muchos términos para poder recuperar: SE SATURA y no siempre la exhaustividad es mejor que la selectividad.
Lancaster concepto de profundidad analizar + o – profundamente un artículo especificidad.
Dos modos de indizar (se refiere al texto) EXTRACCIÓN análisis de lo
escrito
ASIGNACIÓN análisis de
lo implícito en el texto
ANALIZO-INDIZO: En la extracción, lo representativo SE VE.
PALABRAS CLAVES DEL TEXTO
En la asignación, el indizador representa lo
que él considera.
Asignar un término significa que en los textos especializados, el científico deja ver otra cosa (se aprecia más en las ciencias sociales). Por lo tanto, se lee un texto y aparecen conceptos que en la lectura pueden parecer importantes para representar (pueden influir factores emocionales, carga subjetiva por parte del indizador). También se pueden complementar: extraer y asignar. Asignación es menos representativo y como hay carga de subjetividad hay que analizar si el usuario lo puede recuperar (por eso no es recomendable)
El profesional de la información evalúa y también el usuario especializado y esto tiene que ver con los conceptos tan ambiguos como PERTINENCIA (fue pertinente la recuperación?). El indizador establece estrategias para que el sistema devuelva la mayor satisfacción al usuario:
Por lo tanto no conviene usar ASIGNACIÓN sino la EXTRACCIÓN
en modo explícito (menos riesgoso en la representación )
TIPOS DE INDIZACIÓN
HUMANA – AUTOMATIZADA, ésta última en década del `60: la computadora extrae del texto, analiza los conceptos por nosotros y no puede extraer primarios y secundarios. Luego se trabaja en forma mixta: computadora y ser humano. La computadora no distingue entre singular y plural. Reconoce palabras, espacios en blanco y logra términos representativos: se LEMATIZA un léxico. Ejemplo: MEDLINE (en medicina): indización de sistema automatizado. Estadística: parte de análisis asistido por computadora y genera gráficas.
Surge con la web aplicaciones abiertas
Varios niveles
Bases de datos
de información bibliográfica
Repositorios:
almacenamiento del mismo investigador
y de acceso libre
El usuario almacena su producción. Coloca palabras claves. El profesional evalúa y genera el listado de autoridades para recuperar IMAGEN
DIGITAL:
Se etiqueta: describe el contenido INDIZA SELECTIVAMENTE. La indización social genera comité de usuarios tradicionales. Igualmente se usan encabezamientos de materia. Actualización permanente, mejor resultado: usuario se compromete con la información que consulta. Repositorio a nivel mundial sobre bibliotecología: E-Lis: búsqueda ampliada, presentación sistemática, grandes grupos temáticos y esquema de recuperación + amplia. En general, el bibliotecario es más tradicionalista y no acepta del todo la red social.
INDIZACIÓN SELECTIVA.: se representan los conceptos principales. Se trabaja solo en título y resumen : 1er nivel TITULO: es el primer resumen del contenido. Descriptivo del contenido en el artículo científico.
2do nivel RESUMEN
INDIZACIÓN EXHAUSTIVA.: se representan los conceptos principales y secundarios. Es más profundo, ahonda en el artículo científico.
El criterio de elección entre un tipo de indización u otra en el centro de documentación depende de la cantidad de su personal.
Según Láncaster, la riqueza de la indización tiene que ver con la riqueza de contenido de lo que se indiza.
Los autores de artículo científico con habilidad para resumir, realizan el resumen al final. El documentalista lo realiza al principio, previa lectura del artículo, tiene en cuenta el resumen y palabras clave del autor. Indiza para una colección y para un usuario (metodología distinta a la del autor). Indización alimenta conceptos que forman parte de base de datos, valor que se piensa en función del catálogo que quede. Indización que represente un contenido que luego va a ser recuperado entre un cúmulo de otros.
UN EJEMPLO DE INDIZACIÓN
En la realización de la indización se vinculan conceptos. Ej.: en la demanda, se vincula MARCO CONCEPTUAL y MODELO VECTORIAL.
Ver si el artículo (o la demanda) habla sobre ello ( palabra clave ). Si solo alude, no sirve para usuario, en caso de ser significativo, son palabras con carga semántica. No se debe recuperar palabras sin significación. Se pregunta: “¿el artículo científico habla sobre esto?”, si es concepto ambiguo o vago, no sirve para indizar. No se indizan fechas porque la indización es CONCEPTUAL . El lugar no se indiza si solo se menciona o si el concepto es muy general. Nombre de instituciones (Universidad…) es importante en algunos casos. El lugar y el nombre tienen valor si forman parte de base de datos. Se debe indizar en función del catálogo que quede. Autores no son conceptos, no se indizan. Un concepto que se conoce, que es de nuestro ámbito: ej.: bibliotecología, se indiza. Se debe discriminar y agrupar con posibilidad de combinación.
INDIZACIÓN, AUTOR: VAN SLYPE.
ETAPAS: indización humana en cuatro etapas.
Revisa documentos
Selecciona conceptos
Traduce conceptos
Enlaces sintácticos entre descriptores
TRADUCE CONCEPTOS EN DESCRIPTORES
Al idioma del documentalista
Al lenguaje de indización
La exhaustividad mide calidad en elección de conceptos.
La especificidad mide calidad en elección de descriptores.
INDIZACIÓN, AUTOR: RUBIO LINIERS
CARACTERÍSTICAS Y NORMAS DE INDIZACIÓN
Especificidad – combinación de temas
Exhaustividad – muchas entradas facilitan búsqueda y recuperación, pero contradicen el documento hallado.
Pertinencia – buen descriptor, es fiel y responde
Coherencia y calidad
INDIZACIÓN, AUTOR: PINTO MOLINA
METADATO: dato sobre dato
INTERNET SGML – FORMATO MARC
NAVEGACIÓN HIPERTEXTUAL
INDIZACIÓN, AUTOR: GIL LEIVA
INDIZACIÓN Y RECUPERACIÓN: dos caras de la misma moneda.
INDEXACIÓN: informática
Consistencia, concordancia
Motor de búsqueda
INDIZACIÓN, AUTOR: GASTAMINZA
Polisemia de imagen – doble proceso de traducción: visual al escrito y hay pérdida de significado y exceso de ruidos y distorsión.
DENOTADO: objetivamente ----- CONNOTADO: sugerido, subjetivo.
LANCASTER: INDIZACIÓN
CONSTRUIR INDICES:
Representaciones de documentos publicados en una forma que se pueda incluir en base de datos, impresa, por computadora, fichas. Ver tema del documento, lengua y origen. Cobertura, costo eficacia. Términos utilizados en la indización
TESAURO LENGUAJE LIBRE
ESTRATEGIA DE BÚSQUEDA
Ítems recuperados relevantes o pertinentes si satisfacen necesidad del usuario.
PRINCIPIOS DE INDIZACIÓN
Términos asignados por el indizador. Sirven como puntos de acceso mediante los cuales el documento puede ser localizado y recuperado durante una búsqueda en un índice publicado o en una base de datos legible por computadora. La indización se complementa con redacción de resúmenes.
EXTENSIÓN DEL REGISTRO
Título Resumen breve resumen ampliado
INDIZACIÓN SELECTIVA: cinco términos, equivale casi al título. + general. Nivel de acceso limitado.
INDIZACIÓN EXHAUSTIVA: diez a veinte términos, indicación mejor del tema. + puntos de acceso.
USUARIO: búsqueda + genérica, aumenta el acierto (tasa de acierto). Todos ítems
Útiles, pero la precisión declina (tasa de precisión)
Relación entre ítems útiles y recuperados
MEJOR ACIERTO MENOS PRECISIÓN Y VICEVERSA
ACIERTO ES CAPACIDAD DE RECUPERAR ITEMS UTILES
PRECISIÓN ES CAPACIDAD DE EVITAR LOS ITEMS INUTILES
RESULTADOS DE BÚSQUEDA. DIVIDE LA BASE DE DATOS EN DOS PARTES
RECUPERADOS NO RECUPERADOS
FACTORES QUE DETERMINAN SI LA
BÚSQUEDA EN LA BASE DE DATOS
ES O NO EXITOSA:
COBERTURA DE LA BASE
POLÍTICA DE INDIZACIÓN
CALIDAD DEL VOCABULARIO UTILIZADO
CALIDAD DE ESTRATEGIA DE BÚSQUEDA
ETAPAS DE LA INDIZACIÓN DE TEMAS
DOS PRINCIPALES
1.-ANÁLISIS CONCEPTUAL 2.-TRADUCCIÓN
1.- En el análisis conceptual el indizador se pregunta de qué trata el documento (tema), porqué en la colección, interés de usuarios. La publicación varía o es diferente según el centro y los usuarios. El centro + especializado: indización + a medida.
ATINENCIA
En el análisis conceptual es reconocer el documento “estado anómalo del conocimiento”: entrada del sistema de recuperación + que a la salida. Problemas de eficiente entrada superan los de la salida.
2.- En la traducción el indizador realiza la conversión del análisis conceptual de un documento en un conjunto de términos de indización mediante
1.- EXTRACCIÓN 2.- ASIGNACIÓN
1.- En la extracción, la información realmente ocurre en el documento, es explícita tanto en título como en resumen (UNITERM: TAUBE, contenido temático del documento).
2.- En la asignación la fuente de información no es el propio documento, es implícita pero no debe “salir de la cabeza del indizador” que debe realizar el esfuerzo de representar la sustancia del análisis conceptual. Términos extraídos de alguna forma de vocabulario controlado
VOCABULARIOS CONTROLADOS:
Lista de términos autorizados solo asignar al documento términos que aparecen en la lista CONTROLAR SINÓNIMOS
ESTRUCTURA SEMÁNTICA DIFERENCIAR HOMÓGRAFOS
REUNIR Y VINCULAR TÉRMINOS (RELACIONES JERÁRQUICAS O NO JERÁRQUICAS, ASOCIATIVAS)
CDD (DEWEY) TESAURO LEM(LISTA
ALFABÉTICO ALFABÉTICO Y ENCABEZAMIENTO
SECUNDARIO MANIFIESTO DE MATERIAS).
REMITE AL ORDENAMIENTO ESTRUCTURA JERÁRQUICA ESTRUCTURA
PRINCIPAL (JERÁRQUICO) INCORPORADA CON REFERENCIAS JERÁR-
QUICA
IMPERFECTA.
NO DISTINGUE CLARA-
MENTE RELACIONES JERÁR-
QUICAS Y ASOCIATIVAS
LOS TRES REPRESENTAN LOS TÉRMINOS ALFABÉTICA Y
SISTEMÁTICAMENTE. DISTINGUEN HOMÓGRAFOS Y CONTROLAN
SINÓNIMOS.
INDIZACIÓN COMO CLASIFICACIÓN
Penetra en actividades asociadas con almacenamiento y recuperación. Distingue análisis conceptual y traducción, por ello, existe confusión terminológica en catalogación de materias, clasificación, indización.
ESPECIFICIDAD DEL VOCABULARIO
Posibilidad de combinación de términos.
PRÁCTICA DE INDIZACIÓN Indizador realiza combinación de lectura y hojeo
del texto. Se necesita atención a título,
resumen, sumario, introducción, conclusiones.
Elementos examinados: elementos usuales e importantes pueden ser pre-impresos en formularios de indización recuerdan al indizador qué términos utilizar “etiquetas” (Medline, medicina)
EXHAUSTIVIDAD DE LA INDIZACIÓN
FACTORES: política de indización. Administradores, precisión a cargo del indizador.
EXHAUSTIVIDAD: más cobertura y más completo. Ocho a quince términos. Más cara y más precisión en búsqueda. Profundidad, especificidad y combinación de términos. El PRINCIPIO DE ESPECIFICIDAD: tema indizado por el término más específico que lo abarque completamente. No indizar de modo redundante.
La INDIZACIÓN SELECTIVA: solo el contenido temático.
Muchos pedidos de búsqueda: más exhaustividad. Más selectiva, más combinación en la búsqueda.
DIRECTRICES
En indización no hay reglas rigurosas. Hay reglas fundamentales en etapa de análisis conceptual y en etapa de traducción: se deben incluir todos los temas de interés para los usuarios. La especificidad se pueden modificar.
INDIZACIÓN POST-COORDINADA
Posibilita que una búsqueda combine los términos de cualquier manera. También llamado post-combinación, manipulativo
Términos combinados de cualquier forma en el momento de la búsqueda
Se preserva la multidimensionalidad de las relaciones entre términos.
Todo término asignado a un documento tiene igual peso (ninguno es más importante que otro)
INSTRUMENTOS AUXILIARES EN LA INDIZACIÓN
Se emplean “ETIQUETAS” términos aplicables a muchos documentos en la base de datos. Obras de referencia
Procedimiento de indización en línea
Uso de casos precedentes
Ahorra tiempo al indizador
Indizador tilda
Pre-impresión eficiente y económica
UNIDAD IV: RECUPERACIÓN DE INFORMACIÓN
Se investiga en línea dura algorítmica (informática, ingeniería). La línea soft, blanda es línea cognitiva, desde usuario. Se recupera mediante opac o Internet.
TECNICA 1: EXACT MATCHING (TÉRMINO EXACTO)
Sistemas que recuperan por interfaz de búsqueda (no distingue singular ni plural). En bases de datos bibliográficas estructuradas, altamente normalizadas busca campos Título – título
Autor – autor
TECNICA 2: PARTIAL MATCHING (RECUPERACIÓN POR APROXIMACIÓN)
Semántico – recupera sinonimia, singular, plural, géneros.
EN INTERNET: LÓGICA BOOLEANA: MODELO BOOLEANO (EXACT MATCHING) O ALGEBRA BOOLEANA.
Definir primero demanda de información (“estado anómalo del conocimiento”)
Interfaz de búsqueda- estrategia.
GOOGLE: interacción usuario- sistema-dominio del área temática. En especializada el usuario verificativo temáticamente.
Técnica browsing. Búsqueda y recuperación
RECUPERACIÓN DE INFORMACIÓN: AUTOR: BAEZA-YATES
ALGEBRA BOOLE (MATEMÁTICA)
Modelo booleano, lógica binaria basada en exact matching. Operadores lógicos, postcoordinación.
• O lógico (unión o suma: or) A or B no muy utilizado. Exhaustiva.
• Y lógico (intersección o producto: and) A and B combinación + utilizado. Eficiente.
• NO no lógico (negación: not) A not B menos utilizado, aspecto geográfico, ej: Latinoamérica not Brasil.
OTROS BUSCADORES: proximidad: near, far, truncamiento, más de un operador.
TABLAS DE VERDAD ( LÓGICA ).
RECUPERACIÓN DE INFORMACIÓN: AUTORES: MOLINA-MOYA
CATÁLOGO, ACCESO EN LÍNEA- OPAC- REGISTRO MARC, CONTROLADO, PUEDE PRODUCIR SOBRECARGA DE INFORMACIÓN.
INDICES: combinar varios índices para acceso. Opacs actuales (segunda generación) usan exact matching y álgebra de boole.
Opacs actuales (tercera generación) organizan base en forma de hipertexto.
BROWSING (EXPLORACIÓN, NAVEGACIÓN PARA USAR CATÁLOGO).
El usuario se mueve desde documentos conocidos a otros con características comunes.
RECUPERACIÓN DE INFORMACIÓN: AUTORES: VARGAS – QUESADA
PROCESO INTERACTIVO – DINÁMICO. TEORÍA COGNITIVA DE LA RECUPERACIÓN DE INFORMACIÓN. GLOBALIZAR LA RECUPERACIÓN DE INFORMACIÓN.
Cinco elementos en proceso de RRI usuario, entorno, interfaz, sistema de rec.de información.
Hay factores que interactúan antes de producir consulta y satisfacción de necesidad. Modelo algorítmico tradicional convive con cognitivo.
Retroalimentación implícita la interacción.
LANCASTER: EL LENGUAJE NATURAL EN LA RECUPERACIÓN DE INFORMACIÓN
DEBATES Y CONTRIBUCIONES
Se denomina posibilidad de “búsqueda en texto completo” a almacenar un texto completo legible por computadora y buscar por combinaciones. Designar palabras en un registro bibliográfico.
EN CONTEXTO
DE RECUPERACIÓN DISCURSO
DE INFORMACIÓN OPUESTO COMÚN
AL LENGUAJE
CONTROLADO
PALABRAS QUE OCURREN EN TEXTO IMPRESO
“TEXTO LIBRE” CONSISTE EN 1.-TITULO
2.-RESUMEN
3.-EXTRACTO
4.-TEXTO COMPLETO DE PUBLICACIÓN
HISTORIA: SISTEMA UNITERM: TAUBE 1951. Contenido temático de un documento, palabras simples: unitérminos, comparación de fichas.
Surge luego el vocabulario controlado, tesauros. Las computadoras resuelven problemas mecánicos pero no intelectuales. Tesauros creados por falta de control del vocabulario en unitérminos. Las computadoras a fin año`50, principios del `60 mejoran la búsqueda.
DOS LÍNEAS DE DESARROLLO
NATIONAL LIBRARY MEDICINE DERECHO, LEYES
DTO. DE DEFENSA AERONAUTICS BÚSQUEDAS POR PALABRA
TÉRMINO EXTRAIDOS VOCABULARIO O COMBINACIÓN DE PALABR.
CONTROLADO Y ASIGNADO A DOCU- EN ESTOS TEXTOS
MENTOS POR INDIZACIÓN HUMANOS
PITSBURG. BÚSQUEDA
POR COMPUTADORA:
TEXTOS JURÍDICOS
BÚSQUEDAS EN TEXTO Y VOCABULARIO CONTROLADO CONVIVEN UN TIEMPO. BÚSQUEDAS DE TEXTO DE DOS MODOS
1 MÉTODO 2 MÉTODOB
ARCHIVOS INVERTIDOS BÚSQUEDA SECUENCIAL
FORMAN INDICE EN TEXTO, SIN INDICE, PALABRA
POR PALABRA
Se confeccionan perfiles de interés de los usuarios, se comparan con actualizaciones periódicas de la base.
BÚSQUEDAS EN LENGUAJE NATURAL: SOBRE FRAGMENTOS DE PALABRAS
LLAMADO TRUNCAMIENTO, EJ: PALABRAS INICIADAS CON “CONDENS”.
TESAURO CONVENCIONAL: VOCABULARIO PRE-CONTROLADO
FRAGMENTOS DE PALABRAS EN ESTRATEGIA DE BÚSQUEDA: PROCESO DE POS-CONTROL.
LENGUAJE NATURAL VERSUS VOCABULARIO CONTROLADO
El factor importante es el nro. De puntos de acceso, el resumen expandido posee + puntos de acceso que el resumen breve y este a su vez + que el título. Los resúmenes + puntos de acceso que un conjunto de descriptores asignados por indizador. Especificidad favorece precisión. +puntos de acceso, +acierto.-precisión, +puntos de acceso. Relaciones espurias: fallas asociativas, relaciones incorrectas.
INDIZACIÓN EXHAUSTIVA, PUNTOS DE ACCESO CASI TRES VECES MAYOR QUE LA SELECTIVA.
COSTO-EFICACIA, NEGOCIACIÓN ENTRE ENTRADA Y SALIDA.
martes, 24 de septiembre de 2013
INFOTECARIOS
23 sep 2013
Home » Bibliotecas • Diseño web • Fuentes de información • Profesionales de la información y usuarios • Social Media • Sociedad de la información • Tecnologías de la información » Bibliotecas en Youtube: marketing, alfabetización informacional y más
Bibliotecas en Youtube: marketing, alfabetización informacional y másPosted in Bibliotecas, Diseño web, Fuentes de información, Profesionales de la información y usuarios, Social Media, Sociedad de la información, Tecnologías de la información By Jacqueline Medina Suárez On septiembre 23, 2013Bibliotecas y youtube
Bibliotecas y Youtube
Hoy en día la presencia de las bibliotecas en las redes sociales es cada día mayor, principalmente, en Facebook y Twitter. Sin embargo, en esta oportunidad proponemos dar una revisión de algunos canales de Youtube creados con distintos propósitos por las bibliotecas.
Youtube es una plataforma para subir y compartir videos. Su popularidad radica en la posibilidad de alojar vídeos personales de manera sencilla y fácil. El uso del portal Youtube por las bibliotecas es variado y diverso.
En este sentido, la gran mayoría emplean este medio para elaborar productos audiovisuales como videos, tutoriales, guías y manuales de uso de recursos de información, visitas virtuales y otros que promuevan el marketing y la difusión de los servicios que ofrecen a su comunidad de usuarios. Sin embargo, otras bibliotecas han privilegiado las labores de alfabetización informacional.
En Perú, son muy pocas instituciones que han emprendido su incursión en este portal. Este medio es un gran potencial que podría ser aprovechado por las bibliotecas universitarias y escolares para apoyar la formación de sus usuarios y como parte de una estrategia para desarrollar las competencias y habilidades de búsqueda, uso y evaluación de información en sus usuarios.
[youtube http://www.youtube.com/watch?v=Y3XnWuH2vE8]
El uso de esta red social facilita las labores de promoción teniendo en cuenta que los medios audiovisuales captan rápidamente y atraen mejor la atención del cliente. Por ello, algunas bibliotecas como es el caso de la Biblioteca de la Pontificia Universidad Católica (PUCP) han creado canales exclusivos para la difusión del material audiovisual de sus colecciones.
[youtube http://www.youtube.com/watch?v=HSHZE1p9ZQA]
Además, es necesario tener en cuenta una vez que hayamos decidido usar este medio en nuestra biblioteca como punto inicial se deben establecer los objetivos que queremos alcanzar y como esta red social sería la herramienta adecuada para lo que deseamos alcanzar.
Una vez que se ha definido este punto se requiere mantener una identidad digital a través de la alineación con el perfil de la institución en redes sociales. Además, se requiere una actualización constante con información novedosa y versátil que logre captar la atención de nuestros visitantes.
Finalmente, es preciso tener en cuenta la evaluación del uso e impacto de las redes sociales, para ello, debemos identificar herramientas que nos permitan monitorear, analizar y medir nuestra presencia en este medio a través del flujo de las visitas, teniendo en cuenta el número de videos, número de suscripciones al canal, cantidad de comentarios, entre otros.
Suscribirse a:
Entradas (Atom)