Control de Autoridades vs Gestión de Identidades

arrestoSí, confieso. Voy a hablar de un tema de esos para bibliotecarios, aburrido para los ajenos, con la típica jerga profesional que espanta a los no iniciados. Intentaré hacerlo de la forma más clara posible. ¿Amena? Quizás sea demasiado pedir. Pero si continúan leyendo, no digan que no les advertí.

¿Control de autoridades?

¿Control de autoridades? se preguntarán. Nada que ver el tema con la fotografía.

Los bibliotecarios que nos dedicamos a describir los recursos de nuestras instituciones (libros, mapas, revistas, fotografías, películas, partituras y un larguísimo etcétera) para que nuestros usuarios puedan encontrar aquello que buscan en nuestros catálogos, nos encontramos habitualmente con el problema de identificar de forma correcta tanto a sus autores como las materias o conceptos sobre los que tratan, las imágenes que representan, la fecha en la que fueron creados o la institución responsable de su publicación. La dificultad estriba en que demasiadas “cosas” se denominan de la misma manera y resulta difícil diferenciarlas y saber en cada momento de quién o de qué estamos hablando.

Tenemos nuestros trucos, no se crean. Por ejemplo, jugamos con fechas de nacimiento (y muerte, en su caso), o con la profesión, para diferenciar unos autores de otros que tienen el mismo nombre, o definimos entre paréntesis el ámbito de aplicación de un concepto. A todo este trabajo lo denominamos en nuestro argot, “control de autoridades” y, a su resultado, “catálogo de autoridades”. Aquí, por ejemplo, les dejo el enlace al nuestro, el de la Biblioteca Nacional de España por si les pica la curiosidad y quieren echarle un vistazo: http://catalogo.bne.es/uhtbin/authoritybrowse.cgi.

Rosas y espinas

Les puedo asegurar que realizar este trabajo no es un camino de rosas. Hay ocasiones en que algún autor se nos queja, con razón, de que nos hemos equivocado y de que aunque se llama “Fulanito Pérez” no es el mismo “Fulanito Pérez” que escribe novelas de misterio, ya que él se dedica a la física nuclear y, sin embargo, hemos atribuido al novelista una de sus obras. Si, además, nuestro “Fulanito Pérez” científico depende de que en nuestros catálogos bibliotecarios aparezcan correctamente asignadas sus obras a su nombre para que le evalúen como profesional de la ciencia, imagínense el lío. Si encima como resultado de nuestra participación en proyectos internacionales como VIAF ese error acaba extendiéndose a otros catálogos de bibliotecas internacionales, el embrollo crece.

En nuestro descargo, he de decir, en primer lugar, que se trata siempre de errores involuntarios – errar es de humanos y nosotros, pobres bibliotecarios, lo somos – y, en segundo lugar, que hacemos todo lo que está en nuestra mano cuando se produce una situación como ésta para corregir el error en nuestro catálogo y en todos aquellos en los que descubramos que se haya replicado.

Redundancias

Como imaginarán, en las bibliotecas siempre hemos estado liados y hemos lidiado con la identidad de las personas, las entidades, los conceptos, las fechas, los lugares y muchas ‘cosas’ más. Y no solo en bibliotecas, sino en otras instituciones como archivos y museos. No hay nada más que echar un vistazo, por ejemplo, a la norma EAC-CPF, utilizada en los archivos para describir personas, instituciones y familias, para comprobar como un concepto básico en ella es el de “identidades” (individuales, múltiples, alternativas, colaborativas).El problema es que repetimos el mismo proceso una y otra vez en cada institución, lo que no parece muy eficaz, aunque solo sea desde una perspectiva económica y de gestión de recursos. Además, que, por ejemplo, en la BNE prefiramos denominar “Don Quijote de la Mancha” a la obra cervantina más universal y no “Don Quixote”, como la conocen en el ámbito anglosajón, no debería ser un obstáculo para que pudiéramos realizar este trabajo de una forma más colaborativa. En este sentido, el proyecto internacional VIAF (Fichero de Autoridades Virtual Internacional) ha demostrado que la colaboración es posible, reduce costes y multiplica el impacto del trabajo de cada una de las bibliotecas nacionales que participan en él.

¡Bendita tecnología!Y si esto es posible es gracias a la tecnología que nos permite enlazar los datos que almacenamos en nuestros catálogos con otros conjuntos de datos que los enriquecen con su información (una versión avanzada de los “cerebros electrónicos” de la imagen, claro). Este método de publicación de datos conocido como “datos enlazados” es una de las bases de la Web semántica que pretende que no solo los humanos seamos capaces de “leer” estos datos e interpretarlos, sino que también lo puedan hacer las máquinas. Y si Deep Blue pudo ganar allá por el año 1996 al campeón del mundo de ajedrez Gary Kaspárov, imagínense de lo que podrían ser capaces ahora si las dejamos.

Hasta ahora, además, los bibliotecarios hemos vivido muy ensimismados en alimentar nuestros propios catálogos, sin pensar demasiado quizás en que debemos salir al espacio exterior, la web, para exponer nuestros datos allí donde nuestros conciudadanos buscan información, sean o no usuarios de bibliotecas. A medida que nos movemos hacia ese entorno de datos enlazados, y en la BNE estamos experimentando en este sentido con datos.bne.es, las tareas relacionadas con el control tradicional de autoridades se demuestran como más importantes, aunque probablemente hayan de volverse mucho más sofisticadas. Ya no va a ser suficiente con desambiguar homonimias sino que resultará imprescindible identificar unívocamente autores, obras, entidades, lugares, acontecimientos, etc., movernos desde el tradicional control de autoridades a la gestión de identidades.

Identificadores para la Gestión de Identidades

Gestión de identidades es el concepto que más se repite últimamente en foros profesionales internacionales en relación a estos temas y consiste en la utilización de identificadores unívocos para todas estas “cosas” de las que venimos hablando desde el inicio del post: autores literarios, académicos, entidades, conceptos, lugares, hechos históricos, familias, etc. Hasta ahora contábamos con identificadores tradicionales para determinados tipos de recursos como el ISBN, número de identificación para las ediciones de libros que tan útil ha resultado fundamentalmente para el mercado del libro, el ISSN para las revistas o el ISAN para recursos audiovisuales. Estos identificadores son numéricos. El avance respecto a ellos en relación a la web semántica es la necesidad de que los identificadores adopten la forma de URIs (Uniform Resource Identifiers).

Además de aquellos que identificaban tipos de recursos, en los últimos años han aparecido diferentes iniciativas para la definición de identificadores que establezcan de forma unívoca dicha identidad en el caso de autores, creadores o investigadores, como ORCID o ISNI, que se vienen a sumar a los tradicionales ficheros de autoridades mantenidos por las bibliotecas como el propio de la Library of Congress o VIAF, el Fichero de Autoridades Virtual Internacional.

La ventaja de los URIs es que permiten un nivel de precisión imposible de reproducir utilizando cadenas de caracteres. Y cuentan con la ventaja adicional de que pueden ser interpretados por las máquinas, con todo lo que ello implica para la generación de nuevo conocimiento y para el descubrimiento de recursos de forma automatizada.

Problemas y Desafíos

Pasar de teclear los nombres de las “cosas” – utilizar cadenas de caracteres como elemento de identificación en nuestra jerga bibliotecaria – a identificar esas ‘cosas’ mediante URIs, nos traslada a un escenario de trabajo completamente diferente al que estábamos acostumbrados hasta ahora. Tal y como se vislumbra ahora el panorama, parece que utilizaremos estos identificadores que o bien nosotros u otras instituciones desarrollen y que permitirán a nivel global que nadie confunda a nuestro “Fulanito Pérez” científico con cualesquiera otros “Fulanitos Pérez” que puedan existir, se dediquen a la novela de misterio, a la lingüística comparada o al cabaret. Es más, podremos cruzar nuestros propios datos con otros que los enriquezcan y nos lleven a descubrir otros recursos con los que no cuenta nuestra institución.

Claro que, en seguida, surgen las dudas. ¿Quién se va a encargar de llevar a cabo esta labor de creación, gestión y mantenimiento de “identidades” mediante URIs unívocas? ¿Son de confianza? ¿Podemos fiarnos de que su trabajo se mantendrá en el tiempo? Imaginen, por un momento, que ORCID, organización sin ánimo de lucro que se encarga de proporcionar estos identificadores a investigadores académicos de todo el mundo, deje de existir por cualquier razón – crucemos los dedos para que no pase. ¿Cuáles serían las implicaciones para el trabajo diario de instituciones como las bibliotecas que gestionan recursos producidos por la comunidad científica la desaparición de una entidad de estas características?

En la actualidad todavía no contamos con la tecnología adecuada para trabajar con estos identificadores, por lo que es demasiado pronto para predecir el impacto que tendrá sobre los procesos y flujos de trabajo actuales, pero es evidente que nos veremos obligados a cambiar nuestra forma de trabajar.
Como Karen Smith-Yoshimura, de OCLC, señala en un post reciente el impacto de los identificadores sobre los flujos de trabajo actuales relacionados con el control de autoridades en bibliotecas dependerá de la utilización de herramientas que todavía no existen.

Fuente: Morillo Calero, María Jesús, “Control de Autoridades vs Gestión de Identidades”. [En Línea]. El blog dela BNE. Disponible en: http://blog.bne.es/blog/control-de-autoridades-vs-gestion-de-identidades/. [Consulta: 06/10/2016]

,

  1. Deja un comentario

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: