You are on page 1of 7

Artículos

Archivos en la era digital: problema (y solución) de los


recursos electrónicos
Por María José de Acuña y Xavier Agenjo

Resumen: Son muy numerosos los artículos publicados acerca de


María José de Acuña
lo que suponen, y pueden suponer, los recursos digitales para el me-
es licenciada en ciencias
jor funcionamiento de las llamadas instituciones de memoria. Pero la de la información y en
mayoría de ellos se refieren a los recursos digitales como algo que se geografía e historia.
consume y se pone a disposición de los usuarios, rara vez como algo Desde octubre de 2000
que se produce y se pone también a su disposición. A partir de las fun- forma parte de la em-
ciones propias de cualquier tipo de archivo, se propone crear recur- presa Digibis Produccio-
sos digitales acordes con una normativa dada (estructuras de meta- nes Digitales en la que
datos, OAI–PMH, web semántica, etc.) con la finalidad de incremen- coordina proyectos de
tar la capacidad de recuperación de la información y la visibilidad de digitalización. Trabaja
en cibermetría y en im-
ésta, tanto para especialistas como para cualquier tipo de usuario.
plantación de sistemas
Europa debe marcarse como objetivo prioritario desarrollar nuevos
integrados de gestión.
sistemas de recuperación de la información y nuevos productos basa-
dos en estándares y protocolos que le proporcionen una más competi-
tiva posición en la sociedad de la información.
Palabras clave: Recursos digitales, Metadatos, Web semántica, Archivos, Protocolo OAI–PMH.

Title: Archives in the digital age: the problem


Xavier Agenjo es licenciado en fi- (and solution) of electronic resources
losofía y letras y pertenece al cuerpo
Abstract: Many articles have been written about what dig-
facultativo de archiveros, biblioteca-
ital resources represent –or could represent– for improving
rios y arqueólogos (en excedencia).
Ha sido jefe del Servicio del Catálo-
the performance of ‘memory institutions’. But the majority
go Colectivo del Patrimonio Biblio- of them refer to digital resources as things to be consumed
gráfico y de la Unidad de Coordina- and made available to users, but rarely as something to be
ción Informática de la Biblioteca Na- produced and later made available to them. Starting with
cional, director de su Departamento the functions of archives, the article proposes the creation of
de Acceso a la Información y al Do- digital resources according to standards (metadata struc-
cumento así como director de la Bi- tures, OAI–PMH, semantic Web, etc.) in order to enhance
blioteca Menéndez Pelayo. Desde resource discovery and information visibility, for specialists
enero de 2002 es director de pro-
as well as for other types of users. Europe must give top pri-
yectos de la Fundación Ignacio Larra-
ority to the development of new information retrieval sys-
mendi, donde se encarga de la coordinación de los trabajos de la
Bibliotecas Virtuales Larramendi. Ha participado en numerosos pro-
tems and new products based on emerging standards and
yectos nacionales e internacionales y es autor de un centenar de pu- protocols in order for European countries to achieve a more
blicaciones en el campo de la biblioteconomía, la bibliografía y la competitive standing within the information society.
automatización y digitalización de procesos documentales.
Keywords: Electronic resources, Metadata, Semantic web,
Archives, OAI–PMH protocol.

Acuña, María José de; Agenjo, Xavier. “Los archivos en la era digital: el problema (y la solución) de los recursos elec-
trónicos”. En: El profesional de la información, 2005, noviembre–diciembre, v. 14, n. 6, pp. 407-413.

1. Las dificultades del nuevo escenario


para las tecnologías de la información y las comunica-
Recientemente, la Secretaría de Estado del ramo ciones simplemente adquiriendo recursos (hardware,
criticaba la tendencia del sector público y privado es- software, licencias, permisos) producidos fuera de Es-
pañol a utilizar las partidas presupuestarias disponibles paña. Ése era justamente el camino contrario al que se
Artículo recibido el 10–09–05
Aceptación definitiva: 11–10–05

El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005 407


María José de Acuña y Xavier Agenjo

debería emprender para crear una industria informáti- vés de la web para diferentes tipos de usuarios. No se
ca y cultural europea (siguiendo la Estrategia de Lis- trata aquí de si son creados a partir de la digitalización
boa) y, en particular, española, verdaderamente com- de documentos en papel o si han nacido ya digital-
petente. mente; ni de la forma en que deben ser tratados a lo
largo de la vida de una institución, como evidencia o
Se trata, pues, de apostar por una industria europea
prueba de una actividad; o de los pasos y procesos que
y adquirirla o implementarla por el mero hecho de ha-
deben seguir los documentos hasta su conservación en
berse desarrollado en Europa. Se habla de realizar pro-
un archivo histórico, si es el caso. Cada organismo, ca-
ductos de igual o superior calidad con los que se con-
da archivo, seguirá los procedimientos que estén esta-
siga neutralizar la marcada dependencia existente en la
blecidos en la normativa profesional, pero en todos
actualidad de los grandes centros de información digi-
ellos existe el potencial de generar contenidos para la
tal norteamericanos. Alcanzar en 2010 los objetivos fi-
web2. Por una parte, al describir los documentos el ar-
jados en la Estrategia de Lisboa y hacer de Europa un
chivero crea bases de datos; por otra, el archivo custo-
área geográfica más competitiva y dinámica desde el
dia documentos generados en diferentes períodos his-
punto de vista económico exige experimentar un salto
tóricos, por distintas instituciones y en varios soportes
tecnológico suficientemente importante como para lo-
(de manera creciente en formato electrónico). Final-
grar contrarrestar el terreno perdido frente a EUA y al-
mente, el archivo facilita el acceso a la información
gunos países de Asia.
poniéndola al alcance de los diversos usuarios, inclui-
«La tendencia a recopilar la das las copias digitales, cuando la ley y los recursos
información y a ponerla (previo disponibles lo permiten.
pago) a disposición de todo el Resulta evidente que los archivos han profundiza-
mundo desde los EUA, no sólo do en la aplicación de las tecnologías de la informa-
no se ha modificado sino que ción a un ritmo espectacular durante los últimos vein-
se ha visto intensificada» ticinco años. Sin duda ha influido notablemente la apa-
rición de normativa internacional para la descripción
La llamada de atención que ha venido a suponer el archivística –ISAD(G) e Isaar(CPF)– y para la trans-
proyecto de Google para crear una biblioteca digital misión de esta información en formatos estructurados
con 15 millones de obras digitalizadas, ha alarmado a como las definiciones de tipo de documento EAD (En-
algunos países europeos que se ven forzados o a res- coded Archival Description) y EAC (Encoded Archival
ponder a esa iniciativa o a permitir que la mayoría de Context). Igualmente, la importancia de la gestión ar-
los recursos digitales referentes a Europa acaben sien- chivística en cualquier institución puede verse también
do consultados en bases de datos creadas en los EUA. en la publicación de normas como la ISO 15489 Infor-
Esta circunstancia terminará dándose también en los mation and documentation–records management
archivos. (2001) o la ISO 23081 Information and documenta-
No puede decirse que la situación descrita sea nue- tion–records management processes–metadata for re-
va. Ya los antiguos ‘terminalistas’, solían conectarse a cords (2004). Sin apartarse de las funciones tradicio-
Dialog, en Palo Alto, California, de forma práctica- nales apuntadas, los archivos desempeñan un papel
mente exclusiva, con algunas excepciones francesas o fundamental en todo lo relacionado con la gestión in-
inglesas. La tendencia a recopilar la información y a tegral de cualquier tipo de información durante todo su
ponerla (previo pago) a disposición de todo el mundo ciclo de vida, desde su nacimiento hasta su expurgo o
desde los EUA, no sólo no se ha modificado sino que conservación permanente. En este sentido los archive-
se ha visto intensificada. Y también ha ocurrido lo ros han desarrollado técnicas y procedimientos con los
mismo con las fuentes de información, recursos y ba- que han logrado mejorar la difusión de su competencia
ses de datos de acceso gratuito, siendo el número de profesional, de manera tal que hoy día este colectivo
recursos en la web procedentes de EUA incompara- recibe por parte de la sociedad una consideración (que,
blemente mayor que la producción europea. dicho sea de paso, siempre merecieron) como piezas
claves del motor de las instituciones3. Esta apreciación
Si se parte de la idea de que las instituciones de aumentará con toda seguridad en los próximos años, a
memoria1 pueden y deben ser productoras de recursos medida que estas instituciones difundan a través de la
y contenidos digitales, en el caso que nos ocupa (los web las ingentes cantidades de información contenidas
archivos) los identificaremos como generadores de in- en los documentos primarios que atesoran.
formación atendiendo a las funciones que le son inhe-
rentes. O dicho de otra manera: los archivos atesoran y Esta difusión sin embargo planteará, como ya lo ha
conservan una enorme cantidad de información que hecho en otros entornos como el bibliotecario o el aca-
puede ser transformada en contenidos accesibles a tra- démico, problemas para su localización, búsqueda y

408 El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005


Archivos en la era digital: problema (y solución) de los recursos electrónicos

recuperación en el entorno distribuido de la web ac- grados de aplicación de la norma y porque Z39.50 no
tual, y mucho más en la futura web semántica. Estos es un protocolo web.
retos han de solventarse con la creación de un nuevo
Las características básicas de OAI–PMH son:
tipo de estructuras de información y aplicaciones in-
formáticas que no sólo sean capaces de solucionar efi- —Flexibilidad para adaptarse a cualquier ámbito:
cazmente los procesos archivísticos tradicionales, sino puede ofrecer información sobre todo tipo de recurso,
de añadir nuevas funcionalidades basadas fundamen- tanto físico como digital.
talmente en el acceso y la difusión inteligente de la in-
—Gran facilidad de implantación. Los componen-
formación. De esta forma será posible crear/producir
tes del modelo OAI están basados en un recolector de
(y no sólo adquirir/consumir) nuevos recursos electró-
metadatos o harvester, en una interfaz de búsqueda y
nicos que estén al servicio de todos los usuarios y del
recuperación y un repositorio común formado por la
archivo mismo.
recolección de repositorios individuales, así como un
2. Incremento de la visibilidad de los conjunto de peticiones y respuestas que se realizan a
recursos digitales4 través de http. Las especificaciones para definir la es-
tructura que permite diseñar, tanto el recolector8 como
A partir del planteamiento de la conveniencia de
los repositorios9 pueden encontrarse en el sitio web de
crear contenidos accesibles en la web a partir de la in-
Open Archives Initiative.
formación conservada en archivos, debemos enfrentar-
nos a las limitaciones que desde el punto de vista fun- Sin embargo, es importante señalar que –aunque,
cional presentan los buscadores para encontrar recur- lógicamente, es necesaria la figura de un analista pro-
sos digitales en general, y archivísticos en particular. gramador para llevar a cabo el desarrollo y poner en
Hasta hace poco tiempo, su utilidad se circunscribía a funcionamiento el software– su estructura es absoluta-
páginas estáticas html, aunque ya se ha incorporado la mente inteligible para un archivero, para un bibliote-
búsqueda en el contenido de documentos en pdf, Word, cario o para un museólogo. La primera impresión, co-
y otro tipo de formatos. Desde luego, las bases de da- mo ocurre ante cualquier lenguaje de marcado, parece
tos permanecen inaccesibles para ellos, lo cual repre- presuponer una codificación difícil, pero no lo es mu-
senta un enorme reto a la hora de aumentar la visibili- cho más de lo que pueda serlo EAD y es perfectamen-
dad los recursos digitales que produzcan los archivos. te asumible por los profesionales de las instituciones
La solución que está fomentando la comunidad inter- de memoria para impulsar el desarrollo de los sistemas
nacional se basa en el uso de la recolección de meta- de recuperación basados en este protocolo.
datos5 (metadata harvesting), especialmente en el pro-
tocolo OAI–PMH6 (Open Archives Initiative–Protocol «La capacidad del protocolo de
for Metadata Harvesting), sobre lo que existe en Es- recolección de metadatos OAI
paña cierta literatura7 que ha permitido un conoci- para fomentar el acceso a la
miento relativo de sus características. Es de esperar información conservada en los
que esta experiencia se concrete en ejemplos legibles archivos puede verse en
en la web. En la actualidad existen en España 19 repo- OAIster»
sitorios OAI, pertenecientes en su mayoría al ámbito
de las universidades y surgidos del entorno de las bi- Muestra de que OAI no es sólo un protocolo para
bliotecas universitarias. la búsqueda y recuperación de artículos científicos o
de material bibliográfico en la web es que puede trans-
En nuestra opinión, éste debe ser un protocolo a
mitir y presentar la información en varios formatos, los
implantar en aquellos archivos e instituciones de me-
básicos para los profesionales de las instituciones de
moria, que quieran no sólo crear contenidos para la
memoria, estando entre ellos EAD y siendo el formato
web sino también implantar aplicaciones que favorez-
mínimo y común para cualquier entorno Dublin Core
can su localización. Si bien OAI–PMH surgió en el se-
sin calificar.
no de la comunidad académica y científica para la bús-
queda y recuperación de textos electrónicos, es perfec- Es de señalar la importantísima sinergia que ha
tamente aplicable en cualquier contexto, incluido por surgido entre OAI y los protocolos de recuperación de
supuesto el archivístico. Supone una alternativa a la vi- información en bases de datos distribuidas en el entor-
sión del mecanismo de búsqueda y recuperación pro- no http, dentro de ZING (Z39.50 International Next
puesto por el modelo distribuido de Z39.50. Se aleja Generation) y denominados SRW/U (Search/Retrieve
de éste por la complejidad de su aplicación y por su Web Service)10. Se denominan así porque en el primer
falta de precisión (tan bien conocida por los usuarios caso (SRW) el protocolo es operativo mediante SOAP
habituales de este procedimiento cuando consultan mientras que SRU lo es a través de url. Esta correla-
más de un servidor a la vez) a causa de los diferentes ción entre OAI y SRW/U11 era previsible puesto que en

El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005 409


María José de Acuña y Xavier Agenjo

último término ambos protocolos tienen como objeti- les, etc. con una fuerte estructura jerárquica de los di-
vo facilitar la búsqueda y recuperación de la informa- ferentes niveles de descripción y en las que el contex-
ción, aunque afrontándola desde diferentes perspecti- to de un documento dentro de esa jerarquía constituye
vas. Por otra parte, se sustentan en la utilización de es- una información fundamental. En último término, las
tructuras de metadatos específicas, en las que los ar- descripciones elaboradas según la ISAD(G) [o
chivos están representados por medio de EAD. Isaar(CPF), o mejor aún, formateadas en EAD o en
EAC] no dejan de ser sino documentos secundarios
Son ya millones los recursos digitales accesibles
que facilitan el acceso a los contenidos, pero no son los
en la red mediante OAI en los distintos recolectores
propios documentos primarios.
que existen. OAIster12, servicio creado por la Universi-
dad de Michigan, impulsora del protocolo OAI, es uno «Los archivos custodian la
de los más populares, pero Scirus13, y otros, son tam- información, pero no siempre
bién increíblemente potentes. En el momento de dar la
es accesible para el usuario
última redacción a ese trabajo (29 de julio de 2005)
final»
OAIster reunía 5.704.392 registros procedentes de 510
instituciones. La capacidad del protocolo de recolec-
Lo que aquí se propone es que la difusión de la in-
ción de metadatos OAI para fomentar el acceso a la in-
formación contenida en los archivos y los objetos di-
formación conservada en los archivos puede verse en
gitales asociados (bien sea por digitalización o por tra-
el servicio de búsqueda y recolección que proporciona
tarse de documentos electrónicos), incorporen siempre
OAIster. Dentro de las instituciones que ofrecen sus
sus metadatos conforme a la normativa expuesta para
bases de datos en forma de repositorios OAI recolecta-
que sea posible el desarrollo de repositorios abiertos
bles, se encuentran dos importantes muestras de cómo
en los que descargar sistemáticamente los registros. De
los archivos pueden aplicar este protocolo y difundir
esta forma, podrán ser recogidos por recolectores de-
sus colecciones: Archives in London and the M25 Area
sarrollados por terceros y ofrecer a los usuarios tanto
y Princeton University Library.
nuestros propios recursos digitales o electrónicos co-
Todo ello nos lleva a la necesidad de mantener una mo el compendio de información producida por terce-
política sistemática de asignación de metadatos, tanto ros. Es fundamental añadir que existe una inmensa
de los instrumentos de descripción como de los docu- cantidad de información todavía no digitalizada y, si-
mentos digitales, para que puedan ser recuperables en guiendo las líneas expuestas, uno de los aspectos es-
la web y alcanzar un máximo de visibilidad. Conside- tratégicos del proceso global de digitalización consis-
ramos necesario destacar que estamos hablando de te en llevarla a cabo no sólo para funciones de preser-
aquellos metadatos que faciliten la recuperación de la vación, o incluso de consulta simple, sino para edificar
información por todos los usuarios y que podrán ser en torno a ellas repositorios y recolectores basados en
derivados, extraídos o convertidos a partir de los pro- OAI.
cesos de asignación o captura propia de la gestión do-
Ésta es una propuesta para animar a la creación de
cumental o archivística. Es indiscutible que sólo me-
contenidos para la web actual y facilitar su difusión en
diante una adopción sistemática de una política de des-
la misma, pero el reto que se nos avecina es afrontar
cripción que tenga en cuenta la normativa archivística,
los condicionantes de la web semántica. El siguiente
de gestión documental y los esquemas de transmisión
apartado se centrará en la tecnología que permitirá
de los protocolos de búsqueda y recuperación de in-
construir a medio plazo una constelación de sitios con-
formación será posible aprovechar el esfuerzo en la
forme a la metodología definida por la normativa del
creación de metadatos para facilitar el uso de la infor-
W3C y que tiene como objeto ir construyendo la futu-
mación a sus usuarios finales.
ra web semántica. Hacer factible la visibilidad de los
Los archivos custodian la información, pero no recursos digitales existentes y mejorar su búsqueda y
siempre es accesible para el usuario final; en general recuperación se ha convertido en el objetivo funda-
facilitan su búsqueda, pero están aún muy lejos de dis- mental de los organismos que, a escala internacional,
poner de herramientas para el usuario que les permita están impulsando su desarrollo.
consultar los documentos eficazmente. No se trata só-
3. La web semántica
lo de ofrecer, mediante los instrumentos de descrip-
ción, la información que se tiene reunida, sino de cre- Sobre esta nueva concepción de la red hay tantas
ar y desarrollar aplicaciones más potentes para ofrecer definiciones que quizá lo más práctico sea remitir al
toda la información no reservada. La búsqueda y recu- interesado a la página del W3C14 y permitir que allí se
peración de información en bases de datos archivísti- beba en las fuentes directas15. En último término, es un
cas presenta unas peculiaridades específicas; en ellas nuevo modelo de estructuración, interrelación y recu-
se agrupan fondos, secciones, colecciones documenta- peración de la información, gracias al uso de una serie

410 El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005


Archivos en la era digital: problema (y solución) de los recursos electrónicos

de normas y estándares ya existentes, como xml o rdf, caracteres más o menos afinadas, pero no disponen de
o algunas nuevas creadas al efecto como OWL16, así una estructura semántica que permita la navegación
como determinados protocolos de comunicación y es- entre significados y contenidos. Por último, también es
tructura de la información que configuran una solución frecuentísimo el exceso de información, el denomina-
informática, completamente nueva, original y suma- do ‘ruido’. Tal y como previó en su día Claude Shan-
mente potente. Con frecuencia, aquellos profesionales non20 en su Teoría matemática de la comunicación
que se sienten interesados por las perspectivas que pa- (1948), los ruidos y silencios son inherentes a los sis-
recen ofrecer las ontologías para las instituciones de temas de información automatizada.
memoria, lamentan no encontrar entre las muchas que
Y es obvio que es en este entorno en el que tienen
se están desarrollando en los últimos años ninguna que
que desplegar su actividad los archivos. Ni que decir
encaje exactamente con su campo de competencia. Se
tiene que a medida que estas instituciones se incorpo-
podría mencionar, tal vez, por su interés en un entorno
ren a la web difundiendo sus bases de datos, sus meta-
europeo, dos iniciativas específicas: EuroStory.net17 y
datos y documentos digitales, participarán plenamente
Vicodi18, que sí participan, y de forma avanzada, de es-
de estos problemas, por lo que creemos que no está de
te nuevo modelo conceptual e informático.
más aventurar algunas de las soluciones que se están
Lo que se pretende es superar las carencias e insu- proponiendo en las tecnologías de la información.
ficiencias que la world wide web histórica ha ido pre- 3.1. Características de la web semántica
sentando a medida que crecía exponencialmente el nú-
mero de sitios en la Red. La web semántica tiene co- Dado que el nacimiento de las ontologías y de la
mo objetivo sustentar los sitios y servicios de la web web semántica es tan reciente, son muchas las inter-
en unas nuevas estructuras de información constituidas pretaciones y diseños que actualmente se están discu-
por una red organizada de conceptos y relaciones se- tiendo. Pero si vamos estableciendo una contraposi-
mánticas pertenecientes a un dominio del conocimien- ción con la web actual, se podría decir que presenta es-
to a las que se denomina ‘ontologías’. La suma de con- tas características:
ceptualizaciones de los diferentes dominios del cono- —Los recursos no están relacionados únicamente
cimiento concretadas en ontologías, junto con los mediante enlaces simples, sino a través de relaciones
agentes de software intermediarios son sus elementos que tienen un significado, relaciones semánticas, como
constitutivos, de igual modo en que el conjunto de los por ejemplo: “los presupuestos municipales se generan
sitios actuales componen en la actualidad la web que en Hacienda” o “Hacienda elabora los presupuestos
conocemos19. municipales”.
«A través de la estructura —A diferencia del tradicional modelo web, el con-
semántica que componen las tenido de las páginas, previamente estructurado, es in-
ontologías, tanto los usuarios teligible no sólo para el usuario sino también para las
como los agentes de software aplicaciones, programas y agentes de software. El en-
recuperan información tramado de relaciones semánticas lo proporcionan las
ontologías y por medio de ellas se puede navegar a sig-
verdaderamente pertinente»
nificados más amplios, más restringidos o relaciona-
dos.
La web actual puede caracterizarse, entre otras
muchas maneras, porque los recursos y la información —A través de la estructura semántica que compo-
que contienen están relacionados únicamente median- nen las ontologías, tanto los usuarios como los agentes
te enlaces simples (urls). Los usuarios navegan entre de software recuperan información verdaderamente
los referidos recursos por medio de estos enlaces, sin pertinente. Los sistemas informáticos son capaces de
embargo, el contenido del sitio, recurso o página, y por leer la información utilizando las relaciones extensi-
tanto, su interés o pertinencia es sólo inteligible para el bles de las ontologías y pueden proporcionar respues-
usuario. Los sistemas informáticos, aplicaciones y tas ajustadas y pertinentes, incluso no previstas por el
agentes de software de la web actual sólo son capaces usuario.
de leer la dirección, pero no pueden interpretar el con-
3.2. La construcción de la web semántica
tenido. A pesar de las nuevas funcionalidades que
ofrecen los buscadores, no logran superar las limita- Cualquier dominio del conocimiento o de la acti-
ciones de la recuperación de la información; por un la- vidad puede ser estructurado en forma de ontología,
do, la mayor parte de la información, la contenida en por lo que cualquier institución histórica o actual, sus
bases de datos, permanece oculta. Su patrón de bús- funciones, actividades y procedimientos, sus departa-
queda está formado por comparaciones de cadenas de mentos, unidades componentes, cargos y miembros,

El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005 411


María José de Acuña y Xavier Agenjo

sus reglamentaciones, relaciones, etc., pueden presen- ra atribuir significados mediante una codificación pre-
tarse de esta forma como elemento nutriente de la web cisa.
semántica. Es decir, podemos pensar en que un archi-
Sin embargo, los dos últimos pasos no presentan
vo, sea del tipo que sea, atesora no sólo la información
dificultades especiales y así, pasar de ISAD(G) a EAD
contenida en sus documentos sino que también guarda
no entraña una especial problemática. Sencillamente
en sus metadatos el conocimiento sobre un determina-
los responsables de archivos tienen que conocer y to-
do área y que éste podrá ser general o sectorial.
mar la oportuna decisión para realizar las transforma-
Pongamos el ejemplo del patrimonio documental, ciones al nuevo etiquetado. El siguiente paso que se
aunque podrían ser muchos otros; en las guías, inven- propone es extraer los conceptos y relaciones semánti-
tarios, instrumentos de descripción, tesauros, etc., cas de los metadatos y crear ontologías como procedi-
existen conceptos y relaciones entre los mismos que miento para estar presentes en la futura web semánti-
pueden ser extraídos y estructurados en forma de on- ca. Todo ello habrá de hacerse basándose en las co-
tología para compartir el conocimiento. De los meta- rrespondientes aplicaciones informáticas y participan-
datos de archivos digitales y virtuales, así como en do en el diseño de las mismas. En nuestra opinión, se
otros repertorios y fuentes de información comple- dará este paso si se percibe la importancia de cumplir
mentarios (necesarios por otra parte para la elabora- las funciones archivísticas en el entorno tecnológico
ción de cualquier instrumento de descripción), se pue- actual, lo que se puede alcanzar mediante recolectores
den extraer relaciones de nombres de lugares, históri- y ontologías.
cos y actuales, profesiones, tipologías documentales, En la actualidad Digibis, con la colaboración de la
instituciones, profesionales, actividades comerciales, Fundación Ignacio Larramendi, está llevando a cabo,
etc., interrelacionándolas conforme a un modelo de en- con la financiación del Programa Profit, una iniciati-
tidad/relación21. va de este tipo, denominada “ontología de polígrafos”
No sería difícil extender esta propuesta a una suma (FIT–350200–2004–3824), en la que se incluye la
de ontologías del patrimonio documental, bibliográfi- transformación de contenidos típicos como archivos
co e histórico (por seguir con el ejemplo) que podrían personales y epistolarios. Confiamos en que pueda te-
conformar una posible ontología del patrimonio cultu- ner una utilidad no sólo para nuestros propios fines si-
ral de una determinada zona. De hecho, el Comité In- no también para las instituciones de memoria en ge-
ternacional para la Documentación del Consejo Inter- neral.
nacional de Museos (ICOM–Cidoc) viene trabajando 4. Conclusiones
desde hace 10 años en la elaboración de una ontología
base para el intercambio de información sobre patri- Todas las recomendaciones, normativas y estructu-
monio cultural en el entorno de la web semántica. Es- ras de información expuestos en este texto tienen co-
te modelo, el Conceptual Reference Model22, inicial- mo objetivo animar a que los archivos, y también el
mente pensado para el mundo de los museos, está di- resto de instituciones de memoria, encaminen su acti-
señado para que pueda ser utilizado por cualquier ins- vidad, en el marco de las funciones que le son propias,
titución de memoria. hacia el entorno de la creación de contenidos digitales
y su difusión en la web por los mecanismos y tenden-
Es claro que el desarrollo de la web semántica de- cias más actuales de la misma. En definitiva se trataría
penderá de la disponibilidad de contenidos y del mar- de:
cado sintáctico y semántico de estos contenidos, así
como del desarrollo de herramientas que permitan el a. Hacer accesible internacionalmente el patrimo-
análisis del conocimiento. Para ello, se deberán adop- nio cultural español:
tar lenguajes de representación del conocimiento, co- —Crear un corpus orgánico digital del patrimonio
mo rdf u OWL, para lo cual las instituciones de me- documental al que en la actualidad es difícil acceder, o
moria se encuentran en una situación privilegiada res- que no es accesible al público en general.
pecto a otras áreas de conocimiento. En efecto, estas
organizaciones estructuran la información que poseen b. Generar contenidos en los idiomas de España
en instrumentos tales como inventarios, catálogos, te- para la web:
sauros, clasificaciones y todo tipo de taxonomías. Una
—Digitalización de documentos, piezas, etc., con-
gran mayoría de esos instrumentos se encuentra ya au-
versión de bases de datos existentes, conversión de
tomatizada23 y un porcentaje elevado en estructuras
fuentes de referencia consolidadas, etc.
normalizadas. Ya son menos los que han utilizado len-
guajes de marcado como xml para estructurar esta in- c. Implementar sistemas de información adaptados
formación y menos aún las que emplean metadatos pa- a la normativa de la comunidad internacional vincula-

412 El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005


Archivos en la era digital: problema (y solución) de los recursos electrónicos

da a todo tipo de instituciones de memoria y a las ten- http://www.dlib.org/dlib/february05/sanderson/02sanderson.html.


dencias de las tecnologías de la información en la web. 12. Es conveniente visitar con frecuencia este sitio pues el incremento
constante del número de repositorios a los que accede el recolector permi-
d. Conocer, mediante el desarrollo y uso de las co- te, o puede permitir, que una búsqueda que no había obtenido éxito en
rrespondientes aplicaciones y sistemas de información una consulta anterior lo consiga en una segunda sesión.
http://oaister.umdl.umich.edu/o/oaister
como la recolección de metadatos o la creación de on-
tologías, el dominio Patrimonio Cultural para contri- 13. Scirus nació con una vocación específicamente científica y, aunque no
recoge, al menos en la actualidad, tantos repositorios como OAIster, sí
buir a su difusión, mantenimiento y estudio. plantea una filosofía y una metodología completamente distinta, que es
muy recomendable conocer.
Notas
http://www.scirus.com/srsapp
1. En este sentido puede leerse el artículo de Hernández, Francisca;
Wert, Carlos; Recio, Ignacio; Aguilera, Begoña; Koch, Walter; Bo- 14. Esta dirección es la versión española del W3C, lo que siempre facilita
gensperger, Martin; Linde, Peter; Günter, Georg; Mulrenin Bob; la consulta, aunque con frecuencia haya que acudir a la fuente original.
Agenjo, Xavier; Yeats, Robin; Bordoni, Luciana; Poggi, Fabrizio. http://www.w3c.es
“Xml for Libraries, archives, and museums: the project Covax. En: Ap-
plied artificial intelligence, 2003, v. 17, n. 8–9, pp. 797–816. 15. Aunque cerrado el año pasado (2004) contiene el más amplio conjun-
to de menciones y declaraciones sobre la ontología. Lo considero de lec-
Este artículo describe una completa metodología, realizada por europeos
tura imprescindible.
dentro del programa IST, acerca de cómo es perfectamente posible anali-
zar y diseñar las soluciones técnicas precisas para permitir el acceso, a http://www.w3.org/2001/sw/WebOnt
través de internet, a descripciones de documentos de archivos, bibliotecas
16. Esta página, muy bien traducida al español, no sólo es un buen con-
y museos codificadas de forma homogénea, basándose en la aplicación de
junto de explicaciones sobre OWL sino que también aclara algunos pun-
sgml/xml, y crear bases de datos, utilizando tecnología avanzada. El pro-
tos sobre el concepto y la función de la ontología.
yecto Covax (Contemporary Virtual Archives in Xml) se inició en 2000 y
concluyó en 2002. http://www.w3c.es/Traducciones/es/SW/2005/owlfaq
http://www.covax.org 17. http://www.eurohistory.net/Index.do
2. Un ejemplo de ello es Einstein Archives Online del California Institut
18. Muy clarificadora resulta en este sentido la siguiente presentación:
of Technology. En este archivo están disponibles tanto los documentos di-
gitalizados como el inventario del archivo y una base de datos con los do- http://www.museumscomputergroup.org.uk/meetings/1_2005_docs/A–Begi
cumentos descritos individualmente. nner’s–guide–to–the–Semantic–Web.ppt
http://www.alberteinstein.info/ http://www.vicodi.org/about.htm

3. Lo cual puede apreciarse en la norma ISO 15489 Records management 19. Sobre la bibliografía en español acerca de la ontología y la web se-
dirigida a la gestión de documentos en todo tipo de instituciones. La co- mántica me remito a la comunicación titulada “La web semántica y las
rrespondiente norma UNE se encuentra en fase de información pública. ontologías en el mundo de los archivos” (actualmente en prensa) presen-
tada en el VI Congreso de la Asociación de Archiveros de Castilla y León
4. Este artículo presenta concreciones sobre los archivos a partir de los (ACAL), celebrado en Burgos, en noviembre de 2004.
contenidos más genéricos presentados en la ponencia “Recursos digitales:
un reto para las bibliotecas nacionales”. En: Jornadas sobre bibliotecas 20. Una información completa, entre las aproximadamente 64.500 pági-
nacionales: las bibliotecas nacionales del siglo XXI, 2005. nas dedicadas a Claude Shannon, figura básica de nuestro tiempo, es:
http://bv.gva.es/documentos/Ponencias/Agenjo.pdf http://www–groups.dcs.st–and.ac.uk/%7ehistory/Mathematicians/Shannon
.html
5. Weibel, Stuart L. “Border crossings reflections on a decade of meta-
data consensus building”. En: D–Lib magazine, 2005, July/August, v. 11, 21. Agenjo, Xavier; Hernández, Francisca. “Del catálogo colectivo a la
n. 7/8. biblioteca virtual: la Biblioteca Virtual del Patrimonio Bibliográfico”. En:
http://www.dlib.org/dlib/july05/weibel/07weibel.html I Jornadas sobre patrimonio bibliográfico en Castilla–La Mancha, 2003.
6. En general, toda la información que presenta la página principal se ca- 22. En esta misma página se ofrece una codificación del modelo (versión
racteriza por estar perfectamente ordenada y ser sumamente inteligible. 3.4.9) en RDFS, directamente importable a programas de edición de onto-
Es una página muy viva que presenta con frecuencia nuevas funcionalida- logías como Protégé. La versión 3.4.9 se corresponde, desde octubre de
des o versiones más actualizadas de los distintos protocolos y estructuras 2003, con la ISO Draft International Standard ISO/DIS 21127. Desde el 5
de información que contiene. de julio, la versión 3.1 de este extendido editor de ontologías incluye un
http://www.openarchives.org/OAI/openarchivesprotocol.html potente y útil editor de OWL.
7. En este artículo, leído en abril de 2005 y redactado en el otoño de http://protege.stanford.edu/
2004, se hacían referencias a esas limitaciones: Agenjo Bullón, Xavier; http://protege.stanford.edu/plugins/owl/
Hernández Carrascal, Francisca. “La recolección de metadatos (meta- http://cidoc.ics.forth.gr/official_release_cidoc.html
data harvesting) y su aplicación en España”. En: IX jornadas españolas
de documentación, 2005. Madrid: Fesabid, 2005, 586 pp. Isbn 23. Escalona, María José; Mejías, M.; Torres, Jesús; Cordero, Juan
84–930335–5–3. M.; Romano, M. G. “Aplicación integrada de la biblioteca digital del pa-
Además del texto de la comunicación puede verse la presentación que tu- trimonio histórico andaluz” En: Jbidi 2000: primeras jornadas de biblio-
vo lugar el viernes 19 de abril. tecas digitales, 2000. Isbn 84–8448–066–6, pp. 295–298.
http://www.fesabid.org/madrid2005/descargas/presentaciones/comunicaci http://imhotep.unizar.es/jbidi/jbidi2000/31_2000.pdf
ones/hernandez_francisca.pps
24. Resolución de 2 de marzo de 2005, de la Dirección General para el
8. http://www.openarchives.org/OAI/openarchivesprotocol.html Desarrollo de la Sociedad de la Información, por la que se publican las
ayudas concedidas en el año 2004 del Programa Investigación y Desarro-
9. La creación de repositorios, conviene insistir, no supone necesariamente
llo.
el desarrollo de un harvester, sino que es sencillamente una forma de rotu-
rar el campo para que terceros recolectores recuperen la información.
http://www.openarchives.org/OAI/2.0/guidelines–static–repository.htm María José de Acuña, Digibis Producciones Digitales,
10. http://www.loc.gov/z3950/agency/zing/srw Claudio Coello, 123. 28006, Madrid.
mariajose.acuna@digibis.com
11. Es muy interesante la lectura del artículo aparecido en febrero de
2005: Sanderson, Robert; Young, Jeffrey; LeVan, Ralph. “SRW/U Xavier Agenjo, Fundación Ignacio Larramendi.
with OAI: expected and unexpected synergies”. En: D–lib magazine. xavier.agenjo@larramendi.es

El profesional de la información, v. 14, n. 6, noviembre-diciembre 2005 413

You might also like