Los metadatos son simplemente datos sobre datos, es decir, información estructurada que describe a otra información y que nos permite encontrarla, gestionarla, controlarla, entenderla y preservarla en el tiempo.
Los metadatos no son un concepto nuevo: la inclusión de metadatos es el método utilizado tradicionalmente en el mundo de las bibliotecas para gestionar libros y archivos. Sin embargo, el nacimiento de la informática y, más concretamente, las posibilidades de intercambio de información surgidas en torno a la Web Semántica, hizo que aumentara la popularidad del término. Del mismo modo se hizo patente la necesidad de describir estándares.
Para ilustrar su utilidad, podemos ver unos sencillos ejemplos de metadatos empleados por Classora Knowledge Base. Si tomamos una unidad de conocimiento como Fernando Alonso, vemos que tiene asociados diferentes atributos en su ficha: fecha de nacimiento, profesión, carreras en F1… etc. Cada uno de estos atributos dispone en Classora de un conjunto de metadatos asociados como el que se describe a continuación:
DATE
, la profesión es de tipo KNOWLEDGE-UNIT
y el nº de carreras es de tipo INTEGER
. En general, tener los datos tipificados resulta imprescindible en cualquier base de datos estructurada.Esta capa de inteligencia basada en metadatos es lo que hace que el repositorio digital de Classora sea considerado una base de conocimiento, y no solo una base de datos.
En general, los metadatos pueden clasificarse en tres amplias categorías con límites no siempre bien definidos, y muchas veces superpuestos:
Metadatos descriptivos: son aquellos que sirven para la descripción e identificación de los recursos de información. Permiten la búsqueda y recuperación de los datos, así como distinguir recursos y entender sus contenidos. Se realizan mediante estándares como Dublin Core, estándares MARC, microdatos de HTML… etc.
Metadatos estructurales: son los que más influyen en la recuperación de la información, facilitando la navegación y presentación de los recursos. Ofrecen información sobre su estructura interna y permiten establecer relaciones entre ellos, de manera que pueden incluso unir los archivos de imagen y textos que están relacionados. Los estándares más difundidos para en este sentido son SGML, RDF y EAD (Encoded Archival Description).
Metadatos administrativos: incluyen datos para la gestión de derechos, firma digital, auditorías de calidad, control de acceso mediante contraseñas… etc. También se podrían enmarcar en esta categoría los metadatos sobre preservación a largo y corto plazo. Ejemplo, imágenes DICOM que incluyen metadatos como: tipo y modelo de escáner utilizado, resolución, paciente, limitaciones de reproducción… etc.
Dublin Core es probablemente el estándar de metadatos más extendido. Su nombre hace referencia a Dublín (Ohio, Estados Unidos), ciudad que en 1995 albergó la primera reunión a nivel mundial de muchos de los especialistas en metadatos y Web de la época.
Dublin Core describe material digital como videos, sonidos, imágenes, textos y páginas web. Para ello utiliza básicamente XML, HTML y RDF. Además, proporciona un conjunto de convenciones simples y estandarizadas para describir recursos de forma que se facilite su encuentro online. Para la transmisión de datos, tiene asociado el protocolo OAI-PMH.
Dublin Core está gestionado por la DCMI (Dublin Core Metadata Iniciative), una organización que trata de fomentar la adopción de estándares y generar un foro abierto para el desarrollo de vocabularios especializados en describir recursos, que permitan sistemas de recuperación más inteligentes.
La siguiente tabla es una recopilación no exhaustiva de algunos de los más importantes estándares para metadatos que se han generado hasta el momento.
Recursos en general | Dublin Core (DCMES, DCMI Metadata Terms) |
Obras de arte | CDWA (Categories for the Description of Works of Art) CDWA Lite VRA (Visual Resources Association) Core Categories |
Recursos bibliográficos | MODS (Metadata Object Description Schema) MARC21, UNIMARC, MARCXML TEI (Text Encoding Initiative) Headers |
Archivos y preservación | EAD (The Encoded Archival Description) OAIS (Reference Model for an Open Archival Information System) PREMIS (Preservation Metadata: Implementation Strategies) |
Recursos educativos | IMS LOM (Learning Object Metadata) CanCore SCORM (Sharable Content Object Reference Model) |
Publicación | ONIX (ONline Information Exchange) |
Derechos de autor | CopyrightMD DOI (Digital Object Identifier) ODRL (Open Digital Rights Language) |
Recursos científicos | CSDGM (Content Standard for Digital Geospatial Metadata) Darwin Core |
Multimedia | MPEG-7 Multimedia Content Description Interface PBCore (The Public Broadcasting Metadata Dictionary) |
Redes sociales y personas | vCard FOAF (Friend Of A Friend) |
Información geográfica | ISO-19115 FGDC (Federal Geographic Data Committee) |
Libro electrónico | EPUB (Electronic Publication) |
Imágenes médicas | DICOM (Digital Imaging and Communication in Medicine) |
En definitiva, tal y como hemos comentado en otras ocasiones, si estás interesado en este tema, no dudes en contactar con nosotros para que te hagamos llegar más enlaces y documentación adicional. Desde Classora Technologies quedamos completamente a tu disposición.
me parece a limite la informacion