Matinée du 23 juin 2011 - Formats de données : RDA, FRBR et formats de données par Françoise LERESCHE et Patrick LE-BOEUF

Pour visualiser la présentation (très complète) effectuée par Françoise Leresche (BNF) et Patrick Le-Boeuf (BNF) sur l'évolution des formats de données et des catalogues de bibliothèques (présentation de FRBR, du RDA, du XML et de ses dérivés, du web de données et du web sémantique et des évolutions attendues des catalogues) rendez-vous sur le Slide Share de BiB92 :
http://www.slideshare.net/BiB92/2011-0623-bib92formatsdedonneesflplb

Les liens à consulter pour aller plus loin :
Sur FRBR :
- page de présentation de la BNF sur FRBR, FRAD et FRSAD
- présentation de FRBR sur Figoblog
- page de Wikipédia sur FRBR
- page du FRBR Group de l'IFLA (en anglais)
- FRBR Workshop sur le site OCLC (Ohio College Library Center) (en anglais)
- FRBR blog par William DENTON (web librarian à la bibliothèque universitaire d'York, Canada) (en anglais)
- rapport final sur FRBR par la Library of Congress (en anglais)

Sur RDA :
- page de présentation de la BNF sur RDA
- blog sur RDA de l'ABES
- groupe technique sur l'adoption de RDA en France (AFNOR - GE6)
- Joint Steering Committee for Development of RDA (en anglais)

Sur RDF :
- http://websemantique.org/RDF
- http://www.lespetitescases.net/rdf-pour-les-nuls
- http://www.w3.org/RDF/ (en angais)

Sur XML :
- page de Wikipédia sur XML
- http://www.w3.org/XML/ (en anglais)

Sur DAISY :
- présentation de DAISY par le groupement des intellectuels aveugles ou amblyopes
- introduction au format DAISY par la bibliothèque de l'INCA (Canadian National Institute for the Blind)
- Association Sésame (bibliosésame)
- Association Valentin Haüy
- DAISY consortium (en anglais)


Ci-dessous, quelques notes prises à la volée sur cette intervention et sur celle de Hélène Kudzia qui a présenté le format DAISY.

 

BiB92 - matinée professionnelle : l'évolution des formats de données

 

Le 23 juin 2011 à Antony

 

Intervenants : Françoise LERESCHE et Patrick LE-BŒUF (BNF) et Hélène KUDZIA (Ville de Paris, ABF). Animateur : Pascal VISSET (BiB92).

 

 

1. Du FRBR au RDA, mutation des catalogues en bibliothèque

 

- FRBR, modèle conceptuel de données bibliographique, publié en 1998 : à l’origine créé pour réduire l’étendu et les coûts des catalogues des bibliothèques – mais les points d’accès n’ont pas été réduits ; un seul catalogue FRBR en fonction actuellement (celui de Charles Ammi CUTTER, datant du… 19e siècle) ;

 

- FRBR met en avant la notion de lien entre les entités qui le constituent ;

 

- avenir : convertir MARC pour rendre les données des catalogues compatibles avec les langages XML et le web de données ;

 

- XML : structuration des données mais pas un format spécifique – on parle plutôt de formats de structuration de données obéissant à XML ; historiquement, SGML est arrivé en premier, trop compliqué, puis HTML, trop simple – XML en 1998 se situait à mi-chemin ;

 

- XML est un langage de balisage de contenu via des données descriptives incluses dans le corps du document (invisible mais permettant d’agir sur le contenu) ; on parle de DTD (abandonnées peu à peu) ou de schéma XML (utilisé majoritairement) ;

 

- ONIX : format de données « éditeurs » XML – intérêt pour les catalogues de bibliothèques d’être compatibles ;

 

- EAD : formats de données archivistiques ;

 

- Dublin Core (créé à Dublin, Ohio, par OCLC) : liste d’éléments d’informations minimales pour un échange de données sur une ressource (peut être exprimé enb XML) ;

 

- enjeu d’avenir pour les bibliothèques : adapter MARC aux formats XML sur le web – ce que permet RDA ;

 

- MODS et MADS sont des schémas de description XML pour des ressources et pour des autorités ;

 

- MARCXML : traduction de MARC en XML ;

 

- web sémantique ou de données : le web sémantique est un outil pour atteindre l’objectif du web de données visant à faire des pages HTML des données interprétables par les machines ;

 

- enjeu fort pour les bibliothèques d’exporter leurs données sur le web de données et d’utiliser les données de ce web ;

 

- principe de transformation : remplacer MARC par des structurations normalisées de données utilisées sur le web (FOAF, DC…) et en respectant le syntaxe du RDF, utilisée pour le web sémantique ;

 

 

- le code de catalogage RDA vise à sortir de logique des fichiers pour rendre accessibles les données des catalogues sur le web via les moteurs de recherche ; RDA est totalement adapté à FRBR et permet la récupération de métadonnées d’autres formats XML.

 

2. Le format DAISY – les formats de données au service de l’accessibilité

 

- DAISY est un format XML dans des fichiers exprimés en SMIL ayant comme objectif de permettra la navigation au sein d’un document sonore ;

 

- matériels de lectures spécifiques pour exploiter le DAISY mais un fichier MP3 contenant DAISY sera lisible normalement par tout lecteur MP3 ;

 

- un document sonore DAISY = des fichiers MP3 accompagnés de fichiers SMIL descriptifs permettant la navigation grâce à la structuration XML ;

 

- DAISY peut être appliqué à des textes qui seront synthétisés vocalement par des lecteurs ayant leur propre synthèse vocale embarquée ;

 

- en Allemagne, des fichiers MP3 sont commercialisés avec des fonctionnalités DAISY disponibles (pas le cas en France) ;

 

- en France, ce sont majoritairement les bibliothèques spécialisées associatives qui diffusent DAISY et de grands établissements (José Cabanis à Toulouse, Champs Libres à Rennes, Marguerite Duras à Paris ;

 

- le modèle idéal pour le moment est la Suède ;

 

- enjeu important car à peine 7% des non-voyants savent lire le braille ;

- à noter que le format epub est en fait du DAISY compressé.