Università Cattolica del Sacro Cuore

La minestra di alfabeto del controllo bibliografico: domande & risposte sul cambiamento dalle AACR a RDA e l'evoluzione del MARC

A cura di Angela Contessi e Alejandro Gadea Raga
Il NISO (National Information Standards Organization), organizzazione statunitense non profit fondata nel 1939 che mantiene e pubblica standard tecnici relativi ad applicazioni bibliografiche e bibliotecarie, tra cui il protocollo Z39.50, ha organizzato lo scorso 14 ottobre 2009 un webinar sul controllo bibliografico, il cambiamento dalle AACR a RDA e l'evoluzione del MARC ("Bibliographic Control Alphabet Soup: AACR to RDA and Evolution of MARC").
In tale occasione sono state rivolte alcune importanti domande a Barbara Tillett e a Diane Hillmann. Siamo ora particolarmente lieti di potervele proporre in vista della prossima pubblicazione delle RDA prevista per giugno 2010.

Barbara Tillett Barbara Tillett è Direttore del Policy and Standards Division della Library of Congress e rappresentante della Library of Congress nel Joint Steering Committee for Development of RDA (precedentemente Joint Steering Committee for Revision of AACR). Recentemente ha guidato il lavoro dell'IFLA verso la Dichiarazione di principi di catalogazione internazionali e ha contribuito a sviluppare il modello concettuale FRBR e la sua estensione FRAD. E' membro del comitato editoriale di Advances in Librarianship and Cataloging & Classification Quarterly e ha presieduto diversi comitati dell'ALA e dell'IFLA. Barbara Tillett è autrice di numerose pubblicazioni nel campo della biblioteconomia e della scienza dell'informazione.


HillmanDiane Hillmann è attualmente Direttore del Metadata Initiatives, Information Institute of Syracuse e socio dello studio di consulenza Metadata Management Associates. Dal 1977 al 2008 è stata associata alla Cornell University Library, prima come catalogatore di scienze giuridiche poi come manager dei servizi tecnici; si è anche occupata della gestione delle autorità e dei processi di mantenimento della base dati della Cornell Library. Tra il 2000 e il 2005 ha partecipato per parte della Cornell University Library alla National Science Digital Library (https://nsdl.org) Core Infrastructure in qualità di Direttore del Library Services and Operations. Dalla fine degli anni '80 al 2000 Diane Hillmann è stata membro del MARBI come specialista dei formati sui posseduti e le autorità, ciò che l'ha portata a partecipare al Dublin Core Metadata Initiative. Attualmente è redattore di "Using Dublin Core" (https://dublincore.org/documents/usageguide/), già membro del DCMI Usage Board, e membro del DCMI Advisory Board. Ha pubblicato (con Elaine Westbrooks) Metadata in Practice, presso le ALA Editions (2004) e scrive su questioni riguardanti la biblioteca digitale e i metadati.

1. Con le RDA, le registrazioni MARC potrebbero scomparire? In caso affermativo, per quanto tempo ancora potranno essere impiegate?
Diane Hillman: Penso che ci vorrà molto tempo prima che le registrazioni MARC spariscano completamente (come ho detto nel webinar, penso che ci sarà posto per un formato lossy, ovvero con perdita di dati, per lo scambio specializzato per i prossimi tempi. Ma penso che sia fondamentale iniziare a guardare avanti ai risultati veramente buoni che si potranno ottenere con gli elementi RDA e i vocabolari come base per lo scambio dei dati che può essere generalizzato al di là del mondo MARC.
 
Barbara Tillett: Le RDA sono destinate ad essere impiegate con qualsiasi schema o visualizzazione, per cui avere le RDA non significa nulla sul formato MARC in sé. Tuttavia, le RDA forniscono le mappature verso MARC 21 ed altri schemi cosicchè la gente possa vedere dove gli elementi dovrebbero andare in ogni schema. La prima release delle RDA avrà soltanto poche mappature (le Appendici D e E per ISBD e MARC 21 in RDA , e possibilmente le mappature di MODS/MADS e Dublin Core come collegamento), ma ci aspettiamo di poter aggiungere di più nel futuro.
 
Oggi la maggior parte dei fornitori di ILS non impiegano MARC 21 internamente, ma solo per l’importazione/esportazione di dati bibliografici e di autorità (qualche volta di posseduti). Finché OCLC e i fornitori di ILS continuano a richiedere questo formato per lo scambio dei dati, esso rimarrà, ma già molti impiegano ONIX XML, MARCXML, e sono in grado di gestire MODS e MADS in XML. L’IFLA sta creando uno schema per gli elementi ISBD in RDF XML, ed è probabile che gli elementi RDA, Resource Description and Access, saranno disponibili anche come schema in XML. La mappatura dei dati in MARC 21 nei futuri schemi XML, come dice Diane, farà sicuramente perdere alcuni dati nel processo di conversione/trasferimento, ma la maggior parte saranno ancora utilizzabili. La struttura MARC 21 ha dei limiti su quali relazioni e collegamenti possono essere fatti.

2. Fino a che punto i fornitori sono incoraggiati a sfruttare meglio le RDA e FRBR?
Diane Hillman: Il mio partner nella consulenza (Jon Phipps) ed io stiamo lavorando individualmente sulle possibilità che molti fornitori possano esplorare le RDA e FRBR. La difficoltà che abbiamo è quella che si estende alla comunità bibliotecaria nel suo complesso: si sente "RDA" e si pensa "regole catalografiche" e "costi aggiuntivi," non necessariamente a "nuove possibilità." Abbiamo bisogno di cambiare questo prima di iniziare a vedere il progresso.
Barbara Tillett: I fornitori di ILS sono stati invitati a seguire le attività del test US RDA nel 2010 e anche le biblioteche americane hanno incoraggiato i fornitori a discutere piani e idee future per sfruttare al meglio le RDA e FRBR. Ognuno di voi può proseguire questi sforzi con i propri fornitori.

3. Le RDA e FRBR sono già insegnati nei programmi di biblioteconomia? Per quanto tempo ancora il MARC sarà insegnato?
Diane Hillman: So che dal trimestre invernale insegnerò ad una classe on-line per l’insegnamento a distanza all’Università di Washington, ma in realtà non so molto su quello che stanno facendo altre scuole. Penso che il MARC continuerà ad essere insegnato nella misura in cui si scambieranno dati MARC, ma forse non nello stesso modo in cui lo stiamo facendo adesso.
Barbara Tillett: FRBR è stato insegnato per quasi un decennio ormai in molte scuole di biblioteconomia (FRBR è apparso nel 1998) e le RDA non sono nemmeno ancora pubblicate, quindi è un po’ presto per insegnarle, ma ci sono molte scuole di biblioteconomia americane che parteciperanno al test US RDA il prossimo anno.
Poiché continuare ad insegnare il MARC 21 è legato ad una parte estremamente importante della storia della catalogazione, mi aspetto quindi che tale insegnamento venga coperto ancora per molto tempo, ma spero che i catalogatori non avranno bisogno di continuare ad imparare a codificare in MARC 21 per troppo a lungo.

4. OCLC Connexion sarà modificato in modo che i catalogatori codifichino gli elementi RDA e FRBR nelle loro registrazioni di catalogo? Esiste al momento un calendario di quando ciò potrebbe accadere?
Diane Hillman: Si potrebbe porre queste domande direttamente a OCLC al Webinar gratuito che sta sponsorizzando per fine mese!
Barbara Tillett: OCLC partecipa anche al test US RDA, quindi sarà presto preparato per questo.

5. Questo studio tiene conto della data di creazione delle registrazioni rispetto alla pubblicazione degli standard fondamentali? A me pare che molti record siano stati creati prima che gli standard più importanti fossero creati.
Barbara Tillett: Punto molto importante! Sembra anche strano che si voglia basare una decisione su quali futuri elementi siano importanti per i nostri utenti in base a come abbiamo fatto le cose nel passato (è per questo che ho chiesto se si stavano programmando studi sull’utente per testare le decisioni di FRBR, che si basavano sulla conoscenza degli studi condotti sull’utente prima del 1998, sulla codifica del catalogatore esperto, e sulle decisioni riguardanti le ISBD). Anche a me non è chiaro perché alcuni campi come il 656 (occupazione) si sia verificato soltanto una volta – quando molte collezioni speciali della LC hanno introdotto questo campo nella maggior parte delle loro registrazioni. Le statistiche del nostro file retrospettivo "BooksAll" per il 2008 mostrano 11.732 occorrenze totali del campo 656 in 6.501 registrazioni della LC, non è chiaro quindi quale fosse l’universo delle registrazioni nel 2005 o quando questo studio sia stato condotto. Speriamo che Bill ci possa illuminare su questo.

6. Uno dei motivi per cui il MARC è così grande risiede nel fatto che è cresciuto nel corso degli anni per adattarsi ai cambiamenti e ai desideri di molte comunità di catalogatori che lo impiegano. Come potrà rispondere a richieste inevitabili di cambiamenti il vocabolario RDA?
Barbara Tillett: Come ho risposto al Webinar, la struttura di governo del Committee of Principals, che sovrintende al lavoro del Joint Steering Committee for Development of RDA (Comitato direttivo misto per lo sviluppo di RDA) e degli editori, sarà cambiata l’anno prossimo, e non è ancora chiaro come gestiremo il coinvolgimento di una partecipazione più internazionale nel futuro sviluppo delle RDA, ma si spera che sia uno strumento web che ci renda maggiormente in grado di interagire. La maggior parte dei vocabolari RDA non sono liste chiuse e destinate ad essere codificate nel corso del tempo come cose nuove che emergono e necessitano di essere descritte, così speriamo che lo strumento web incorpori un meccanismo per inoltrare le modifiche suggerite. In questo momento non so proprio come sarà la prima release per la presentazione delle modifiche.

7. Le RDA saranno più adatte per la catalogazione dei realia rispetto al MARC e alle AACR2?
Barbara Tillett: Spero di sì, ma RDA rimanda anche ad alcune istruzioni speciali, come CCO (Cataloging Cultural Objects) quando le biblioteche avvertono che necessitano di maggiori dati per le loro descrizioni rispetto a quelli che le descrizioni generali di RDA fornirebbero. Ci auguriamo che le istruzioni siano compatibili e che funzioneranno con le comunità speciali per mantenere i principi fondamentali in tutti i nostri standard.

8. Qual è il rapporto tra le RDA e l’ontologia bibliografica?
Barbara Tillett: Che io sappia, nessuno finora, ma sono interessata a lavorare in questo settore. A quanto mi risulta, l’Ontologia Bibliografica (Bibliographic Ontology) è uno sforzo base che Bruce D'Arcus ha avviato, a cui altre persone sono interessate – tra cui Ivan Herman del W3C. Praticamente “Bibo” [abbr. di “Bibliographic Ontology”] mette insieme alcuni vocabolari come DC, FOAF, e qualche altro ancora, e crea un paio di nuovi pezzi di vocabolario per consentire alla gente di codificare le citazioni bibliografiche in RDF.

9. Tre domande per Diane Hillmann: 

  1. In "Why Not MARC" lei parla di sintassi MARC 21 (ad es., ISO 2709) o di un set di elementi? Da notare che il set di elementi MARC può essere modellato anche come RDF/OWL.
    Diane Hillman: Sicuramente della prima, ma anche del secondo. Credo che sia difficile affrontare le due questioni, come questioni completamente separate. Una delle difficoltà è che il MARC è stato progettato per registrazioni piatte, e non si traduce facilmente nel tipo di strutture di dati e di codifiche utilizzate al di fuori delle biblioteche. Abbiamo visto un sacco di tentativi di aggiungere le URL nel MARC, ad esempio, ma non è stata una strategia pienamente riuscita. Ci sono altri limiti (il numero dei sottocampi per etichetta, ad esempio) che tormentano il MARC. Con l’eredità dei dati MARC là fuori, la revisione del set di elementi MARC è un processo difficile, un po’ come sventrare una vecchia casa mentre si continua a viverci dentro (ciò che ho tentato di fare sulla base di una stanza dopo l’altra, pertanto qui non sto proprio speculando!)Io prendo il tuo punto di vista su RDF/OWL, ma non credo che sia una strategia particolarmente soddisfacente, e per quanto possa vedere non c’è molto entusiasmo per questo nella comunità.
  2. Che cosa significa il formato bibliografico del futuro per le istituzioni che NON impiegano le RDA? Il MARC è sempre stato indipendente rispetto ad un particolare codice di catalogazione (anche se originariamente è stato sviluppato e spesso associato con le AACR). Un esempio è CCO (Cataloging Cultural Objects).
    Diane: Penso che non ci sarà mai “un” formato che funzioni per tutti, ma il futuro davvero interessante include l’idea che non ci si debba limitare ad uno solo: possiamo selezionare e scegliere ciò che usiamo a secondo delle nostre necessità. Le biblioteche impiegano già una varietà di formati (e variazioni) ma non hanno ancora affrontato i temi dello scambio dei dati intorno a questa varietà, ciò che invece la strategia degli elementi e dei vocabolari di RDA è progettata per fare. Il CCO non è strettamente un formato bibliografico, naturalmente, ma penso che potrebbe realmente beneficiare del tipo di strategia orientata al futuro che RDA ha adottato (in primo luogo, vocabolari registrati e aperti).
    Barbara Tillett: Questa domanda sembra confondere il formato/schema per la comunicazione dei dati bibliografici con le istruzioni di catalogazione; le istruzioni di catalogazione sono indipendenti da qualsiasi formato di visualizzazione di qualsiasi schema di codifica. Anche i dati esistenti basati sulle AACR2 possono essere codificati diversamente che in MARC. Si possono inserire dati bibliografici secondo le AACR2, le istruzioni CCO, o le RDA nelle registrazioni MARC 21 o in uno schema XML oppure in qualsiasi cosa. Ci saranno sicuramente opportunità per gli sviluppatori di DACS, CCO, DCRM, e altre istruzioni per lavorare con gli sviluppatori delle RDA verso una struttura basata su di unprincipio condiviso e una che condivide lo stesso modello concettuale in modo che nel futuro siano tutte compatibili. Ogni comunità specializzata potrà volere il proprio approccio più granulare per la propria peculiare utenza.
  3. In che modo questo nuovo formato RDA interagirà con i dati dei posseduti nelle biblioteche? Impiegare il MARC per diversi tipi di informazione ci ha consentito di integrare i dati (ad es., bibliografici, di autorità, di posseduti, di classificazione, di informazione riguardante la comunità).
    Diane Hillman: I dati di posseduti sono sempre stati un mio interesse (ho trascorso la mia carriera come bibliotecaria di seriali e come bibliotecaria del diritto). Purtroppo le RDA non gestiscono bene il livello dei posseduti come siamo stati abituati nel MARC. So che l’Extensible Catalog Project ha cercato di indagare questo visto che costruiscono servizi per trasformare l’eredità dei dati MARC in RDA, ma i posseduti sono chiaramente un’area matura per l’attenzione. Penso che le altre categorie dell’informazione che menziona saranno indagate (o stanno per essere indagate) con riferimento al mondo globale dei dati. Suggerirei che la nozione MARC di "famiglia" di standard bibliografici integrati può non essere ideale in un mondo basato su una struttura e su standard di codifica globali. Il nuovo sito web della LC per le LCSH, ad esempio, usa il Simple Knowledge Organisation System (SKOS) per i vocabolari di concetto, come fa OCLC per il suo nuovo livello superiore per la CDD, e il registro NSDL. Le FRAD che si occuperanno dei nomi di autorità stanno andando avanti. Sono sempre stata una fan del Formato MARC per le informazioni riguardanti la comunità, ma purtroppo non è stato molto impiegato. Il problema è che non ha una natura particolarmente "bibliografica", ciò che lascia il futuro un po’ incerto. Mi piacerebbe vederlo "riscoperto" and riconcepito per un mondo web!
    Barbara Tillett: RDA non è un formato. Si tratta di una serie di istruzioni di catalogazione sulle caratteristiche di identificazione delle cose che vogliamo controllare nell’universo bibliografico. Se state ancora usando un ILS quando iniziate a descrivere le cose secondo le RDA, userete ancora registrazioni bibliografiche MARC e registrazioni di posseduti MARC (e registrazioni di autorità MARC) per il prossimo futuro.

 
 
10. Se/come le RDA aumenteranno l’efficienza della catalogazione?
Diane Hillman: Proprio come il formato MARC originale ha accresciuto l’efficienza delle biblioteche nell’ampliare la disponibilità e il riutilizzo delle registrazioni del catalogo, allo stesso modo le RDA, guardando al di là delle biblioteche le opportunità di condivisione dei dati, hanno il potenziale per accrescere ancora una volta l’efficienza delle biblioteche. Penso che abbiamo raggiunto i limiti di ciò che possiamo fare con il MARC e i dati creati quasi interamente dagli esseri umani, e se siamo stati a guardare da vicino per vedere che cosa hanno fatto al di fuori del nostro mondo, possiamo vedere che vi è potenziale per noi sia come fornitori di dati ad altri sia come utenti di dati che altri sono meglio posizionati per fornire. Consideriamo, ad esempio,il Geonames service (https://www.geonames.org/), dove le biblioteche possono facilmente trovare e usare i dati sulle coordinate di latitudine e longitudine per fornire servizi di mappatura piuttosto che le sole stringhe di nome geografico leggibili dall’essere umano e attualmente fornite nei dati MARC. Pensando a come possiamo utilizzare servizi disponibili come questo in un ambiente di dati più moderni, tenuto conto del fatto che ci troviamo tutti di fronte a sfide economiche e alla necessità di ripensare il nostro uso di preziose risorse umane, è ciò che significa veramente il passaggio alle RDA.
Barbara Tillett: I principali benefici che realizzeremo con le RDA arriveranno con lo sviluppo di nuovi sistemi di catalogazione in un sistema basato su FRBR; immaginate di essere in grado di collegare il nome di un creatore alla descrizione che state fornendo per un documento semplicemento puntando alle cose che volete collegare. Immaginate di ricevere la maggior parte dei dati "trascritti" direttamente dall’editore (come facciamo ora con i dati ONIX) e di passare ai suggerimenti forniti dalla macchina per il tipo di contenuto, il tipo di supporto basati su indizi presenti nel documento o di collegare a dati di autorità in un sistema come VIAF in cui basta collegarsi per identificare l’URI per l’entità e non avete da preoccuparvi della forma/struttura del nome (il sistema saprà quale forma volete usare come default da visualizzare per gli utenti, basato sulle vostre preferenze ei dati prioritari distintivi necessari per differenziare un’entità da un’altra); o i suggerimenti forniti dalla macchina per i termini di soggetto e i numeri di classificazione che un essere umano potrebbe confermare o modificare. Immaginate di aggiungere in modo incrementale ad una descrizione bibliografica web globale – non più creando “registrazioni” bibliografiche o di autorità individuali più e più volte da tutte le biblioteche, ma invece aggiungendo dati per identificare ulteriormente e collegare le cose nel nostro universo bibliografico, in cui ognuno ha libero accesso ai dati condivisi, ai dati collegati. Adesso abbiamo la tecnologia per fare tutte queste cose... e allora dove sono i sistemi?