
Qual è il contributo delle Digital Humanities alla Library and Information Science?
La LIS è quella disciplina che sovrintende al ciclo vitale delle risorse, ovvero che stabilisce parametri e pratiche per l’analisi, l’organizzazione, la raccolta e, in generale, la gestione delle risorse bibliografiche e documentali e dei dati descrittivi. Quello che le DH hanno da dare a questo processo, ovvero ad una serie di azioni comuni e condivise fra LIS e DH, è l’aspetto dell’interpretazione. Ovvero le DH possono valorizzare l’esigenza di lavorare sul contenuto di una risorsa culturale per estrarre nuovi concetti e trasformarli in strumenti di accesso alla conoscenza. Entità come persone, luoghi, date, soggetti ed eventi, possono diventare il risultato di atti interpretativi dotati di provenance, ovvero di attribuzione di paternità, anche nel caso della creazione di asserti a base ontologica che riguardano dati descrittivi del patrimonio culturale. Tale processo di attribuzione può venire tipizzato, ma anche documentato, ovvero descritto, come risultato della consultazione di fonti e quindi esito di un approccio critico di impostazione filologica alla descrizione di dati non fattuali, cioè potenzialmente questionabili. Dare spazio, e provenienza, ad atti interpretativi difformi, o anche molteplici, sullo stesso contenuto testuale, può arricchire l’accesso alla conoscenza, che è parziale quando limitato ai soli metadati descrittivi. Nuove domande di ricerca possono nascere da dati strutturati secondo nuovi modelli di rappresentazione, che danno spazio all’interpretazione come arricchimento delle descrizioni tradizionali.
In che modo la lezione appresa dal rapporto fra LIS e DH consente di estendere il ragionamento alla nozione di contesto?
Il contesto è lo strumento che arricchisce il sapere, ovvero anche che traduce il dato e lo trasforma in informazione. Ogni disciplina umanistica trova nel contesto una chiave di lettura degli oggetti che le pertengono, ovvero delle risorse di dominio. Ed è l’archivistica che ci insegna come il contesto, o anche i diversi contesti intesi come diversi elementi di osservazione di un documento, sia lo strumento necessario ad acquisire significato dalle fonti. Soggetto produttore, o anche creator, provenance e vincolo archivistico, o anche posizione del documento in una gerarchia, sono i mezzi di accesso a tale conoscenza. Nei sistemi di descrizione delle risorse digitali questi tre principi diventano fondamentali perché descrivere contenuti digitali significa prima di tutto valorizzare la molteplicità degli attori, ovvero degli agents dotati di un ruolo, che hanno contribuito a creare il documento (o meglio che hanno un qualche grado di relazione con il documento). E tale documento, in qualità di oggetto portatore di contenuto, deve essere inteso nella sua stratificazione per livelli: da un lato avremo l’oggetto analogico, la fonte storicamente consolidata, dall’altra una delle sue potenzialmente molteplici rappresentazioni digitali. Ecco che la provenance di cui sopra dovrà documentare ogni momento della creazione del documento e sarà tanto provenienza della fonte quanto provenienza di una delle sue particolari versioni digitali, ma anche provenienza dell’attore responsabile della descrizione della versione analogica o digitale. La gerarchia ci invita invece al ragionamento sulla nuova struttura dati che il Web ci impone: non più l’albero ma il grafo. Non più una tassonomia, ma un thesaurus. Non più solo relazioni gerarchiche, ma relazioni trasversali. Non più una navigazione per livelli padre/figlio ma per concetti correlati, temi associati, contenuti interconnessi in forma orizzontale e diagonale, oltre il canonico approccio verticale dell’albero. Il network, come strumento di organizzazione, espande i contesti, produce nuovi interrogativi e solleva nuovi quesiti, restituendo all’utente finale una conoscenza come ibridazione di dati provenienti, potenzialmente, da istituzioni ed enti diversi.
Come può essere realizzata, in un contesto digitale, la descrizione delle fonti?
Il digitale solleva quindi problemi nuovi nella descrizione, perché impone una riflessione, ovvero obbliga a chiedersi: che cosa sto descrivendo? Già il framework per la descrizione di risorse bibliografiche FRBR, ci ricorda che abbiamo a che fare con almeno 4 livelli di descrizione: l’opera, ovvero l’idea che sta a fondamento dell’oggetto, l’espressione, ovvero il contenuto dell’opera, la manifestazione, ovvero una versione dell’espressione, e quindi l’item, l’oggetto specifico. Nel digitale queste quattro lenti di osservazioni diventano lo strumento principale di riflessione perché gli standard di descrizione archivistica, bibliografica e museale, devono ripensarsi rispetto al livello a cui la descrizione si riferisce. Ecco che un item digitale, conservato in un certo istituto è una possibile manifestazione, cioè una certa versione digitale, di un contenuto rappresentato dalla sua espressione, che deriva da un’opera. Nel digitale l’idea di entità complessa e stratificata rende la descrizione delle risorse culturali ancora più strutturata perché multilivello. Ecco che la descrizione di una fonte analogica si trova a dover dialogare con una molteplicità di fonti digitali, ciascuna dotata di una sua specificità di formato, supporto, dimensione e tipo.
Che rilevanza assumono, in tale prospettiva, i Linked Open Data?
Quello a cui abbiamo fatto fino ad ora riferimento (asserti e provenance, contesti, livelli di descrizione diversi dello stesso oggetto) si sposano perfettamente con il tema dei Linked Open Data (LOD), lo strumento di realizzazione del Web semantico. Triple come asserti dotati di un soggetto, un predicato e un oggetto, diventano il nuovo modo di gestire la descrizione delle fonti. Diremo che i LOD rappresentano un nuovo strumento di corredo, un modo nuovo per organizzare le informazioni descrittive di oggetti, o meglio di things, di cose del mondo reale, nella forma di entità. Ragionare per livelli, ovvero riconoscere il tema della stratificazione della descrizione, e dare valore ai contesti significa produrre dati interconnessi e aperti, o anche Linked Open Data, capaci di garantire la FAIRness (ovvero la Findability, Accessibility, Interoperability, Reuse) di dati ricchi e semanticamente espressivi. Quello che i LOD dovrebbero consentire è di arricchire i dati di ogni istituzione produttrice attraverso dati prodotti da altri enti e istituzioni e per un qualche motivo correlati, agevolando così il dialogo nel cosiddetto MAB (Musei, Archivi e Biblioteche), tipicamente caratterizzato dall’impiego di standard descrittivi difformi ed eterogenei.
Valorizzare le risorse culturali descrivendole attraverso il sistema dei Linked Open Data significa anche creare nuovi sistemi di accesso al contenuto delle risorse così espresse. Le nuove prospettive si muovono nella direzione del superamento del canonico approccio per stringhe di caratteri nella forma di indici di parole (luoghi, persone, soggetti, oggetti), per favorire la creazione di nuovi sistemi visuali di organizzazione dei dati. Questo è quanto ci si aspetta dalle applicazioni che usano i LOD per consentire l’accesso dell’utenza ai dati del patrimonio culturale. Nuove viste sulle triple aumentano la user experience: mappe con geolocalizzazione per i luoghi, linee temporali per navigare informazioni storiche, grafi per mostrare relazioni, torte e istogrammi per riportare dati statistici sono solo alcuni esempi delle nuove frontiere della data visualization, ovvero anche della costruzione di data stories.
Come si inserisce il tema del lavoro a progetto nel più ampio dibattito sulla gestione del ciclo vitale degli oggetti culturali?
Una delle specificità delle Digital Humanities è il fatto che tipicamente la ricerca di settore è finalizzata alla realizzazione di un progetto che porta alla realizzazione di un prodotto. Che si parli di edizione digitale di un testo o della sua tradizione, di una collezione di risorse o di un repertorio di oggetti, certamente un progetto di Digital Humanities vuole risolvere un bisogno di ricerca partendo dai dati e dall’esigenza di rappresentarli computazionalmente, in modo cioè che restituiscano conoscenza. Potremmo dire che lavorare a progetto significa sovrintendere al ciclo vitale delle risorse culturali perché tale azione richiede la presa di coscienza dell’esistenza di un workflow di progetto: la selezione delle risorse più adeguate a rispondere un certo bisogno di ricerca, la produzione (o acquisizione digitale) di contenuti, la descrizione di oggetti potenzialmente eterogenei per formato e tipo, la gestione, che è legata al tipo di trattamento che si vuole operare, la preservazione di quei contenuti digitali, e ancora la disseminazione, tipicamente Web-based, e quindi l’uso, cioè la fruizione, di tali oggetti digitali, ma anche il loro riuso, auspicabilmente anche in contesti diversi da quello nativo. Questo significa necessità di una sempre maggior integrazione fra i dati degli istituti culturali, obiettivo che solo nuove figure professionali di esperti in organizzazione, rappresentazione e gestione digitale di dati, informazione e conoscenza nel contesto del patrimonio culturale possono governare. Il futuro del Digital Humanist.
Francesca Tomasi insegna Digital Humanities all’Università di Bologna, dove è coordinatrice del corso di laurea magistrale internazionale in ‘Digital Humanities and Digital Knowledge’ e Direttrice del ‘Digital Humanities Advanced Research Center’. Si occupa si sistemi di organizzazione della conoscenza nel circuito di archivi, biblioteche e musei e di modellazione concettuale in particolare nel contesto delle edizioni digitali semantiche. È stata infine Presidente dell’Associazione Italiana per l’Informatica Umanistica e la Cultura Digitale.