Ripercorrendo il processo di edizione digitale del Codice Pelavicino, si intende
ragionare sugli strumenti di consultazione e di corredo che possono offrire questo tipo
di edizioni e sulle problematiche connesse in termini di codifica, visualizzazione,
facilità d’uso, rapporto con l’utenza. Il contributo rielabora di quanto presentato al
webinar Fonti archivistiche medievali nel digitale. La sfida di trattare e
visualizzare dati semi-strutturati
, organizzato il 22-23 giugno 2020 dal
Laboratorio di Cultura Digitale (Università di Pisa) e dal responsabile del
progetto Engineering Historical Memory e allo scopo di promuovere future
iniziative di collaborazione e sperimentazione nel campo dell’elaborazione ed estrazione
di informazioni da edizioni semi-strutturate di documenti archivistici.
The paper presents the potential means of utilizing digital edition tools by retracing the process of the Codice Pelavicino digital edition. We will also explore the related issues of coding, output, easiness of use, relationship with users. The paper presents the reworking of a lecture presented at the webinar “Medieval archival sources in digital environment. The challenge of processing and visualizing semi-structured data ", organized on 22-23 June 2020 by the Digital Culture Laboratory (University of Pisa) and by the head of the Engineering Historical Memory project. The aim is to promote future collaboration and experimentation initiatives in the field of processing and extraction of information from semi-structured editions of archival documents.
C’era una volta, tanto tempo fa, l’edizione scientifica cartacea delle fonti scritte.
Ovviamente ogni edizione aveva caratteristiche sue proprie, date dall’essere fonte
prettamente letteraria o documentaria, di ambito filosofico o religioso, dotata o priva
di stemma codicum. Ma in quella lontana epoca esistevano per le edizioni
scientifiche una serie di criteri e linee guida, condivise tra i diversi gruppi di
ricerca, relativi al modo in cui si doveva o poteva operare nel processo di
trascrizione, annotazione e pubblicazione del testo, ai quali si aggiungevano alcune
pratiche comuni nella redazione degli strumenti di corredo: indice dei nomi e dei
luoghi, talvolta l’indice delle cose notevoli
, tavole di corrispondenze, ecc. Era
possibile ovviamente scegliere che cosa aggiungere al quadro di queste informazioni
ritenute necessarie, ma le opzioni erano limitate proprio dal supporto cartaceo stesso e
solo in seconda istanza dagli interessi specifici dell’editore. In particolare,
limitatamente all’edizione dei documenti medievali (chartae, notitiae,
instrumenta) i diplomatisti avevano redatto norme e raccomandazioni che sono
poi state condivise e applicate - pur con distinguo e lievi modifiche - dalla più ampia
comunità scientifica dei medievisti.
Si trattava di un mondo più semplice e lineare di quello che oggi ci fanno vivere gli
strumenti e le innovazioni metodologiche delle digital humanities utilizzabili
per pubblicare le fonti storiche nell’immenso metaspazio del web, nel bene - in termini
di opportunità - e nel male - per quanto riguarda moltiplicazione dei problemi. Possiamo
infatti ora dire, e a ragion veduta, che la rivoluzione digitale
non ha portato a
una semplice digitalizzazione della tradizione
, ma che anzi ha cambiato e sta
cambiando profondamente il modo di lavorare dello storico / filologo / diplomatista
impegnato nell’edizione e studio delle fonti della sua ricerca.
Il presente contributo intende ragionare su un ambito specifico di questo cambiamento, ossia sul fatto che i metodi e gli strumenti oggi disponibili consentono - in teoria - di estrarre dalle fonti in maniera automatica o semi-automatica molti più dati rispetto a una tradizionale edizione analogica, ma questo comporta precise scelte editoriali e metodologiche gravide di conseguenze, che devono considerare contemporaneamente più fattori: la complessità della codifica, l’usabilità dell’interfaccia di consultazione, l’accesso a eventuali basi di dati, la leggibilità complessiva dell’edizione da parte di un pubblico di esperti e di non esperti, il rapporto tra edizione chiusa e in progress ( ). Tali aspetti vengono qui esaminati estrapolandoli dall’esperienza su un caso concreto: l’edizione digitale del Codice Pelavicino, un manoscritto della fine del XIII secolo contenente la copia di centinaia di instrumenta, fondamentale per ricostruire la storia della diocesi di Luni.
Il progetto dell’edizione scientifica digitale del Codice Pelavicino ha ormai 6 anni d’età. Le motivazioni e le aspettative dei primordi - l’iniziativa è del 2014 - oggi sono profondamente cambiate: via via che il lavoro procedeva è infatti cresciuta nei curatori la consapevolezza dei problemi e delle potenzialità dell’edizione digitale che stavano allestendo e sono aumentati i desiderata: alcuni emersi dal lavoro stesso di codifica, altri dalle relazioni con il gruppo di lavoro, altri ancora dai contatti con la comunità scientifica di riferimento e con il pubblico. Esaminare le fasi di questo cambiamento, crediamo possa costituire un esercizio estremamente utile per estrapolare considerazioni di carattere generale riguardanti i progetti di edizione digitale di una fonte storica, guardando in particolare ai diversi pubblici di riferimento.
in corso
L'unica edizione a stampa del Codice Pelavicino risale al 1912 ( ): contiene diversi errori, omette larghe parti del testo e non è certamente in
linea con gli attuali criteri di edizione critica di una fonte medievale. Negli anni ‘40
del XX secolo l’Istituto Storico Italiano per il Medioevo chiese a Geo Pistarino di
procedere con una nuova edizione del Codice, ma il lavoro si trascinò per anni senza
concludersi ( ). Nel 2014 proposi al Capitolo della
cattedrale di Sarzana con il supporto dell'Accademia "G. Capellini" il passaggio a
un'edizione digitale basata su immagini e in progress, da attuarsi per mezzo
del software open source EVT tramite codifica della trascrizione, con accesso
all'immagine digitale del codice, al testo, all'apparato critico e agli strumenti di
corredo ( ). Il lavoro, condotto per
6 anni da un’équipe di lavoro interdisciplinare guidata dalla sottoscritta si è
chiuso
- limitatamente a quanto concerne l’edizione di tutti i 529 documenti
del codice - nel 2020 ( ).
Nel 2014, nello spiegare ai committenti la bontà della proposta, motivammo il passaggio
al digitale puntando soprattutto su ragioni pratiche: insistemmo sul fatto che
l'edizione basata su immagini consentiva l’accesso in sicurezza a una fonte che, per
unicità e preziosità, non poteva essere resa comunemente consultabile; inoltre l'accesso
simultaneo all'immagine facsimile e alla trascrizione, oltre che al regesto e
alle note al testo, avrebbe permesso al lettore un controllo diretto e puntuale sul
lavoro fatto dagli editori e quindi una trasparenza, nel processo di edizione, che la
pubblicazione tradizionale impediva. La seconda ragione che adducemmo era invece
relativa alle tempistiche di edizione. Gli studiosi della Lunigiana medievale
aspettavano da lungo tempo una nuova edizione che però - se condotta nel modo
tradizionale - era assai difficile da programmare. La scelta del digitale avrebbe invece
consentito un’edizione parziale e progressiva dei documenti del Codice, in modo da
fornire il testo in tranche successive. Ricordiamo infatti che il contenuto del
manoscritto non è unitario, ma costituito in gran parte dalla la copia tardo duecentesca
di 529 documenti. L’essere in progress, lungi dal costituire un fattore
negativo e squalificante, avrebbe quindi avuto un duplice e benefico effetto di fornire
rapidamente agli studiosi materiale di loro interesse e contemporaneamente incentivare
gli stessi editori a proseguire il lungo processo di trascrizione e codifica. Un terzo
beneficio - non previsto agli esordi - è derivato dal fatto che proprio la comunicazione
periodica degli obiettivi parziali ha sollecitato il coinvolgimento di altri
ricercatori, accademici e appassionati, che hanno reso il progetto in sé una materia
viva, un’edizione fertile
, come si cercherà di spiegare nella parte finale di
questo articolo.
Per quanto riguarda i criteri e i metodi di edizione agli inizi le idee erano confuse,
in parte anche per il background stesso dei responsabili dell’edizione, in
parte tradizionale
, in parte informatica umanistica
, con ancora scarsa
esperienza nel dialogo reciproco. Intendevamo da un lato appoggiarci ai criteri di
edizione scientifica delle fonti documentarie sopra citati, pur modificati dalla scelta
del supporto, dall’altro procedere a una codifica del testo in XML secondo le linee
guida della TEI P5 e utilizzare uno strumento di edizione che prevedesse la
consultazione contemporanea dell’immagine del manoscritto, della trascrizione del testo,
dell’apparato critico e delle note, oltre che l'accesso a strumenti di corredo
tradizionali.
Per l’edizione basata su immagini (image based edition) si è deciso di usare EVT, un software open source, nato per la visualizzazione Vercelli Book, ma sviluppato per diventare uno strumento adattabile a diversi progetti. L’edizione è stata però affiancata anche da un sito in Wordpress che presenta testi sulla storia e descrizione del codice, sulle peculiarità delle scelte editoriali, sul gruppo di lavoro e su materiali di corredo, in analogia con quanto accadeva nel cartaceo, di norma dotato di una corposa introduzione iniziale e di tabelle in appendice.
EVT, usato qui nella versione 1.3 (attualmente si sta lavorando alla 3), presentava
infatti alcune caratteristiche molto interessanti. In primo luogo, consentiva di
lavorare sui dati indipendentemente dalle funzionalità fornite dal software per
la loro visualizzazione. In parole povere potevamo concentrarci sulla codifica a
prescindere dall’esito finale: la visualizzazione sarebbe infatti stata poi
personalizzata attraverso fogli di stile CSS. Altro grande pregio riguardava
l’aggiornamento: una volta configurato e inserito il materiale nelle cartelle
appropriate, il lancio
di uno script predisposto consentiva a EVT di
produrre l’edizione in maniera automatica. L’aggiornamento continuo dell’edizione
diventava così un’operazione semplice e ripetibile alla bisogna. Last but not
least EVT 1.3 presentava un ambiente di navigazione estremamente intuitivo per
l’utente finale, facile da usare, con un layout chiaro e una gestione efficace
dello spazio disponibile.
Una volta iniziato e predisposto il flusso di lavoro che portava dalla trascrizione
alla codifica, dalla validazione e controllo dell’XML alla pubblicazione, ci siamo
immediatamente resi conto che era possibile arricchire l’edizione tradizionale
con funzionalità nuove. Ad esempio, alla consueta codifica di nomi propri
(antroponimi e toponimi) e date - che oggi nel campo delle DH sono dette Named
Entities - aggiungemmo i mestieri (in realtà voce che comprende anche titoli
come nobilis e uffici come castaldus) e le monete, ma senza
prevedere un trattamento particolare per queste voci. Antroponimi, toponimi e date
(dei documenti) andavano a confluire in apposite liste di consultazione (indici),
mentre tutte le altre entità
, compresi i mestieri e le monete, venivano
evidenziate nel testo con colori diversi per facilitare al lettore l’individuazione e
la lettura. In sostanza la codifica serviva - e serve ancora - solo per aiutare
l’utente nella lettura del singolo documento.
Un altro elemento da noi sottoposto a una codifica peculiare riguardò i signa dei notai redattori o autenticatori, al fine di valorizzare una delle ricchezze del Codice, la riproduzione di decine e decine di signa tabellionum. In questo caso, tuttavia, non riuscimmo a trovare una soluzione totalmente interna a EVT che consentisse una consultazione utile. Su EVT venne semplicemente creato un collegamento che, unendo fra di loro i tag che identificano i signa (<ptr/>) e le riproduzioni dei simboli notarili presenti nelle carte del manoscritto, permetteva una corrispondenza di tipo hot spot, in modo da mostrare il signum ed eventuali informazioni aggiuntive.
In aggiunta venne deciso anche di sviluppare, sul sito, una pagina HTML con l’indice di tutti i notai e i rispettivi signa, in modo da fornire agli utenti un ulteriore strumento per la consultazione. Attraverso le regole di trasformazione XSLT, applicate alla lista XML delle persone e dei signa, è stato possibile creare un unico documento da poter integrare nel tema Wordpress del sito web ( ) che desse conto del nome del notaio, di quanto si conosceva del suo periodo di attività e dei signa che lo caratterizzano nel codice.
Come è facilmente intuibile, la soluzione adottata per i signa, aveva già
fatto emergere fin dal 2014 il nodo relativo al trattamento dei dati presenti nel
Codice. Per i notai, infatti, si era reso necessario separare l’area dell’edizione
vera e propria
dotata di alcuni strumenti di corredo (EVT), dall’area in
cui alcuni dati codificati potevano essere trattati in maniera diversa (il sito).
Precisiamo che la soluzione individuata ci appare oggi ancora valida e funzionale -
dato che è possibile visualizzare in maniera semplice i simboli / disegni usati nei
signa e la loro datazione, ma anche lontana dall’essere ottimale, in
quanto non consente di estrapolare in maniera automatica i dati. In sostanza il
ricercatore non ha a disposizione un’interfaccia per scoprire quali notai abbiano
rogato in un delta temporale o quali qualifiche esprimano nell’escatocollo al variare
degli anni o ancora per distinguere - sempre in maniera automatica - tra notai
roganti e notai autenticanti.
Il problema si è riproposto, più o meno nei soliti termini, per altri aspetti, essenziali alla ricerca storica, che emergevano a mano a mano che l’edizione avanzava.
Per le date, ad esempio, è stato predisposto un indice cronologico ascendente e discendente, che però è agganciato al solo tag <docDate>, ossia alla data topica e cronica di ogni singolo documento, e non alle altre date presenti all’interno dei singoli testi. Questa limitazione sottrae di fatto al lettore una parte importante dell’informazione, quali ad esempio la citazione interna di documenti anteriori o, come è già stato rivelato da uno studio specifico, la presenza di autenticazioni e soprattutto di passaggi in mundum da scheda notarile attuati in date e in periodi peculiari ( ). In un primo momento si è pensato di trattare questi eventi allo stesso modo delle named entities, ossia creando una nuova lista nell’intestazione del file principale e utilizzando l’elemento <listEvent>, che permetteva di definire un elenco di descrizioni su tipologie di eventi. Purtroppo, questa soluzione, considerate le caratteristiche dei documenti e il tipo di eventi da trattare, non è stata percorribile per le difficoltà incontrate nel definire un’ontologia di eventi: in alcuni casi la tipologia è infatti chiara, in altri invece è problematica, in altri ancora estremamente difficile, al punto da costringere l’editore a una vera e propria forzatura del testo.
Per ovviare al problema abbiamo distinto gli eventi tra quelli che avevano una data chiaramente espressa e quelli che potevano essere datati da elementi relativi interni e poi abbiamo descritto le caratteristiche dell'evento entro un semplice tag <note>, messo in relazione con il tag <date>. Per quanto riguarda gli eventi riconoscibili nei passaggi in mundum e nelle autentiche, nonostante la codifica non prevedesse la marcatura delle diverse parti del documento, abbiamo deciso di dare una <div> specifica alla parte dell’escatocollo contente tali eventi, in modo da poterli poi efficacemente pubblicare in modo automatico, nel sito dell’edizione, da un plugin di Wordpress (TimelineJS) per la creazione di timeline.
Nella timeline del Codice Pelavicino è così possibile consultare i diversi
eventi espressi nel manoscritto - ovviamente se correttamente marcati -, evidenziando
anche la tipologia dell’evento di appartenenza tra documento
, mundum
,
autentica
ed evento
generico ( ). La
navigazione in questa freccia del tempo negli eventi, e soprattutto nelle diverse
tradizioni del documento, può diventare uno strumento ermeneutico per l'editore e
rappresentare un servizio aggiuntivo che solo l'edizione digitale può offrire al suo
pubblico specialistico. Anche in questo caso, però, come per i notai, la separazione
dello strumento di corredo dall’edizione al sito è stata necessaria, per consentire
una consultazione altrimenti impossibile o estremamente complicata interna a EVT.
Analogamente avvertiamo che non è possibile ricercare ed elaborare in tempo reale i
dati marcati, come, ad esempio, recuperare in forma tabellare i documenti che hanno
avuto un passaggio in mundum a più di 10 anni dalla redazione del documento
originale o quali documenti sono stati autenticati dopo la morte di Federico II.
Va da sé che il problema si sta replicando, mutatis mutandis, per molti altri elementi del testo che vorremmo valorizzare e rendere fruibili al lettore - l’appetito vien mangiando -, alcuni già marcati (come mestieri e monete), altri ancora da marcare, come ad esempio i censi.
I mestieri, per ora codificati con un semplice <roleName> ed evidenziabili in indaco nella lettura su EVT, potrebbero ad esempio essere gestiti all’interno di un glossario terminologico, la cui creazione è in fase sperimentale, ma che - di nuovo - ha trovato una sua prima collocazione entro il sito, e non in EVT.
Per la codifica delle monete è stato adattato il tag TEI <measure>, genericamente usato per qualsiasi unità di misura e per i quali sono previsti tre eventuali attributi: @type, nel nostro caso utilizzato per descrivere l’autorità emittente / tipologia (imperiales, Ianuenses, Parmense ecc.), @quantity, che contiene la quantità espressa in cifre arabe e @unit, che informa circa il nominale nelle cinque possibili casistiche riscontrate: denarius, solidus, mezanus, marca e libra. Anche in questo caso la marcatura attualmente consente solo di evidenziare la moneta e di restituirne le caratteristiche in pop up in maniera standardizzata.
Si tratta, com'è evidente dalla , di un servizio utile alla lettura, ma totalmente ininfluente a livello di trattamento dei dati, in quanto non è attualmente possibile sapere ad esempio, quale fosse l’ammontare medio di un canone per abitazione o per terreno agricolo col variare del tempo, e nemmeno avere un dato numerico accorpato per pagamenti fatti con nominali diversi. Tuttavia, i dati dei pagamenti (in particolare vendite e canoni) - come si intuisce dall’esempio proposto - presentano già una forma semi-strutturata. Le liste di censi, ad esempio, abbondanti nel codice, presentano dati più o meno costanti: il nome dei locatari (con varie denominazioni relativamente alla condizione e all’epoca), la posizione / nome del podere / tenuta / bene, l’ammontare del censo in natura, in moneta o misto. La caratteristica semi-strutturata di questi dati emerge dalla stessa scrittura delle liste nel codice, in quanto talvolta sono trascritte in forma tabellare oppure è evidente che erano espresse in forma tabellare nell’antigrafo.
Il problema a questo punto è aperto. Che si tratti di dati fondamentali per lo studio della Lunigiana medievale è palese. Altrettanto evidente è che, proprio la loro natura di dati semi-strutturati li renderebbe idonei a un trattamento che consenta la loro elaborazione in database con possibilità di valutare in termini numerici costi, valute, quantità, misure.
Ma quale soluzione adottare? La scelta iniziale - uno dei pregi di EVT - di operare
la codifica del testo senza pensare alla visualizzazione del dato è una strada ancora
percorribile? O si deve pensare a una codifica personalizzata
e finalizzata
appunto a rendere i dati computabili? Si deve pensare a un output interno
all’edizione o è meglio mantenere questi servizi di query sul sito, al di
fuori dall’edizione vera e propria? E ancora cosa marcare? Solo i dati che presentano
caratteristiche idonee a un simile trattamento (censi) o anche contenuti più
scomposti (transazioni in moneta)?
Sono domande che richiedono indubbiamente una risposta tecnica, un software idoneo e
una scelta di codifica che restituiscano al lettore ricercatore quanto desidera nella
collocazione più appropriata. Ma a monte spingono questioni che toccano problematiche
più ampie riguardanti il significato e l’utilità dell’edizione di una fonte storica,
i ruoli e le competenze degli editori, il differente approccio al testo tra filologi
e storici ( ) e il pubblico che si vuole raggiungere.
Personalmente ritengo che, per individuare possibili risposte, sia indispensabile
tenere in maggior considerazione l’ultimo fattore che era certamente ritenuto
secondario nelle edizioni cartacee tradizionali: il pubblico, anzi i
pubblici.
Sappiamo perfettamente che l’edizione di una fonte storica di qualsiasi genere può interessare diverse categorie di utenti e se avviene sul Web l’accesso è teoricamente universale. Sappiamo altrettanto bene però che tale universalità è limitata da diversi fattori quali il digital divide, la lingua, la complessità dei contenuti proposti, l’interfaccia di navigazione.
In molti casi, l’operazione culturale che soggiace all’edizione digitale di una fonte
o di un corpus di fonti tende a diventare autoreferenziale e di conseguenza
povera di pubblico. Sovente è infatti spesso lo stesso editore ricercatore (o il
gruppo di ricerca) che, conoscendo perfettamente la sua fonte, crea un ambiente di
consultazione unico, specifico e complesso, che risulta di conseguenza anche elitario
e chiuso. Spesso in questa tipologia di edizioni le possibilità di ricerca interna
sono estremamente raffinate e di altissima qualità, ma restituiscono risultati
interessanti solo per pochi, con interfacce di navigazione complesse, che necessitano
una formazione propedeutica. Da un altro punto di vista, un’edizione troppo
semplice
, dotata di pochi, essenziali, strumenti di corredo, restituisce
agli studiosi - come abbiamo visto - solo una minima parte dei contenuti che in
realtà il testo potrebbe dare.
Senza arrivare a una progettazione completamente centrata sull'utente (UCD, User Centered Design), credo che porsi il problema delle principali categorie di utenza a cui l’edizione si rivolge o si potrebbe potenzialmente rivolgere, risulterebbe estremamente per cercare una o più soluzioni alle domande prima enucleate.
Sempre partendo come esempio dal Codice Pelavicino proviamo quindi a disegnare tre tipologie plausibili di utenti: l’appassionato di storia locale (ma anche insegnanti di scuola), lo storico di professione, il ricercatore di altre discipline umanistiche.
Il primo utente mediamente non conosce il latino, ma non ne è nemmeno spaventato al
punto da non avvicinarsi alla trascrizione di un documento medievale: gli interessa
la storia locale, quella dei posti dove vive, e quindi è abituato a leggere saggi
storici di diverso livello qualitativo, oltre alle mappe, storiche o contemporanee
che siano. L’edizione digitale del Codice Pelavicino si è rivolta a questa tipologia
di utenti fin dall’inizio e l’ha raggiunta con discreto successo grazie, in primo
luogo, all’interfaccia di EVT e, in secondo, alla promozione dell’iniziativa su
diversi canali comunicativi. Nel software di edizione la navigazione tra i
documenti è possibile da più punti di accesso: la carta, il singolo documento, gli
indici e il motore di ricerca per stringa di caratteri. Il passaggio dall’apparato
critico in italiano (data, regesto, edizioni, note) alla trascrizione in latino con
note al testo è semplice e la navigazione è facilitata dall’organizzazione intuitiva
e razionale degli spazi, oltre che dalla possibilità di evidenziare alcune named
entities. Questa semplicità
di fondo è centrale e non deve essere
sacrificata a favore dell’ampliamento eccessivo delle tipologie di esplorazione.
Nell'equilibrio sempre delicato tra possibilità di ricerca e complessità della
maschera, la scelta deve a mio avviso sempre prediligere la semplicità e
l’intuitività della navigazione.
Il coinvolgimento degli appassionati di storia locale è stato raggiunto - come accennato - anche tramite altre modalità: la costruzione del sito come un blog, con pubblicazione periodica delle novità inviate anche tramite newsletter e l’invito ben formulato, nel sito stesso, a partecipare all’edizione. Lungi da diventare indice di debolezza scientifica o di imprecisione degli editori, l’aggiornamento tramite blog / newsletter non solo sui progressi fatti, ma anche e soprattutto sui problemi incontrati nella codifica, sui dubbi di lettura e sulla necessità di un controllo, ha di fatto coinvolto il pubblico dei non addetti ai lavori a livelli non prevedibili. Attualmente la casella di posta elettronica in cui sono stati immagazzinati i commenti del pubblico ammonta a circa 500 unità.
In un secondo tempo, abbiamo provato ad allargare ulteriormente la platea degli
utenti ricorrendo a Facebook, social ritenuto idoneo perché frequentato per di più da
ultraquarantenni e perché vi si trovano gruppi interessati alla storia della
Lunigiana. Su questi gruppi sono state quindi postate
comunicazioni generiche,
come l'annuncio della pubblicazione di nuovi documenti, e specifiche, quali richieste
d'aiuto per l'individuazione di termini e toponimi. La risposta del pubblico è stata
estremamente positiva: da un lato i contributi raccolti sono risultati mediamente di
ottimo livello e hanno portato miglioramenti all'edizione, dall'altro l'edizione in
sé è stata oggetto di scambi autonomi e di discussione all'interno del social,
portando di fatto alla promozione e alla disseminazione del prodotto culturale.
L'insieme di questa attività di comunicazione, che combina la semplicità dell'interfaccia utente, in EVT e sul sito, con diversi canali di comunicazione, di fatto configura il Codice Pelavicino Edizione Digitale come un progetto di digital public history, in quanto presenta un prodotto culturale legato alla nostra storia, pensato appositamente per favorire la partecipazione attiva del pubblico ( ; ; ). Comporta tuttavia anche conseguenze di non poco conto: i lettori partecipano, ma solo a patto di ricevere una qualsivoglia ricompensa, nel nostro caso attenzione, considerazione, rispetto. Questo si traduce, nel concreto, in un notevole aggravio del lavoro di edizione, in parte dedicato a considerare tutte le osservazioni, rispondere, correggere o implementare l’edizione grazie ai suggerimenti pervenuti, riconoscendo contemporaneamente la paternità del suggerimento. Se si guarda ad esempio ai toponimi, solo l’interazione con questo tipo di pubblico ha permesso di individuare la posizione del 30% dei micro-toponimi attestati, a fronte ovviamente di un’opera continua di interazione, controllo e correzione. Un lavoro che, se continuerà negli anni futuri, tenderà a trasformare il Codice Pelavicino in una never ending edition, sempre aggiornata, ma anche costantemente fluida .
La seconda tipologia di utente a cui conviene pensare, relativamente al Codice Pelavicino, è lo storico, che - come già ampiamente spiegato nel corpo dell’articolo - è interessato a estrarre dati dalla fonte e contemporaneamente vederli nel loro contesto. Di fronte al Codice Pelavicino il medievista si porrà quindi domande tutte caratterizzate dalla variabile temporale con oggetti diversi. Prendendo ad esempio le liste dei censi, che elencano dati già semi-strutturati, un loro trattamento potrebbe poterci dire a quanto ammontavano le rendite dei beni vescovili e come erano distribuite, quali erano i luoghi e le date di raccolta dei censi, quale era il valore medio degli affitti dei terreni a uso agricolo nelle vicinanze di un luogo e qual era il rapporto tra censo in moneta e censo in natura .
È chiaro che queste fonti sono interessanti soprattutto per indagini di tipo economico-insediativo, ma si potrebbero ovviamente valutare anche altri aspetti, come la percentuale di eredi di un locatario defunto rispetto alla presenza di tenutari e tenutarie espressamente nominati. Uno storico del paesaggio riterrebbe inoltre di estrema utilità che i toponimi fossero categorizzati per categorie (idro-, geo-, fito-, zoo-, antro-, agio- toponimi, nomi relativi all’uso del suolo, alle attività produttive e alle forme di popolamento e alla viabilità) e geo-referenziati in modo da poterli visualizzare in mappa, magari anche in layer sovrapponibili.
La risposta alla ineludibile moltiplicazione delle domande credo debba essere duplice: da un lato l’assunzione di responsabilità dell’editore, dall’altro l’apertura dei dati.
Riguardo alla prima istanza credo che chi cura l’edizione scientifica digitale di una fonte e che quindi ne conosce bene struttura e potenzialità debba, banalmente, scegliere quali funzioni di ricerca mettere a disposizione tra quelle più promettenti, anche e soprattutto in relazione alla trattabilità dei dati. Di fronte alla grande varietà delle possibilità di ricerca credo che si debba innanzitutto abbandonare da subito, concettualmente, la possibilità di accontentare tutte le esigenze.
Una simile scelta è stata fatta ad esempio da Andrea Nanetti ( ) per l’edizione del privilegio Religiosam vitam di papa Gregorio X per il Monte Sinai (1274) collocato in uno spazio partizionato e interattivo che consente di leggere il documento dai punti di vista dello storico e del diplomatista, esplorare con un video e un grafico ad albero il suo tenor formularis; consultare diritti e patrimonio del monastero con servizi di localizzazione e visualizzazione di voci di Wikipedia. Si tratta di un rilevante numero di servizi, che non ha alcuna pretesa di essere esaustivo e che però appare idoneo a trattare un solo documento alla volta, almeno nella formula della image based edition.
La scelta dei servizi deve poi avvenire - come già sottolineato - preservando il più possibile la semplicità e l’intuitività della navigazione. Questa esigenza ha per ora prodotto nel Codice Pelavicino lo sdoppiamento dei luoghi di pubblicazione; strada scelta anche per l’edizione critica digitale collaborativa dei documenti dell’abbazia di S. Maria della Grotta (da qui SMG) che attualmente consta di tre versioni: l’edizione digitale nativa su monasterium.net; il PDF dei soli testi, generati con una trasformazione dedicata; l’edizione cartacea in open access .
La problematica più rilevante di queste scelte polimorfe non risiede nell’apparente
confusione dei piani - basta infatti una buona strutturazione delle informazioni
nella pagina principale dell’edizione per ovviare all’impasse - ma nel fatto
che il continuo (inevitabile e anche auspicabile) aggiornamento dell’edizione debba
portare ad una modifica in tempo reale e contemporanea di tutte le sue
manifestazioni
. In ogni caso rileviamo come le edizioni del Codice
Pelavicino e di SMG non presentino attualmente strumenti di ricerca dei dati
semi-strutturati.
L’apertura dei dati sembra, infine, essere l’unica risposta logica alla moltiplicazione delle domande che potrebbe porre uno storico e, con lui, la terza categoria di utente, il ricercatore delle scienze umane.
Prendendo sempre come riferimento il Codice Pelavicino, un linguista troverebbe più interessante analizzare statisticamente l’uso dei termini che indicano le diverse tipologie di censi, le misure delle merci, le monete in relazione alle forme antroponimiche o ancora la traccia di espressioni volgari o l’uso di lettere per produrre particolari fonemi. Un diplomatista troverà invece manchevole il fatto che i 529 documenti del codice non siano classificati per tipologia (lista di censo, memoria, diploma, instrumentum venditionis ecc.) e che la loro struttura interna (protocollo, testo ed escatocollo) non sia stata codificata opportunamente in modo da estrapolare forme diverse - ad esempio - di invocatio. Uno storico del diritto troverebbe viceversa estremamente utile ritrovare in tempo reale le citazioni - e sono numerose - di testi del diritto canonico e del diritto civile sparsi nelle sentenze copiate nel manoscritto.
Se accettiamo il fatto che non si possono estrarre tutti i dati possibili e non si possono prevedere tutte le forme di interrogazione di una fonte, quello che è possibile e doveroso fare è consentire agli studiosi la possibilità di elaborare autonomamente la fonte stessa.
L'edizione digitale del Codice Pelavicino è formata da 529 file XML corrispondenti ad
altrettanti documenti del codice, raggruppati in un file master e collegati
a un file bibliografia, entrambi in XML. A prescindere dal sistema di
pubblicazione scelto, questi materiali possono essere banalmente resi disponibili,
scaricabili dal sito, in modo che altri studiosi possano procedere - se lo desiderano
- a cambiare, implementare, correggere la codifica proposta al fine di condurre
ricerche peculiari. A questo fine si potrebbe addirittura sfruttare la strutturazione
doppia dell’edizione - EVT e sito - in modo che l'image based edition
mantenga la versione dell’editore, mentre il sito sia più aperto a contributi esterni
e ospiti o dia conto, via via, delle ricerche condotte anche da altri studiosi sulla
medesima materia grezza
.
Si tratta di una soluzione semplice, già praticata da SMG, che però non è ancora particolarmente praticata nel mondo delle scienze umane: in buona parte perché richiede un rilevante mutamento di mentalità nella comunità scientifica di riferimento e in parte perché manchiamo ancora una infrastruttura che garantisca l'ospitalità dei dati secondo i principi FAIR (findable, accessible, interoperable, reusable) idonea alle peculiarità delle ricerche in ambito umanistico .
Dall’analisi del lungo percorso editoriale del Codice Pelavicino Edizione Digitale, messo anche a confronto con altri esempi di edizione critica di fonti medievali, possiamo dire di aver raggiunto alcune convinzioni, evidenziato esigenze e portato alla luce problemi che ancora attendono risposta.
Tra le convinzioni metterei la necessità, per tutti i progetti che prevedono la
relazione con archivi, biblioteche, associazioni culturali e musei, di procedere a un
dialogo serrato con i partner / committenti in modo da far capire i vantaggi e svantaggi
nel procedere a un’edizione critica digitale, a chiarire cioè il complesso percorso che
porta alla scelta del digitale, evidenziandone con onestà aspetti positivi e negativi.
Dobbiamo inoltre dire che si riscontra spesso, nelle edizioni digitali, una comune
partenza dalla metodologia tradizionale
con un successivo ragionamento atto a
valutare gli spazi di manovra dati dalla codifica del testo e dagli strumenti digitali
di visualizzazione e interazione. Questo procedere dal noto verso il nuovo per tentativi
successivi è certamente naturale e può apparire più che logico, ma porta anche a
intraprendere un percorso accidentato, pieno di rallentamenti, ripensamenti e revisioni.
La speranza è che in futuro la somma delle esperienze fatte possa portare alla
elaborazione di linee guida generali, condivise, finalizzate a costruire fin dall’inizio
progetti che abbiano maggiore chiarezza di intenti sul merito e sul metodo.
Tra le esigenze metterei certamente quelle di:
preservare la semplicità nella consultazione della fonte per favorire la sua effettiva lettura al di fuori dal ristretto gruppo degli addetti ai lavori;
consentire l’accesso degli studiosi ai dati (file testo, file xml, basi di dati) in modo che altri possano utilizzare quanto già prodotto in diverse analisi, secondo i principi FAIR;
scegliere in maniera autonoma e responsabile quali servizi di analisi sulla fonte edita aprire.
Il terzo punto rimane attualmente in attesa di una o più soluzioni tecniche idonee. Per quanto riguarda il Codice, nato in un contesto EVT, lo sforzo sarà certamente quello di implementare il software EVT in modo da rendere possibile una interrogazione dei dati tramite un'interfaccia flessibile, che si presti a esigenze diverse, mantenendo una grande l’attenzione alla facilità d’uso, sia per l’utente sia per l’editore, che consenta un rapido e continuo aggiornamento in stretto collegamento con le pratiche di crowdsourcing già avviate (Rosselli Del Turco 2021). Date le premesse la never ending edition del Codice Pelavicino continuerà quindi a modificarsi, contando su un happy ever after.
Ambrosio, Antonella, e Vera Isabell Schwarz-Ricci. 2021. «L’edizione digitale di documenti medievali. Il caso di studio di S. Maria della Grotta», Umanistica Digitale n. 10.
Ansani, Michele, e Antonella Ghignoli. 2011. «Testi digitali: nuovi media e documenti medievali». In Historiens et l’informatique : un métier à réinventer, 73–86. Roma: École française de Rome.
Balletto, Laura. 2009. «Geo Pistarino e le fonti. Un progetto incompiuto: l’edizione critica del Codice Pelavicino». Memorie dell’Accademia Lunigianese G. Capellini LXXIX: 57–76.
Bartoli Langeli, Attilio. 1991. «L’edizione dei testi documentari. Riflessioni sulla filologia diplomatica». In L’edizione dei testi mediolatini. Problemi metodi prospettive. Testi della VIII Settimana residenziale di studi medievali, Carini 24-28 ottobre 1988, 116–131. Palermo.
Broyles, Paul A. 2020. «Digital Editions and Version Numbering.» Digital Humanities Quarterly 014 (2). http://www.digitalhumanities.org/dhq/vol/14/2/000455/000455.html
Bürgermeister, Martina. 2020. «An Empirical Study of Versioning in Digital Scholarly Editions». In Atti del IX Convegno Annuale AIUCD. La svolta inevitabile: sfide e prospettive per l’Informatica Umanistica. a cura di C. Marras, M. Passarotti, G. Franzini, ed E. Litta, Milano. http://amsacta.unibo.it/6316/.
De Martin, Chiara. 2018. «La timeline del Codice Pelavicino. La codifica e la visualizzazione delle date in una edizione digitale». Tesi di laurea, Università di Pisa, rell. E. Salvatori e C. Di Pietro.
Delle Donne, Roberto. 2019. «Information Technologies for Medieval Studies: Some Recent Experiences in Italy». Reti Medievali Rivista 20 (1): 13–39. https://doi.org/10.6092/1593-2214/6071.
Di Pietro, Chiara, e Roberto Rosselli Del Turco. 2018. «Between Innovation and Conservation: The Narrow Path of User Interface Design for Digital Scholarly Editions». Digital Scholarly Editions as Interfaces 22 2016 : 133–63
Gengnagel, Tessa. 2012. «The ‘Beta Dilemma’ – A Review of the Faust Edition.» RIDE 7 (2017). doi: 10.18716/ride.a.7.3.
Giacchetto, Marco. 2021. «Problemi e questioni nello studio delle fonti fiscali
tardomedievali: la Lira
senese nel XV secolo», Umanistica Digitale
10.
Guidelines 2011. Modern Language Association a c. di. Guidelines for Editors of Scholarly Editions 2 https://www.mla.org/Resources/Research/Surveys-Reports-and-Other-Documents/Publishing-and-Scholarship/Reports-from-the-MLA-Committee-on-Scholarly-Editions/Guidelines-for-Editors-of-Scholarly-Editions
Lupo Gentile, Michele. 1912. «Il regesto del codice Pelavicino». Atti della Società Ligure di Storia Patria XLIV.
Miaschi, Alessio. 2020. «Signa tabellionum». In Codice Pelavicino. Edizione digitale, a cura di Enrica Salvatori, Edilio Riccardini, 2020. http://pelavicino.labcd.unipi.it/materiali/i-signa-tabellionatus/
Nanetti, Andrea. 2021. «Engineering Historical Memory and the Interactive Exploration of Archival Documents. The Online Application for Pope Gregory X’s Privilege for the Community of Mount Sinai (1274) as a Prototype», Umanistica Digitale 10
Noiret, Serge. 2009. «Public History
e storia pubblica
nella rete».
Ricerche storiche XXXIX (2–3): 275–327.
Noiret, Serge. 2015. «Storia Pubblica Digitale». Zapruder. Storie in Movimento, n. 36: 8–22.
«Norme per la pubblicazione dell’Istituto Storico Italiano». 1906. Bollettino dell’Istituto Storico Italiano, VII–XXIV.
Pierazzo, Elena. 2019. «Quale infrastruttura per le edizioni digitali? Dalla tecnologia all’etica». Textual Cultures 12 (2): 5–17.
Pratesi, Alessandro. 1957. «Una questione di metodo: l’edizione delle fonti documentarie». Rassegna degli Archivi di Stato XVII: 312–33, ora anche in Pratesi, Alessandro. 1992. Tra carte e notai. Saggi di diplomatica dal 1951 al 1991. Miscellanea della Società romana di storia patria XXXV. Roma: 33-34
Pratesi, Alessandro. 1977. «Fonti narrative e documentarie: problemi e metodi di edizione». In Atti del II convegno delle società storiche toscane, 25–37. Lucca.
Puncuh, Dino. 1978. «Sul metodo editoriale di testi notarili italiani». Actum Luce VI: 59–80, ora anche in Puncuh, Dino. 2006. All’ombra della lanterna: cinquant’anni tra archivi e biblioteche, 1956-2006. A cura di Antonella Rovere, Marta Calleri, e Sandra Macchiavello. Genova: 593-610.
O’Donnell, Daniel Paul e Roberto Rosselli Del Turco. 2020. «Good things come in small packages: designing distributed editions and tools for the age of FAIR data». Assemblée Générale du consortium Cahier 27 Nov. 2020 DOI 10.5281/zenodo.4293723
Rosselli Del Turco, Roberto. 2012. «After the editing is done: Designing a Graphic User Interface for digital editions». Digital Medievalist 7. http://doi.org/10.16995/dm.30
Rosselli Del Turco, Roberto. 2014. «EVT development: an update (and quite a bit of history)». Edition Visualization Technology (blog). 26 gennaio 2014. https://visualizationtechnology.wordpress.com/2014/01/26/evt-development-an-update-and-quite-a-bit-of-history/.
Rosselli Del Turco, Roberto. 2016. «12. The Battle We Forgot to Fight: Should We Make a Case for Digital Editions?» Digital Scholarly Editing, 219.
Rosselli Del Turco, Roberto. 2017. «The Digital Vercelli Book. A facsimile edition of Vercelli, Biblioteca Capitolare, CXVII». Notes 3: 6.
Rosselli Del Turco, Roberto. 2019. «Designing an advanced software tool for Digital Scholarly Editions: The inception and development of EVT (Edition Visualization Technology)». Textual Cultures 12, n. 2 (2019): 91–111
Rosselli Del Turco, Roberto. 2021. «Elaborazione di dati semi-strutturati: ipotesi implementative e casi d’uso tratti da testi in inglese antico», in Umanistica Digitale, n. 10
Rosselli Del Turco, Roberto, Chiara Di Pietro, e Chiara Martignano. 2019. «Progettazione e implementazione di nuove funzionalità per EVT 2: lo stato attuale dello sviluppo». Umanistica Digitale, n. 7. https://doi.org/10.6092/issn.2532-8816/9322
Rosselli Del Turco, Roberto, Enrica Salvatori, Andrea Nanetti, Marco Giacchetto, Vera Isabell Schwarz-Ricci, e Antonella Ambrosio. 2021. «Fonti archivistiche medievali nel digitale. La sfida di trattare e visualizzare dati semi-strutturati». In AIUCD 2021 - DH per la società: e-guaglianza, partecipazione, diritti e valori nell’era digitale Raccolta degli abstract estesi della 10a conferenza nazionale AIUCD 2021, a cura di Federico Boschetti, Angelo Mario Del Grosso ed Enrica Salvatori. Pisa, ora rielaborato come «Introduzione» al presente dossier Fonti archivistiche medievali nel digitale. La sfida di trattare e visualizzare dati semi-strutturati, Umanistica Digitale, n. 10
Sahle, Patrick, a c. di. 2014. Criteria for Reviewing Scholarly Digital Editions, version 1.1 (2014) presso l’Institut für Dokumentologie und Editorik. https://www.i-d-e.de/publikationen/weitereschriften/criteria-version-1-1/
Salvatori, Enrica. 2017. «L’edizione digitale di fonti storiche: nuove opportunità, nuovi problemi, nuove figure». In Edito, inedito, riedito. Saggi dall’ XI Congresso degli Italianisti Scandinavi, Università del Dalarna – Falun, 9-11 giugno 2016, a cura di Vera Nigrisoli Wärnhjelm, 39–53. Pisa: Pisa University Press.
Salvatori Enrica. 2018. «La strategia documentaria del vescovo di Luni Guglielmo. Considerazioni a margine di un’edizione digitale». In Ingenita curiositas. Studi sull’Italia medievale per Giovanni Vitolo, a cura di Rosalba Di Meglio, Bruno Figliuolo, e Antonella Ambrosio, III:1175–90. Battipaglia.
Salvatori, Enrica, e Giorgio Guzzetta. 2021. «"Digital Public History: un invito alla riflessione». Blog accademico. Leggere, scrivere e far di conto (blog). 4 febbraio 2021. https://infouma.hypotheses.org/523.
Salvatori, Enrica, e Edilio Riccardini. 2020. «Criteri di edizione». In Salvatori, Enrica et al. 2020.
Salvatori, Enrica et al. 2014. Salvatori, Enrica, Edilio Riccardini, Laura Balletto, Roberto Rosselli Del Turco, Chiara Alzetta, Chiara Di Pietro, Chiara Mannari, Roberto Masotti, e Alessio Miaschi, a c. di. 2014. Codice Pelavicino. Edizione digitale. Pisa. https://doi.org/10.13131/978-88-902289-0-2
Salvatori, Enrica et al. 2020. Salvatori, Enrica, Edilio Riccardini, Laura Balletto, Roberto Rosselli Del Turco, Chiara Alzetta, Chiara Di Pietro, Chiara Mannari, Roberto Masotti, e Alessio Miaschi, a c. di. Codice Pelavicino. Edizione digitale. Pisa. https://doi.org/10.13131/978-88-944430-2-8
Salvatori Enrica, Roberto Rosselli Del Turco, Chiara Alzetta, Chiara Di Pietro, Chiara Mannari, e Alessio Miaschi. 2017. «Il Codice Pelavicino tra edizione digitale e Public History». Umanistica Digitale 1: 105–177
Tognetti, Gianpaolo, a c. di. 1982. Criteri per la trascrizione di testi medievali latini e italiani. Quaderni della «Rassegna degli Archivi di Stato» 51. Roma.
Vogeler, Georg. 2019. «The ‘Assertive Edition’». International Journal of Digital Humanities 1, n. 2: 309–22. https://doi.org/10.1007/s42803-019-00025-5
Cfr. ; ; ; ; ; si veda anche l’utile dossier: La palestra dell'editore: materiali vecchi e nuovi per l'edizione dei testi documentari, messo a disposizione da Scrineum http://www.scrineum.it/scrineum/biblioteca/dossier-1.html. Ultimo accesso:15 marzo 2021.
Sulle problematiche generali, non tecniche, dell’edizione digitale delle fonti documentarie si veda ; ; ; .
Le norme tradizionalmente valide per l’edizione a stampa hanno ovviamente subito dei cambiamenti nell’edizione digitale per i quali si veda Salvatori e Riccardini 2020. Abbiamo tenuto in considerazione in particolare le linee guida emerse nella discussione interna alle più rilevanti comunità di studiosi impegnati in progetti di filologia digitale, in particolare e .
Su EVT si veda https://visualizationtechnology.wordpress.com/ e e . Nel tempo EVT si è dimostrato lo strumento prêt-a-porter per le edizioni critiche digitali, altamente flessibile e configurabile come auspicato da Elena Pierazzo ( ).
Questo ci pare vada nella direzione di alcuni recenti sviluppi della diplomatica tesi a considerare in maniera innovativa l’insieme delle informazioni che emergono dalle fonti notarili. Si veda in particolare il progetto NOTAE http://www.notae-project.eu/ che intende investigare la presenza di simboli grafici nella documentazione tra la tarda antichità e l’alto medioevo.
Manca ancora la promozione presso le scuole, che necessiterebbe dell’apertura di una sezione apposita sul sito e del personale dedicato.
Su questa problematica si veda ; per le connesse problematiche di citazione del testo fluido e .
Problema analogo a quello esposto da Marco Giacchetto in questo stesso dossier ( ).
Cfr. . La scelta di non mettere il Codice Pelavicino su Monasterium.net si deve a diverse ragioni, principalmente legate alle esigenze dell'ente che possiede il manoscritto; tuttavia si deve notare che la presenza in quella piattaforme non ne avrebbe favorito la consultazione da parte del largo pubblico.
Nel mondo dei digital historian si discute molto della differenza tra dati grezzi
(raw) ed elaborati (cooked): come spiegato da Andreas Fickers al convegno AIUCD2021
(resoconto in ), ma tale distinzione non è applicabile
ai file XML del Pelavicino, in quanto non solo sono derivati da copie di originali,
ma anche già elaborati / cooked dall’operazione di codifica; anche i dati
semi-strutturati, se trattati con una codifica apposita, risulterebbero estremamente
elaborati. A questo proposito, oltre che la versione codificata dei testi in XML,
potrebbe essere una buona idea (da trasformare in linea guida?) collocare in un
repository anche la versione pulita
, a-scientifica
, completamente priva
di qualsiasi tipo di marcatura e in formato testo (txt) dei documenti, in modo da
consentire eventuali studi con tecniche di distant reading.
Esistono oggi più piattaforme che operano secondo i principi FAIR, come ad esempio Zenodo (https://zenodo.org/), gestito dal CERN per OpenAIRE o, per ora limitato a risorse e progetti di tipo linguistico, ILC4clarin (https://dspace-clarin-it.ilc.cnr.it/repository/xmlui/). Si tratta però di repository che stentano a farsi strada nei progetti di tradizione umanistica per diverse ragioni, tra cui la non conoscenza del loro funzionamento tra i ricercatori del settore, la propensione a gestire grandi quantità di dati in progetti non correlati, la conseguente difficoltà che incontrano gli studiosi di scienze umane nell'immettervi le loro peculiari ricerche, caratterizzate da quantità minori di dati, ma da una loro forte interconnessione reciproca ( ).