This article presents a digital edition of the 17th century diplomatic correspondence of Benoît Cise de Grésy. The first part of the paper introduces the author, while the second part examines the traditional critical printed edition and the changes made to the texts. The paper discusses the benefits of text modernisation for content comprehension even if this comes at the expense of the language's idiosyncrasies. An examination of a number of existing digital editions of correspondence frames the description of the digital edition of Benoît Cise de Grésy's correspondence, outlining the technologies used (EVT and oXygen) and the advantages afforded by the digital medium. An example of linguistic annotation with TreeTagger is also presented in order to illustrate some of the software's current issues in the treatment of modern and old French. In this regard, the paper discusses existing efforts by a number of European research groups - PRESTO in particular - to tailor linguistic markup to the specificities of the French language. Additionally, some of the issues faced during the editing process are analysed, including the implications of limited digital proficiency and the need for collaboration between philologists and computer scientists. Next, the paper reflects on what it means to be a digital humanist and on the skills required to foster a constructive dialogue with those responsible for the creation of the digital edition. The paper concludes with a description of the issues concerning ISBN, DOI and SIAE registration and of a number of digital document conservation projects conducted by the libraries of the University of Turin, particularly SIRIO@UNITO and TUTTO.
L'articolo presenta l'edizione di una corrispondenza diplomatica francese del XVII secolo. Dopo un breve excursus sulla vita dell'autore delle lettere, verrà presentata l'edizione critica tradizionale a stampa e saranno esplicitati gli interventi realizzati sul testo. Ci si interrogherà sulla questione della modernizzazione del testo, per privilegiare la comprensione del contenuto a scapito, però, dell'autenticità della lingua. Verranno analizzate le edizioni digitali di corrispondenze attualmente pubblicate e considerate edizioni a stampa digitalizzate piuttosto che edizioni digitali interattive. Saranno presentate le soluzioni possibili ai problemi sopradescritti grazie all'uso del digitale. Verrà quindi presentata l'edizione digitale della corrispondenza di Benoît Cise de Grésy, anche attraverso delle immagini della versione demo dell'edizione. Si presenteranno gli strumenti scelti per realizzarla (software EVT e Oxygen) e un esempio di codifica del testo. Saranno evidenziati i vantaggi offerti dall'edizione digitale. Verrà mostrato un esempio di marcatura linguistica con software TreeTagger, saranno messe in evidenza alcune problematicità legate alle etichette oggi utilizzate dal sistema, sia per quanto riguarda il francese moderno che quello antico. Saranno presentati alcuni gruppi di ricerca europei che stanno affinando delle etichette più specifiche, in particolare il gruppo PRESTO. Saranno analizzati i problemi e le difficoltà riscontrati realizzando l'edizione digitale, soprattutto per chi comincia un progetto di questo tipo in assenza delle conoscenze informatiche necessarie. Sarà evidenziata l'attuale necessità di collaborazione tra filologi e informatici, ma verrà anche proposta una riflessione sulla figura dell'umanista digitale e sulle competenze necessarie per poter dialogare con chi praticamente realizzerà l'edizione. Si affronteranno alcune questioni legate alla necessità di associare all'edizione digitale un codice ISBN, un codice DOI e eventualmente una registrazione alla SIAE. Verranno presentati alcuni esempi di conservazione di documenti digitali da parte delle Biblioteche dell'Università degli Studi di Torino, in particolare i progetti: SIRIO@UNITO e TUTTO.
Nel corso della realizzazione dell'edizione di una corrispondenza diplomatica francese del Seicento è stato possibile osservare come alcune problematiche di carattere filologico e codicologico possano essere risolte, almeno in parte, grazie ad un'edizione digitale interattiva.
È stato scelto di editare una parte di una corrispondenza diplomatica, in quanto documenti di questo tipo hanno spesso interessato gli storici a causa del loro contenuto, ma solo negli ultimi tempi sono stati studiati anche da un punto di vista linguistico. Sono documenti che costituiscono un patrimonio scritto non-letterario, legato a situazioni di comunicazione ben circoscritte, testi pragmatici che quindi hanno un valore di testimonianza linguistica indubitabile.
L'edizione in questione concerne parte delle lettere che Benoît Cise de Grésy, diplomatico al servizio dei Duchi di Savoia, indirizzò alla corte di Torino negli anni centrali del Seicento.
Prima di analizzare i vantaggi offerti dall'edizione digitale è necessario presentare brevemente il corpus scelto: l'autore delle lettere è Benoît Cise de Grésy, il quale cominciò la sua carriera diplomatica a Londra al fianco dello zio, inviato dei duchi di Savoia in Inghilterra. Dopo la morte dello zio, nel 1640, Benoit Cise de Grésy subentrò nelle funzioni diplomatiche e svolse il suo primo incarico ufficiale tra il 1645 e il 1649, accompagnando il marchese di San Maurizio come rappresentante del ducato di Savoia nelle negoziazioni del trattato di Vestfalia. Cise fu in seguito consigliere di Stato, inviato presso i cantoni svizzeri cattolici, inviato straordinario a Parigi, commissario ducale della valli valdesi del Piemonte e ambasciatore straordinario dei Duchi di Savoia in Svizzera.
Dopo aver letto ed esaminato tutte le lettere indirizzate a Madama Reale e al suo segretario François Carron de Saint Thomas, a oggi conservate presso l'Archivio di Stato di Torino (circa un migliaio), si è scelto di isolare un corpus di 145 lettere, in quanto esse costituiscono un insieme omogeneo per data, argomenti trattati e luoghi.
Si è deciso di iniziare il lavoro approntando un'edizione critica tradizionale, tappa fondamentale per qualunque tipo di edizione. Il primo passaggio è stato quello di realizzare la trascrizione rispettando il più possibile la lezione del manoscritto; gli interventi sono stati limitati ai casi in cui il testo fosse poco comprensibile. La trascrizione è stata accompagnata da un doppio apparato di note: uno con esponente numerico (ex: 1) che fornisce dei chiarimenti storici e biografici sui personaggi, i luoghi, gli avvenimenti e gli aneddoti di cui trattano le lettere; l'altro con esponente alfabetico (ex: a) che registra tutti gli interventi codicologici fatti sui testi.
Lo scopo di questa edizione è duplice: da un lato rendere comprensibile il contenuto delle lettere ai lettori contemporanei modernizzando la scrittura, dall'altro mettere a disposizione le lettere scritte con l'ortografia originale, conservando quindi le peculiarità stilistiche dell'autore, per poter realizzare analisi linguistiche. Infatti, grazie allo studio di questo aspetto è emerso che la lingua di questa corrispondenza è estremamente instabile (grafie variabili, scelte grammaticali e lessicali inconsuete…) e costituisce un'importante testimonianza dell'uso del francese dell'epoca da parte di un uomo mediamente colto che conosceva bene questa lingua (sua lingua madre), oltre che l'italiano e il tedesco, e che scriveva lettere ufficiali alla corte di Torino per trasmettere informazioni di grande importanza.
Dopo aver letto ed esaminato il corpus di testi, è stato necessario interrogarsi su quale tipo di edizione fosse meglio realizzare. L'unica risposta che è stato possibile trovare è che la scelta dipende da quale aspetto l'editore desideri privilegiare. Infatti, sebbene risulti evidente che ogni trascrizione di un manoscritto è un'interpretazione del curatore, qualora si intenda privilegiare il valore contenutistico e storico, si realizzerà un'edizione di tipo tradizionale. Questa edizione avrà il principale merito di rendere disponibili testi inediti e opere perlopiù sconosciute a un pubblico relativamente vasto, ma essendo un prodotto focalizzato principalmente sul contenuto, sarà rivolto essenzialmente agli storici che saranno i principali destinatari di questi scritti. Tuttavia, qualora si tratti di testi scritti in modo poco comprensibile per i lettori moderni (in questo caso specifico, il francese del XVII secolo), sarà necessario realizzare edizioni in cui il testo sia modernizzato. I fenomeni linguistici potranno essere spiegati solo attraverso un apparato di note che potranno essere realizzate da linguisti e da storici della lingua. Qualora l'editore desideri privilegiare il contenuto dell'opera rispetto alla fedeltà linguistica, il testo dovrà essere comprensibile a qualunque parlante di quella lingua, interessato agli argomenti trattati nell'edizione.
Nel caso specifico, la corrispondenza di Benoît Cise de Grésy è scritta in una lingua francese del Seicento che è molto diversa dal "moyen français", ma non può ancora essere definita "français classique": si tratta quindi di un testo molto interessante da analizzare per studiare l'evoluzione della lingua francese.
Purtroppo, nelle edizioni di testi seicenteschi l'aspetto linguistico è spesso lasciato da parte o erroneamente semplificato, come ha recentemente sostenuto Frédéric Duval in "Les éditions de textes du XVIIe siècle" , evidenziando come prestando poco interesse alla storia del francese in passato siano state realizzate edizioni basate su concetti errati. Per esempio, recentemente è stata messa in discussione la periodizzazione della lingua francese, in quanto l'ideologia linguistica tendeva a presentare il francese moderno come una lingua fissata dalla seconda metà del XVII secolo.
I testi medievali venivano quindi editati con forme grafiche fedeli al manoscritto e la lingua della maggior parte dei testi seicenteschi veniva modernizzata. Inoltre, nella maggior parte delle edizioni, le particolarità del francese preclassico e classico non emergono e raramente vengono segnalate le varianti grafiche. Spesso coloro che studiano testi francesi di questo periodo dispongono di tutte le edizioni di un manoscritto e di conseguenza scelgono sovente di editare una versione del testo considerata migliore, riproducendola così come appare nell'originale. Ciò sottintende, secondo Duval, una visione linguistica sbagliata:
"L'idéologie linguistique tend à présenter le français moderne comme une langue stabilisée depuis la seconde moitié du XVIIe siècle. La périodisation linguistique du français qui faisait achever le moyen français vers 1610, date à laquelle lui succédait le français moderne a contribué à renforcer cette représentation linguistique erronée. Le résultat en est une pratique ecdotique paradoxale qui voit les éditions de textes médiévaux fidèles aux graphies des manuscrits et les textes du XVIIe siècle très majoritairement modernisés. Suivant cette logique contre-intuitive, moderniser c'est admettre que la langue est proche de la nôtre; conserver la graphie d'origine est admettre qu'elle s'en éloigne sensiblement."
Inoltre Duval spiega che in passato gli editori di testi del XVII secolo hanno spesso scelto di riprodurre un testo così come appariva, prestando poca attenzione alle varianti sia linguistiche che ortografiche, considerate scarsamente importanti:
"les dix-septièmistes disposent souvent de toutes les éditions du texte. La variation est donc d'une utilité faible, voire nulle pour l'établissement de textes du XVIIe siècle. Pour les dix-septièmistes le texte s'assimile à une donnée disponible. Il suffit d'en sélectionner un état et de le reproduire. Comme le texte est donné, son établissement est moins au centre du travail de l'éditeur que son commentaire ou la simple volonté de le faire connaitre et les diffuser."
Infatti, continua Duval, gli editori di testi letterari raramente si interessano alle varianti linguistiche e ortografiche, a meno che queste non siano varianti d'autore o non risultino significative da un punto di vista semantico.
"Prêtant peu d'attention à l'histoire du français, les éditeurs de textes littéraires ne s'intéressent guère à la variation quand elle n'est pas variation d'auteur ou ne semble pas significative au plan sémantique. Ce parti pris est dommageable parce qu'un relevé des variantes pourrait rendre de grands services à des historiens de la langue ou à des stylisticiens (…). Procéder ainsi permettrait par exemple de nous renseigner sur les changements en cours durant la première moitié du XVIIe siècle, dont la langue est encore fort mal décrite."
Duval spiega che questa scelta è dannosa poiché una segnalazione delle varianti linguistiche e filologiche potrebbe rendere un grande servizio agli storici della lingua. Questo aspetto risulta ancora più importante per ottenere informazioni sui cambiamenti linguistici in corso durante il XVII secolo, periodo la cui lingua francese è oggi tendenzialmente mal descritta. Sovente la pratica ecdotica più diffusa per i testi seicenteschi è un'edizione tradizionale con una grande modernizzazione del testo, scelta che si ritiene deprecabile poiché la trascrizione critica modernizzata impedisce di ricostruire la lingua dell'epoca così come appariva nel testo originale. Infatti, se il dato è disperso, a causa della normalizzazione, l'informazione sarà perduta per sempre. Si tratta quindi di un processo irreversibile e da evitare anche perché sovente le modernizzazioni sono arbitrarie.
Si ritiene quindi necessario realizzare più livelli di edizione di un testo. Sarebbe importante codificare il livello degli allografi e il livello normalizzato, su quest'ultimo sarebbe necessario fare un'accurata analisi linguistica perché, ad esempio, ciò potrebbe essere utile per ricostruire la storia della lingua in cui sono stati scritti tali testi. Se l'edizione realizzata è cartacea e di tipo tradizionale è necessario che l'editore dichiari fin dal principio se la sua edizione privilegerà l'aspetto contenutistico o quello linguistico, pur sapendo che qualunque scelta porterà con sé delle perdite. Siccome è ovvio che non sia sempre possibile trovare una risposta univoca per tutte le opere, il tipo di edizione che si sceglierà di realizzare dipenderà dalle priorità dell'editore e del progetto di edizione.
Con la realizzazione di un'edizione digitale interattiva si può superare il dilemma della scelta tra l'edizione conservativa o modernizzata poiché
"la présence de l'image du manuscrit, ainsi que la possibilité de transposer avec une grande précision ses caractéristiques physiques, tendent à favoriser une transcription fidèle d'un manuscrit particulier. Dans le domaine de la critique textuelle, ces mêmes technologies offrent des solutions pratiques pour encoder, visualiser et comparer différents témoins d'une même œuvre. Elles permettent au littéraire comme au linguiste- toujours désireux de pouvoir comparer des variantes de ses assez proche- d'accéder simultanément à différentes versions du même texte"
A oggi si attesta una grande eterogeneità di pratiche di edizioni digitali di corrispondenze francesi del Seicento, ciò è dovuto al fatto che queste pratiche non sono state perlopiù condivise e codificate dalla comunità scientifica. Infatti, gli editori hanno preferito adattare le loro edizioni alle esigenze del contenuto e del fruitore.
Tuttavia la creazione e la diffusione delle edizioni digitali impongono all'editore una riflessione su alcune scelte di tipo metodologico, che nell'edizione cartacea potevano essere taciute o date per scontate. Questo perché l'edizione digitale può essere continuamente aggiornata e permette la visualizzazione di diversi stadi del testo, quindi, qualora l'editore decida di fornire un solo tipo di edizione (scegliendo ad esempio l'edizione diplomatica o l'interpretativa), sarà buona norma esplicitare e giustificare tale scelta al lettore.
La maggior parte delle edizioni di corrispondenze diplomatiche francesi del Seicento sono testi a stampa realizzati da storici e destinati a storici, privi di indicazioni filologiche precise e per la maggior parte inutilizzabili per indagini linguistiche.
Per esempio, la Correspondance du cardinal Mazarin avec le maréchal d'Aumont, realizzata da E. T. Hamy , a Monaco, nel 1904, è un'edizione di 174 lettere scambiate tra il cardinale Mazzarino e il maresciallo d'Aumont. Nell'introduzione dell'opera l'editore dichiara
"ces piéces ont été transcrites aussi exactement que possible. On a tenu surtout à conserver aux rédactions et aux dictées de Mazarin, toute leur saveur particulière en reproduisant scrupuleusement l'orthographe qui nous a conservé comme un écho de cet exotisme verbal, dont le Cardinal n'a jamais pu se débarasser entièrement."
Il commento del contenuto della corrispondenza è inserito nella prefazione. A piè di pagina vi è la presenza di alcune brevi note di tipo storico. Non vi è nessun tipo di annotazione linguistica, né nessuna analisi filologica.
Situazione analoga è quella della Correspondance du chevalier de Sévigné et de Christine de France, duchesse de Savoie , realizzata da J. Lemoine e F. Saulnier e pubblicata a Parigi nel 1911. Dopo una lunga introduzione storica sulla vita del cavaliere de Sévigné, nell'edizione vengono pubblicate le lettere con un'annotazione di tipo storico. Anche in questo caso non vi è alcuna analisi linguistica. Le lettere sono trascritte in "français classique" e non vi è traccia della lingua dell'epoca.
Anche la Correspondance administrative sous le règne de Louis XIV, pubblicata da G. B. Depping , a Parigi, nel 1850-1855, presenta un'introduzione di tipo storico. L'edizione della corrispondenza è praticamente priva di qualunque tipo di annotazione. La lingua delle lettere è, ancora una volta, il "français classique" ma vi sono alcuni tratti arcaicizzanti, come per esempio la y al posto della i in finale di parola (ex: "roy" per "roi") o alcuni segni caratteristici del francese antico come ad esempio la forma "debvoir" che poi diventerà "devoir", o "evesque" per "eveque", "profitter" per "profiter", o ancora la presenza della z per segnalare il plurale dei sostantivi (ex: "difficultez" per difficultés"). Tuttavia non è presente nessuna analisi o spiegazione di tipo filologico.
Neppure le edizioni critiche più recenti come La correspondance d'Albert Bailly (X vol., Aosta, 1999-2010) permettono di analizzare adeguatamente la frequenza di certi fenomeni linguistici, né rendono il testo utilizzabile anche per indagini relative ad altri ambiti di studio (ad esempio storico o etnografico). Tuttavia questa edizione, pur seguendo i criteri e i metodi della filologia tradizionale, pubblicando la corrispondenza in formato cartaceo e con una leggera modernizzazione della lingua, ha il merito di segnalare sempre gli interventi editoriali con una ricca annotazione storico-filologica.
Alcuni limiti precedentemente descritti si possono superare grazie allo sviluppo delle Digital Humanities. Infatti, recentemente molti testi a stampa sono stati digitalizzati e diffusi sul web gratuitamente (si pensi a siti quali Gallica, Google books, Internet Archive), ma si tratta di edizioni digitali non interattive: ciò significa che il lettore può visualizzare il testo e fare delle ricerche al suo interno, ma nella maggior parte dei casi non vengono date informazioni concernenti la struttura linguistica o il contenuto. Si tratta quindi di edizioni di tipo tradizionale digitalizzate e non di edizioni digitali interattive, fenomeno che è stato messo in evidenza anche nell'articolo "La philologie numérique: tentative de définition d'un nouvel objet éditorial":
"L'édition numérique a aujourd'hui plus de vingt ans […]. Dans la dernière decennie, plusieurs initiatives importantes ont permis l'édition électronique de textes en français médioéval. […] Cependant, malgré ce développement continu, il semble que le numérique soit encore loin de remplacer les éditions traditionelles sur papier. […] Deux facteurs expliquent, […], cette situation: d'une part, le petit nombre des éditions électroniques produites, et d'autre part, une certaine méfiance due à la confusion entre "éditions numériques" et éditions imprimées "numerisées". Il importe donc de signaler que par "philologie numérique" nous n'entendos pas la numérisation des éditions imprimées, telle qu'elle est realisée dans les grands corpus électroniques (Base de français médioéval. Frantex, Corpus de la litterature médioévale de Garnier ect). Bien qu'inconturnables, pour le linguiste, ces ressources ont des limitations importantes du point de vue philologique, la plus sérieuse étant l'élimination systématique de la matière critique (introduction, notes, variantes, glossaires), ce qui oblige le lecteur à se référer à l'édition source. En outre, à cause des droits que l'éditeur se réserve sur le texte, les éditions disponibles à la numerisation ne sont pas toujours les meilleurs."
Una vera e propria edizione digitale di corrispondenze francesi, ad esempio, è quella realizzata recentemente da Olivier Poncet, professore dell'École Nationale de Chartres che, situandosi in un più ampio progetto di pubblicazioni digitali di corrispondenze dal XV al XIX secolo, ha realizzato l'edizione digitale della corrispondenza di Antoine Du Bourg .
Purtroppo si tratta ancora di un'edizione non interattiva, senza apparato di note, che ha tuttavia il merito di costruire un modello di interfaccia per le corrispondenze non letterarie dell'epoca.
Sebbene questa edizione non consenta all'utente di visualizzare l'immagine del manoscritto, essa ha il merito di contenere degli indici (nomi e luoghi) e un glossario.
Anche la Correspondance française de Guy Patin, pubblicata nel 2015 da Loïc Capron , pur fornendo molti apparati di tipo contenutistico, non è interattiva e non permette di visualizzare diversi tipi di edizione.
Per quanto riguarda in generale l'edizione interattiva occorre segnalare l'edizione di La Queste del Saint Gral, realizzata da Christiane Marchello-Nizia e Alexei Lavrentiev, che a partire da un manoscritto lionese del 1225, mostra le potenzialità della filologia digitale e consente di visualizzare tre tipi di edizione: un'edizione modernizzata, un'edizione critica con alcuni interventi, ma piuttosto vicina alla fonte primaria, e un'edizione diplomatica.
Questa edizione di La Queste del Saint Gral, oltre a contenere un'introduzione, un indice dei nomi e un glossario, scaricabili in formato PDF, beneficia di funzioni di analisi linguistiche proposte dalla piattaforma TXM. Sebbene quest'ultima edizione testimoni la volontà di arrivare a creare edizioni digitali interattive, purtroppo è un caso piuttosto isolato poiché le attuali edizioni digitali, essendo spesso prive di apparati critici (l'introduzione, le note, le varianti), obbligano il lettore a consultare in ogni caso l'edizione cartacea.
Oggi si riscontrano pratiche di edizione digitale molto diverse tra loro, inoltre è possibile osservare una certa reticenza nell'approfittare pienamente di tutte le possibilità offerte dalle nuove tecnologie.
Nel lavoro di ricerca oggetto di questo articolo, l'avvicinamento al mondo del digitale è avvenuto in modo quasi fortuito poiché a metà del secondo anno di lavoro (avendo tre anni in totale a disposizione), dopo aver già realizzato la trascrizione della corrispondenza e approntato l'edizione tradizionale, è parso chiaro che alcuni aspetti della corrispondenza di Cise mal si adattavano all'edizione cartacea di tipo tradizionale.
Si tratta di un corpus molto vasto, che conta oltre duemila lettere, le quali non potrebbero essere tutte editate nella versione cartacea a causa delle limitazioni di spazio imposte dalle case editrici, problema inesistente sul mezzo digitale. Inoltre, si riscontra la presenza di alcune lettere cifrate, concepite per eludere i controlli della sorveglianza e trasmettere informazioni segrete o confidenziali. In queste lettere l'autore si serve di simboli grafici che devono essere mostrati per rendere conto al lettore dei codici usati perché, per esempio, lo studio di questi codici ha permesso di identificare dei segni che potrebbero far pensare agli alfabeti greco, arabo e cirillico. Tuttavia, la maggior parte delle lettere presenta la decodifica dei simboli scritta al di sopra della parte cifrata. Per quanto concerne il codice occorre segnalare l'utilizzo di numeri per designare dei personaggi, pratica che era di uso corrente all'epoca.
La scelta è stata quella di realizzare una versione demo dell'edizione digitale, che non è stata pubblicata a causa della mancanza di tempo e di fondi necessari a sviluppare il progetto. Per lo sviluppo è stato utilizzato il software EVT conosciuto grazie ad un corso di filologia germanica, seguito presso l'Università degli Studi di Torino, durante queste lezioni è stato possibile apprendere gli strumenti base per preparare l'edizione digitale di un testo.
Così, dopo aver seguito con interesse il corso è stato possibile analizzare la corrispondenza con il professor Roberto Rosselli Del Turco, il quale ha poi realizzato la codifica dell'edizione, e ci si è interrogati su quali strumenti fossero necessari per far emergere alcune peculiarità del corpus.
È stata realizzata una prima edizione digitale di alcune lettere della corrispondenza di Cise, usando il software EVT e l'editor Oxygen. Il testo, redatto in Word, è stato codificato in linguaggio XML secondo le direttive TEI P5 , sono stati aggiunti i tag, le immagini, le note, la lista nomi e la lista luoghi.
A causa della complessità della lingua della corrispondenza si è ritenuto indispensabile poter mostrare l'immagine del manoscritto accanto all'edizione del testo (si è ipotizzato in futuro di poter fornire la visualizzazione di diversi stadi di edizione).
In particolare si è ritenuto importante marcare i nomi dei personaggi presenti nella corrispondenza, a cui sono state aggiunte le note biografiche, al fine di poter utilizzare l'edizione per ricerche storico-biografiche.
Per ottenere questo risultato, è stato utilizzato il codice seguente:
le Sieur <persName ref="#JacquesPorcheron">Porcheron</persName><note type="comment">Jacques Porcheron […]puisque je suis hors d'esperance de les voir. J'ay creu, par une lettre, devoir trés humblement supplier M.R. d'honnorer de quelques plus particulier accueils Messieurs <persName ref="#UlrichTuliker">Tuliker</persName> <persName ref="#HeniFleckenstein">Fleckenstein</persName>, </note>,
<persName ref="#ZuyerdeEubach">Zuyer</persName>, </note>, <persName ref="#RodolpheWeck">Weck</persName> </note>, <persName ref="#RodolpheWeck">Weck</persName>
Per ogni personaggio è stata poi inserita una nota biografica, che compare spostando il cursore sul nome, ed è stata realizzata con questo codice:
<pb n="1v" xml:id="CDG_81_20_1v"/> d'estat <persName>Harttman</persName><note type="comment">Luigi Hartman, chevalier et secrétaire de la ville de Lucerne,
associé pour autorité et commission de ses illustres souverains en qualité de secrétaire de l'ambassade de six cantons suisses catholiques confédérés avec S.A.R.. A.S.T., Corte, Materie politiche per rapporto all'estero, Trattati , Trattati cogli Svizzeri, m.9.</note> auquel je vous supplie faire utte les plus grandes caresses et accueils que faire se pourra.
L'edizione digitale interattiva permette di evidenziare le date che compaiono nella corrispondenza, elemento molto rilevante qualora si desideri effettuare ricerche temporali. Si fornisce un esempio di codifica:
<lb/>À <name type="place">Chambery</name> le <date when="1651-12-15">15 Xbre<lb/>1651</date> </closer>
È parso fondamentale poter visualizzare le note filologiche sopra le parti del testo modificate o ritenute significative da un punto di vista linguistico.
Si mostra il codice corrispondente all'annotazione filologica:
<p>celle que m'avez<note n="a" type="critical"><emph>m'avés</emph> dans ms</note> fait l'honneur de m'escrire le 9 du courant, m'a<note n="b" type="critical"><emph>à</emph> dans ms</note> fait prendre la resolution d'envoyer à Turin
Si è ritenuto necessario inserire uno strumento che permettesse di poter effettuare ricerche all'interno del testo della corrispondenza.
Non si è scelto di ricorrere ad altri strumenti perché non vi era abbastanza tempo per analizzare altri software e poiché i risultati raggiunti grazie alla codifica con TEI XML sono risultati molto soddisfacenti.
Trattandosi di una tesi di dottorato in filologia francese si è ritenuto importante studiare quali fossero i principali strumenti utilizzati dai colleghi francesi per effettuare analisi linguistiche. Dopo alcune indagini è emerso che i software più usati sono EVT e TreeTagger. Si è quindi deciso di entrare in contatto con il gruppo di ricerca "Textometrie" dell'INRIM-ENS di Lione che lavora con la TEI associata al software TXM per le analisi linguistiche. Dopo aver seguito una formazione sulla preparazione dei corpora, sull'importazione di un testo e sulla marcatura semantica, è apparso evidente che questo strumento, pur essendo molto valido, presenta ancora delle criticità dovute alle particolarità del francese del Seicento.
Il software, tuttavia, funziona per apprendimento: inserendo diversi corpora, in futuro, si auspica che sarà possibile aumentare il riconoscimento delle parole, permettendo così di etichettare quelle ritenute più significative dall'editore (per esempio tutte le parole appartenenti allo stesso campo semantico o alla stessa categoria grammaticale):
"con la marcatura, che possiamo anche chiamare annotazione, è possibile aggiungere delle etichette descrittive o a porzioni di documento per dichiarare esplicitamente, e in modo leggibile dalla macchina elementi di struttura o elementi relativi al layout di tali documenti […]. La descrizione del documento tramite marcatura va quindi pensata come strategia di mantenimento dell'informazione sulla lunga durata."
Si riporta a titolo di esempio una lettera analizzata con TreeTagger dove il software ha riportato ancora molte inesattezze:
"Monsieur, je ne fais qu'arriver de Soleurre, où j'ay esté rendre mes devoirs à Monsieur de la Barde, et avec mesme occasion à Monsieur le marquis de Lullin; lequel, par homme expres m'avoit fait sçavoir le jour qu'il arriveroit, que fust le 17 et en partit le 18. J'ay eu l'honneur de voir Monsieur de la Tour et de m'entretenir quelque temps avec luy. C'est tout ce que je puis vous dire par celle cy, Monsieur, puisque l'ordinaire veut partir, comme je suis arrivé. Celuy de ceste semaine ne m'a aporté aucune de vos despeches. J'attens avec impatience le retour du messagé qui vous porta la mienne du 16 du passé; je suis estonné de ce qu'il retarde tant, je crains que ce ne soit le mauvais temps qu'il aura treuvé à la montagne de Saint Bernard puisque despuis un mois il ne fait quasi que neiger dans ces pays où nous avons encores presentement plus de deux piedz de neige. Vous faisant bien humble reverance comme,Monsieur,Vostre humble, et trés obeissant serviteur, Cize de Gresy. À Lucerne, le 21 Mars 1651."
Il software ha così etichettato le diverse parti del testo:
NOM monsieur; , PUN, je PRO:PER je; ne ADV ne; fai VER: pres. faire; qu'arriver VER:infi <unknown>; de PRP de; Soleurre NAM <unknown>; , PUN,; où PRO:REL où; j'ay NOM <unknown>; esté VER: subi <unknown>; rendre VER:infi. rendre; mes DET:POS mon; devoirs NOM devoir; à PRP à; Monsieur NOM monsieur; de PRP de; la DET:ART le; Barde NAM <unknown>; , PUN ,; et KON et; avec PRP avec; mesme NOM <unknown>; occasion NOM occasion; à PRP à; Monsieur NOM monsieur; le DET:ART le; marquis NOM marquis; de PRP de; Lullin NAM <unknown>; ; PUN ; ;lequel PRO:REL lequel; , PUN,; par PRP par; homme NOM homme; exprés VER:pper <unknown>; m'avoit VER:pres <unknown>; fait VER:pper faire, sçavoir NOM <unknown>; le DET:ART le; jour NOM jour; qu'il ADJ <unknown>; arriveroit ADJ <unknown> , PUN,; que KON que fust NOM <unknown>; le DET:ART le; 17NUM @card@; et KON et; en PRO:PER en; partit VER: simp partir; le DET:ART le; 18.PUN:cit@ord@[…].
TreeTagger se impostato sul francese antico, riconosce nomi di luogo, verbi, pronomi, preposizioni, aggettivi, articoli, congiunzioni, aggettivi possessivi, pronomi, avverbi e segni di punteggiatura. Tuttavia il lemmatizzatore non identifica la negazione "ne" senza l'uso di "pas", il pronome relativo "qu'", non distingue le forme accentate da quelle prive di accento (questo può essere un problema nei casi in cui l'accento indica anche il cambiamento di categoria grammaticale, per esempio "ou" e "où" o "a" e "à"), non individua alcuni sostantivi plurali ma li categorizza come forme verbali (ex: "devoirs" e "devoir"-verbo), non distingue alcuni pronomi possessivi (ex: "mienne"), e confonde l'antica forma verbale "puis" con l'avverbio usato nel francese classico.
Se impostato sul francese moderno, invece, il lemmatizzatore riconosce: sostantivi, articoli, punteggiatura, pronomi personali e relativi, verbi, preposizioni e nomi propri. Permangono, però, degli errori in alcune forme tipiche del francese del Seicento, per esempio: "ay, mesme, fust, despuis, puis, attens" e, come accadeva per il francese antico,il software non riconosce le forme con elisione quali "qu'", "j'".
Del resto, si riscontrano degli errori anche utilizzando un sistema di taggage più specifico, come quello sviluppato dal progetto LGerM dell'ATILF (Lemmes Graphies et Règles Morphologiques) un lemmatizzatore concepito proprio per gestire la variazione grafica storica del francese, sviluppato prima per il "moyen français" (1330-1500) e poi adattato al francese del XVI e XVII secolo.
A livello europeo stanno nascendo molti gruppi di lavoro su quest'ambito, per esempio, l'équipe lionese PRESTO sta affinando una lista di etichette adattate al francese del Seicento, lavorando in collaborazione con linguisti specialisti del "français classique", come il Réseau de Français préclassique et classiques RCFC, che coinvolge i linguisti di cinque università europee. Tuttavia, come è emerso al XVIII Congresso internazionale di filologia e linguistica romanza tenutosi a Roma nel luglio 2016, usando questo sistema di annotazione linguistica nell'analisi permangono ancora molti errori. Per esempio il software non distingue le forme dell'avverbio "dedans" quando esse, come capita nella grafia del tempo, sono scritte "de dans". Nemmeno con le nuove etichette TreeTagger riesce a distinguere lemmi che all'epoca potevano appartenere a due categorie grammaticali diverse, come ad esempio "dedans, dehors, dessous, dessus", che potevano essere sia avverbio che preposizione. Migliorando i criteri di marcatura per quanto riguarda il francese del XVII secolo, molti di questi problemi saranno superati.
In seguito alla realizzazione di questa prima edizione digitale open-source le potenzialità che emergono sono molte: innanzitutto si tratta di un'edizione dinamica e non statica, in cui è possibile inserire le note man mano che la ricerca andrà avanti negli anni; editore e utilizzatore possono interagire col testo edito e, in ottica linguistica, è possibile fare delle interrogazioni sul testo (per esempio recensire tutte le occorrenze di una determinata parola o forma).
Inoltre
"les nouvelles technologies permettent de réaliser des éditions multi-facettes, à la fois normalisées et diplomatiques par exemple"
superando così l'obbligo di scegliere un solo stadio del testo ed evitando i difetti a cui porta l'eccessiva modernizzazione del testo, poiché
"la plupart de ces éditions proposent, à côté d'une ou de plusieurs transcriptions du texte, l'image du manuscrit. Les différents niveaux de transcription peuvent ainsi constituer une progression qui va du niveau le plus fidèle au manuscrit au texte le plus conforme aux normes de l'édition critique traditionnelle. Cette pratique à l'avantage de rendre transparents les choix de l'éditeur."
Una delle difficoltà più importanti con le quali è stato necessario confrontarsi è stata la mancanza di conoscenze informatiche necessarie per utilizzare, modificare e sfruttare software o lemmatizzatori.
Infatti, chi comprende di voler utilizzare strumenti digitali per realizzare edizioni critiche di testi, a partire da documenti inediti che sono stati precedentemente studiati, trascritti ed analizzati, si trova a dover far fronte a tantissime conoscenze di tipo informatico che spesso non sono state precedentemente acquisite. Difficilmente sarà possibile ottenere queste competenze in tempi sufficientemente brevi da poter realizzare integralmente, in autonomia, un'edizione digitale interattiva poiché è evidente che attualmente filologi ed editori raramente possiedono le competenze informatiche necessarie per costruire un'edizione digitale, risulta ancora indispensabile una collaborazione tra il filologo tradizionale e l'informatico. Oggi il primo si dedica soprattutto all'interpretazione, alla trascrizione e all'annotazione del testo, tenendo conto delle esigenze del mezzo digitale; il secondo invece si occupa solitamente di fornire competenze digitali, codificando e implementando le informazioni nel processo di realizzazione dell'interfaccia.
Ma come ha chiaramente spiegato Stephen Ramsay , "Digital Humanities is about building things":
"the discipline includes and should include people who theorize about building, people who design so that others might build, and those who supervise building (the coding question is, for me, a canard, insofar as many people build without knowing how to program). I'd even include people who are working to rebuild systems like our present, irretrievably broken system of scholarly publishing […] But if you are not making anything, you are not […] a digital humanist".
In futuro è quindi auspicabile la diffusione sempre maggiore della professione dell'umanista digitale, uno studioso formato non solo su argomenti inerenti l'edizione di un testo (filologia, linguistica, storia etc.) ma che abbia anche competenze informatiche tali da permettergli, se non di costruire interamente l'edizione digitale, almeno di saper comunicare con quelle figure professionali che lavoreranno alla costruzione dell'edizione.
Per concludere si ritiene necessario evocare due aspetti a cui l'editore dovrà prestare attenzione pubblicando un'edizione digitale. In primis l'edizione sarà un prodotto editoriale che dovrà poter essere fruito dalla comunità scientifica, dovrà poter essere valutato nel curriculum del curatore e quindi dovrà avere un codice ISBN, e come qualunque altra edizione cartacea, dovrà poter essere citato e diventare un modello di riferimento. Così come il testo dell'edizione è in continua evoluzione, anche il mezzo digitale sarà soggetto a incessanti cambiamenti e, quindi, l'editore dovrà provvedere ad associare ad ogni edizione un riferimento di identificazione permanente e univoco (per esempio DOI), per evitare la scomparsa dell'edizione in caso di cambiamenti di URL o chiusura del dominio che le ospita, o per scongiurare variazioni indesiderate in caso di modifiche al layout della pagina web che contiene l'edizione in quanto:
"Il digitale invecchia […] il passare del tempo ha conseguenze importanti sugli oggetti creati e memorizzati. E l'umanista non può e non deve ignorare che, essendo il principale artefice del sistema culturale come processo, il suo ruolo richiede consapevolezza delle tecnologie per la produzione e l'archiviazione delle risorse."
Inoltre, è possibile associare a ogni edizione un codice ISBN, che pur non essendo obbligatorio permetterà di identificare l'opera qualora questa sia pubblicata online e distribuita attraverso i cataloghi delle biblioteche (che dovranno procedere ad acquistare l'ebook dell'edizione nel caso in cui venga messa in commercio).
Oggi alcune università forniscono gratuitamente i codici DOI e ISBN, come per esempio l'Università degli Studi di Torino, che attraverso l'Unità di progetto Open Access permette la pubblicazione di monografie su Collane@UniTO, con assegnazione gratuita di codice ISBN.
A titolo di esempio su ciò che stanno facendo le biblioteche di ateneo in merito alla conservazione di materiali digitali ci sembra interessante segnalare la nascita di SIRIO@UNITO
"una piattaforma destinata a ospitare le riviste scientifiche online dell'Università di Torino, per ogni area disciplinare."
Le università si stanno attivando per permettere la libera fruizione da remoto e la conservazione di risorse digitali, un nuovo progetto attivato presso l'Università degli Studi di Torino è TUTTO: uno strumento che permette di trovare le risorse bibliografiche di UNITO (libri, periodici, ebook, database) a partire da un unico campo di ricerca. Attraverso questa piattaforma l'utente può realizzare ricerche orientate su tutti i contenuti di Ateneo, sul catalogo cartaceo o online. È possibile accedere da remoto, usando le credenziali dell'università alle risorse online di quelle riviste a cui l'ateneo è abbonato. È inoltre possibile esportare i dati delle ricerche e dei documenti selezionati inviandoli all'email o stampandoli in formato RSS. Chiedendo assistenza si potrà dialogare via chat con un operatore bibliotecario per riuscire ad affinare la ricerca.
È bene ricordare che gli eventuali diritti di utilizzo economica dell'opera saranno subordinati all'iscrizione, da parte degli autori, alla SIAE. Se poi l'editore sceglierà di modificare il software utilizzato per realizzare l'edizione (per esempio EVT) egli dovrà tener presente che questo è soggetto a licenza di GNU General Public License version 2.0 (GPLv2), sarà quindi buona norma ridistribuire sul web la parte di software open source con le variazioni approntate.
Si è mostrato che per dei documenti come le corrispondenze, che hanno un valore linguistico oltre che storico, e per un periodo chiave della storia della lingua francese come il Seicento, l'edizione digitale interattiva permette di non perdere informazioni importanti sulla lingua. Questo significa ridefinire e rinnovare le pratiche editoriali. L'editore dovrà presentare e giustificare il suo progetto d'edizione a partire da ciò che egli vorrà offrire ai lettori. Occorre altresì ricordare che un'edizione digitale interattiva non è semplicemente la riproposizione di un'edizione tradizionale su mezzo elettronico, ma un'evoluzione diversa che permette di rendere fruibile e intelligibile il testo a livelli diversi e a seconda delle necessità, superando così il dilemma della scelta tra modernizzazione e conservazione, mantenendo le peculiarità del testo originale.
Ambrosio, Antonella, Sébastien Barret e Georg Vogeler. Digital diplomatics, the computer as a tool for the diplomatist?. Colonia, Weimar, Vienna: Böhlau, 2014. https://doi.org/10.7788/boehlau.9783412217020
Apollon, Daniel, Claire Bélisle e Philippe Régnier, a cura di. Digital critical editions: exploring the interweaving of traditional and digital textual scholarship. Chicago: University of Illinois Press, 2014.
Ayres-Bennett, Wendy. “From l’usage to le bon usage and back: norms and usage in seventeenth-century France.” In Norms and usage in language history, 1600–1900: a sociolinguistic and comparative perspective, a cura di Gijsbert Rutten, Rik Vosters e Wim Vandenbussche, 173–200. Amsterdam: John Benjamins publishing company, 2014.
Capron, Loïc. “Correspondance française de Guy Patin, éditée par Loïc Capron.” http://www.biusante.parisdescartes.fr/patin/?do=pg&let=7003
“Collane@unito.It.” http://www.collane.unito.it/oa/
“Corpus électroniques de la première modernité (CEPM).” http://www.cpem.paris-sorbonne.fr/
Depping, Georges Bernard. Correspondance administrative sous le règne de Louis XIV, entre le cabinet du roi, les secrétaires d’État, le chancelier de France et les intendants et gouverneurs de province.... T. 1, états provinciaux-affaires municipales et communales / recueillie et mise en ordre par G. B. depping. Parigi: Imprimerie nationale, 1850. http://gallica.bnf.fr/ark:/12148/bpt6k204027t
Diwersy, Sascha, Achille Falaise, Marie-Hélène Lay, Gilles Souvay e Denis Vigier. Modèle panchronique d’étiquetage morphosyntaxique pour le français (16e–20e Siècles). Colonia, Nancy, 2014.
Dulong, Claude. Les signes cryptiques dans la correspondance d’anne d’autriche avec Mazarin, contribution à l’emblématique du XVIIe siècle.
Bibliothèque de l’école des chartes 140, num. 1 (1982): 61–83. https://doi.org/10.3406/bec.1982.450256
Falluomini, Carla, a cura di, I longobardi in Italia: lingua e cultura: 15 seminario avanzato in Filologia germanica. Alessandria: Edizioni dell’Orso, 2014. http://www.librinlinea.it/titolo/i-longobardi-in-italia-lingua-e-cultur/CFI0927919
“FRANTEXT.” http://www.frantext.fr/
Gabler, Hans Walter. Theorizing the digital scholarly edition.
Literature compass 7, num. 2 (2010): 43–56. https://doi.org/10.1111/j.1741-4113.2009.00675.x
Guillot, Céline, Alexei Lavrentiev, Thomas Rainsford, Christiane Marchello-Nizia e Serge Heiden. La ‘philologie numérique’: tentative de définition d’un nouvel objet éditorial.
Colonia, Nancy, 2013. https://halshs.archives-ouvertes.fr/halshs-00846767
Hamy, Ernest-Théodore. Correspondance du cardinal Mazarin. Monaco: Imprimerie de Monaco, 1904. http://gallica.bnf.fr/ark:/12148/bpt6k204839d
Sistema bibliotecario d'ateneo università di Torino. 2015. La ricerca con TUTTO.
https://www.youtube.com/watch?v=hFJsiKEFPCE
Lavrentiev, Alexei e Christiane Marchello-Nizia. “Queste del Saint Graal - édition numérique interactive du manuscrit de Lyon (Bibliothèque Municipale, P.A. 77).” http://txm.bfm-corpus.org/
“Les bibliothèques virtuelles humanistes.” http://www.bvh.univ-tours.fr/
“Lexique Morphalou.” Centre national de ressources textuelles et lexicales. http://www.cnrtl.fr/lexiques/morphalou/
Mombello, Gianni, Luca Giachino, Paola Cifarelli, Antonella Amatuzzi, Giorgia Puttero, Laura Ghiosso e Stefania Vignali. La correspondance d’Albert Bailly (1643- 1688). 10 vol. Aosta: Académie Saint-Anselme, 1999.
Numerico, Teresa, Domenico Fiormonte e Francesca Tomasi. L’umanista digitale. Bologna: il Mulino, 2010.
Poncet, Olivier. “La correspondance du chancelier Antoine Du Bourg (1535-1538).” http://elec.enc.sorbonne.fr/dubourg/
“Presto: L’évolution du système prépositionnel du français.” http://presto.ens-lyon.fr/
“Projet textométrie.” http://textometrie.ens-lyon.fr/?lang=fr
Ramsay, Stephen. Who’s in and who’s out
. In Defining Digital humanities: a reader, a cura di Melissa Terras, Julianne Nyhan, Edward Vanhoutte. New York, Londra: Routledge, 2014.
Robinson, Peter. Electronic editions which we have made and which we want to make.
In Digital philology and medieval texts, a cura di Arianna Ciula e Francesco Stella, 1–12. Ospedaletto (Pisa): Pacini Editore, 2007. http://www.infotext.unisi.it/upload/DIGIMED06/book/robinson.pdf
———. Towards a theory of digital editions.
Variants: the journal of the european society for textual scholarship 10 (2013): 105–31.
Rosselli Del Turco, Roberto. The battle we forgot to fight: should we make a case for digital editions?
In Digital scholarly editing: theories and practices, a cura di Matthew James Driscoll e Elena Pierazzo, 219–38. Cambridge: Open Book Publishers, 2016. https://www.openbookpublishers.com/htmlreader/978-1-78374-238-7/ch12.xhtml#_idTextAnchor029
Rosselli Del Turco, Roberto, Giancarlo Buomprisco, Chiara Di Pietro, Julia Kenny, Raffaele Masotti e Jacopo Pugliese. “Edition visualization technology: a simple tool to visualize TEI-based digital editions.” Journal of the Text encoding initiative, num. 8 (2014). https://doi.org/10.4000/jtei.1077
Saulnier, Frédéric e Jean Lemoine. Correspondance du chevalier de Sévigné et de Christine de France, duchesse de Savoie. Parigi: Librairie Renouard H. Laurens, 1911. http://gallica.bnf.fr/ark:/12148/bpt6k5580088r
Shillingsburg, Peter. From Gutenberg to Google: electronic representations of literary texts. Cambridge: Cambridge University Press, 2006.
Siemens, Ray, Meagan Timney, Cara Leitch, Corina Koolen e Alex Garnett. Toward modeling the social edition: an approach to understanding the electronic scholarly edition in the context of new and emerging social media.
Literary and linguistic computing 27, num. 4 (December 1, 2012): 445–61. https://doi.org/10.1093/llc/fqs013
“SIRIO@unito.It - SIstema RIviste Open Access.” http://www.ojs.unito.it/
“TEI: P5 Guidelines for electronic text encoding and interchange.” http://www.tei-c.org/Guidelines/P5
“The ARTFL project ARTFL (american and french research on the treasury of the french language).” http://artfl-project.uchicago.edu/
Trotter, David. Manuel de la philologie de l’édition. Berlino, Boston: De Gruyter Mouton, 2015. https://doi.org/10.1515/9783110302608
“Tutto - Sistema bibliotecario università di Torino.” http://unito-tutto.hosted.exlibrisgroup.com/primo_library/libweb/action/search.do?vid=unito
Ultima consultazione URLs: 12/02/2018
Già nel 2010 si riteneva fondamentale per gli umanisti l'utilizzo di strumenti digitali: "per valorizzare le sue competenze, però, l'umanista ha bisogno di compiere un paso doble, un doppio scarto: riscoprire le proprie radici e aprirsi al rinnovamento. Punto di partenza di questo processo è la consapevolezza che gli umanisti non sono estranei alla storia dell'informatica. […] Gli anni sono passati e è ormai evidente che gli umanisti devono avere una conoscenza informatica per esercitare la propria professione […]. Il sapere umanistico non può più crescere e diffondersi senza l'aiuto degli strumenti di comunicazione, rappresentazione e organizzazione delle informazioni." p.8.
Ibidem, p. 372.
Ibidem, p. 375.
TXM è un software che permette di misurare la frequenza, la distribuzione e il contesto delle parole, confrontando più corpora etichettati e strutturati. Il software permette inoltre di importare risorse testuali al fine di costruire un corpus proveniente da diverse risorse. Verranno costruiti così dei sotto corpora a partire dalle differenti proprietà delle unità testuali. Da queste si costituiranno delle partizioni e si ricaverà un'edizione HTML per ogni unità testuale del corpus. TXM è in grado di calcolare il vocabolario dell'insieme di un corpus o di una lista di valori di un particolare dato. Può costruire delle tabelle lessicali a partire dalle partizioni o dall'indice. Ricerca strutture lessicali complesse costruite a partire dalle proprietà delle unità lessicali e può produrre delle concordanze kwic a partire dai risultati. Per ogni linea di concordanza sarà possibile accedere alla pagina di corrispondenze nell'edizione HTML. TXM può calcolare le occorrenze di una struttura lessicale complessa. All'interno di un sottocorpus calcola il modello di specificità di parole o etichette e può fare l'analisi fattoriale delle occorrenze di proprietà. Calcola, inoltre, la classificazione delle partizioni. La piattaforma TXM è concepita per analizzare e importare tre grandi categorie di corpora testuali: i corpora di testi scritti, incluse le edizioni impaginate, comprendenti immagini di documenti, i corpora di trascrizioni di registrazioni eventualmente sincronizzati con la fonte audio o video. I corpora multilingue, purché abbiano una struttura testuale caratterizzata dalla frase o dal paragrafo. Ogni corpus sarà composto da metadati (autore, titolo, genere, struttura interna e sequenze di parole). L'importazione del corpus sarà l'occasione per dare a ogni parola del testo un lemma e una categoria morfosintattica. Per ulteriori informazioni si consiglia di visitare il sito http://textometrie.ens-lyon.fr
"XML è un metalinguaggio: fornisce cioè una serie di regole utili a creare un numero potenzialmente infinito di linguaggi di markup" È stato scelto questo linguaggio poiché "è la tecnologia attualmente più impiegata per la rappresentazione in formato digitale di documenti e risorse testuali, […] -inoltre è- una sorta di passe-partout che ci permette di realizzare, a partire da un unico formato, tanto contenuti quanto descrizioni di contenuti. […] è uno strumento che nel campo delle digital humanities rappresenta il riferimento principale per la creazione di digital scholarly text, cioè testi elettronici che rispecchino criteri di qualità scientifica" , op. cit., p.131
"Fra gli schemi per XML quello che si è imposto in ambito umanistico è la TEI (Text Encoding Initiative, http://www.tei-c.org), un vocabolario controllato di elementi e attributi utili alla descrizione di oggetti di natura umanistica. Il progetto TEI nasce nel 1987 […] Le Guidelines TEI P1 (Proposal 1) vengono pubblicate nel 1990. Nel 1999 è stato fondato il Consorzio TEI, che ha il compito di mantenere, sviluppare e promuovere lo schema TEI." Ibidem, p. 137
Il corpus di riferimento del progetto franco-tedesco PRESTO (http://presto.ens-lyon.fr) per il periodo XVI - XX secolo è stato costituito grazie a dei testi presi dalle seguenti basi testuali : FRANTEXT (http://www.frantext.fr, V. Montémont, G. Souvay) , BVH (Bibliothèques Virtuelles Humanistes, http://www.bvh.univ-tours.fr - L. Bertrand, M.-L. Demonet) , ARTFL (American and French Research on the Treasury of the French Language, http://artfl-project.uchicago.edu - R. Morrissey, M. Olsen) e CEPM (Corpus électronique de la première modernité, http://www.cpem.paris-sorbonne.fr) . Le risorse e gli strumenti elaborati da PRESTO hanno beneficiato degli apporti dei software LGerM, Analog (M.-H. Lay) e del lessico Morphalou (http://www.cnrtl.fr/lexiques/morphalou) .
Ibidem.
"Il servizio Collane@UniTo fornisce una piattaforma per la pubblicazione online di Collane di Testi o singole monografie Open Access per i Dipartimenti o i Centri di Ricerca dell'Università di Torino. Il software utilizzato è Omeka, che viene illustrato agli interessati in una breve sessione informativa. Alla collana può essere associato un numero di ISSN (International Serial Standard Number). L'assegnazione è gratuita, è sufficiente fare richiesta all'ufficio italiano ISSN, presso il CNR a Roma. Ogni volume può essere dotato di ISBN (International Standard Book Number), purché il frontespizio rechi la dicitura Università degli studi di Torino. L'assegnazione è gratuita." http://www.collane.unito.it/oa/
http://unito-tutto.hosted.exlibrisgroup.com/primo_library/libweb/action/search.do?vid=unito