Collatinus
Un coltello svizzero per il Latino
DOI:
https://doi.org/10.60923/issn.2532-8816/23866Parole chiave:
Latino, Analisi morfologica, Intelligenza artificiale, LematizzazioneAbstract
Collatinus è un lemmatizzatore e un analizzatore morfologico per il latino sviluppato da Yves Ouvrard. In origine era pensato per aiutare gli insegnanti a preparare testi con un elenco dei vocaboli e per permettere ai principianti di leggere autonomamente testi latini. Oltre alla traduzione sintetica proposta per ogni parola, Collatinus consente di aprire dizionari, sia digitali che in formato immagine, per ottenere l'informazione completa. Collatinus si fonda su una base lessicale di oltre 80.000 lemmi e su tabelle di flessione. La base lessicale include una traduzione base dei lemmi, principalmente in inglese e in francese. La capacità di dividere una parola flessa nella radice e nella desinenza consente a Collatinus di fornire l'analisi morfologica completa. Poiché la quantità di ciascuna sillaba è indicata nelle sue basi di dati, Collatinus è in grado di fare la scansione di un testo o di indicarne l'accentuazione. Sono stati sviluppati alcuni strumenti esterni aggiuntivi per estendere queste possibilità di base. Collatinus è stato inoltre potenziato con l'intelligenza artificiale (Latin-BERT) affinché scelga la migliore lemmatizzazione ed analisi per ogni parola di un testo, tenendo conto del contesto. L'intelligenza artificiale è stata addestrata sul corpus annotato dal LASLA e il tagger produce una file nello stesso formato APN utilizzato nel corpus LASLA.
Riferimenti bibliografici
[1] Bamman, David, and Patrick J. Burns, "Latin-BERT: A contextual language model for classical philology". arXiv Preprint arXiv:2009.10053. https://doi.org/10.48550/arXiv.2009.10053.
[2] Ghiringhelli, Elena. 2024. "La continuation des Fastes d’Ovide par le Dijonnais Claude-Barthélemy Morisot (1649): introduction et traduction annotée du mois de juillet du calendrier romain". PhD thesis. Université Bourgogne Franche-Comté. https://theses.hal.science/tel-05019439
[3] Jansson, Tore. 1975. Prose Rhythm in Medieval Latin from the 9th to the 13th Century, Almqvist & Wiksell International.
[4] Longree, Dominique, and Fantoli, Margherita. 2023. "LASLAfiles_Latin_APNformat", V1. ULiège Open Data Repository. https://doi.org/10.58119/ULG/QJJ0SA.
[5] Ouvrard, Yves, and Philippe Verkerk. 2014. "Collatinus, un outil polymorphe pour l’étude du latin". Archivum Latinitatis Medii Aevi 72: 305-311. https://www.persee.fr/doc/alma_0994-8090_2014_num_72_1_1156.
[6] Roelli, Philipp, and Jan Ctibor. 2022-2023. "A new version of Corpus Corporum, the Latin full-text database and tool". ALMA 80: 251-266.
[7] Thon, Valérie. forthcoming. Quand écrire, c'est agir. Étude linguistique des lettres de Pierre Damien (XIe siècle). PhD thesis (Liège).
[8] Turcan-Verkerk, Anne-Marie, and Philippe Verkerk. 1996. "Un programme informatique pour l’étude de la prose rimée et rythmée". Le médiéviste et l’ordinateur 33: 41–48. https://hal.science/hal-04394988v1.
[9] Verkerk, Philippe, Yves Ouvrard, Margherita Fantoli, and Dominique Longrée. 2020. "L.A.S.L.A. and Collatinus: A convergence in Lexica". Studi e Saggi Linguistici, 58 (1): 95-120. https://hal.science/hal-02399878v1.
[10] Verkerk, Philippe. 2022-2023. "Elaboration of a practical lemmatizer for Latin using Artificial Intelligence". ALMA 80: 267-294. https://hal.science/hal-04721577v1.
Downloads
Pubblicato
Come citare
Fascicolo
Sezione
Licenza
Copyright (c) 2026 Philippe Verkerk

Questo lavoro è fornito con la licenza Creative Commons Attribuzione 4.0 Internazionale.