Towards an Automatic Recognition of Mixed Languages: The Case of Ukrainian-Russian Hybrid Language Surzhyk

Autori

  • Nataliya Sira
  • Giorgio Maria Di Nunzio Department of Information Engineering, Department of Mathematics, University of Padua, Padua, Italy
  • Viviana Nosilia Department of Linguistics and Literary Studies, University of Padua, Padua, Italy

DOI:

https://doi.org/10.6092/issn.2532-8816/10740

Parole chiave:

Mixed Languages, Qualitative analysis, Quantitative analysis

Abstract

Il concetto di interferenza linguistica è diventato caratterizzante nelle società multilingue odierne, nelle quali più e più lingue entrano in contatto e portano alla creazione di lingue ibride. Tali lingue, assieme alle discussioni sul loro diritto di essere riconosciute a livello ufficiale, hanno fatto emergere il problema della loro identificazione e elaborazione automatica nell'area della linguistica computazionale. Nel presente articolo proponiamo un primo tentativo di identificare gli elementi di una lingua ibrida ucraino-russa, il suržyk, attraverso l'adozione di regole basate sugli esempi create con gli strumenti del linguaggio di programmazione R. Il nostro studio basato sugli esempi consiste in: 1) analisi delle registrazioni di suržyk parlato raccolte da Del Gaudio (2010) nell'area di Kyjiv e creazione di un corpus scritto; 2) produzione e implementazione di regole specifiche sull’identificazione degli elementi di suržyk; 3) test del codice creato e analisi di efficacia del classificatore della lingua ibrida.

Pubblicato

2020-12-31

Come citare

Sira, N., Di Nunzio, G. M., & Nosilia, V. (2020). Towards an Automatic Recognition of Mixed Languages: The Case of Ukrainian-Russian Hybrid Language Surzhyk. Umanistica Digitale, 4(9), 97–116. https://doi.org/10.6092/issn.2532-8816/10740

Fascicolo

Sezione

Articoli