Towards an Automatic Recognition of Mixed Languages: The Case of Ukrainian-Russian Hybrid Language Surzhyk
DOI:
https://doi.org/10.6092/issn.2532-8816/10740Parole chiave:
Mixed Languages, Qualitative analysis, Quantitative analysisAbstract
Il concetto di interferenza linguistica è diventato caratterizzante nelle società multilingue odierne, nelle quali più e più lingue entrano in contatto e portano alla creazione di lingue ibride. Tali lingue, assieme alle discussioni sul loro diritto di essere riconosciute a livello ufficiale, hanno fatto emergere il problema della loro identificazione e elaborazione automatica nell'area della linguistica computazionale. Nel presente articolo proponiamo un primo tentativo di identificare gli elementi di una lingua ibrida ucraino-russa, il suržyk, attraverso l'adozione di regole basate sugli esempi create con gli strumenti del linguaggio di programmazione R. Il nostro studio basato sugli esempi consiste in: 1) analisi delle registrazioni di suržyk parlato raccolte da Del Gaudio (2010) nell'area di Kyjiv e creazione di un corpus scritto; 2) produzione e implementazione di regole specifiche sull’identificazione degli elementi di suržyk; 3) test del codice creato e analisi di efficacia del classificatore della lingua ibrida.
Downloads
Pubblicato
Come citare
Fascicolo
Sezione
Licenza
Copyright (c) 2020 Nataliya Sira, Giorgio Maria Di Nunzio, Viviana Nosilia
Questo lavoro è fornito con la licenza Creative Commons Attribuzione 4.0 Internazionale.