Kapsam
Araştırma, bir doktora tez konusu olup, Kosova Türkçesinin Türkiye Türkçesine nasıl dönüştürüleceği araştırma sorusu kapsamında sürdürülmektedir.
Bu araştırmanın ana odağı, her ikisi de doğal dil işleme (NLP) topluluğunda düşük kaynaklı diller olarak kabul edilen Kosova Türkçesi ve Türkiye Türkçesi arasında bir makine çevirisi modeli geliştirmektir. Düşük kaynaklı diller, sağlam NLP modellerinin oluşturulmasını engelleyen kapsamlı veri kümelerinin ve dilbilimsel kaynakların eksikliğinden muzdariptir. Bu araştırmanın ele aldığı sorun, Kosova'daki Türk topluluğu ve Türkçe konuşan diğer topluluklar tarafından konuşulan bir Türkçe ağızlar bütünü olan Kosova Türkçesi için dilbilimsel kaynakların azlığı ve Kosova Türkçesi ile Türkiye Türkçesi arasında verimli çeviri modelleri oluşturmanın zorluğudur. Araştırma, makine öğrenimi algoritmaları ve modern NLP tekniklerini kullanarak, ağızlar arasında metinleri doğru bir şekilde çevirebilen bir makine çevirisi modeli oluşturmayı amaçlamaktadır.
Bu projenin metodolojisi, her iki ağız için paralel derlemlerin toplanmasını, makine çevirisi modellerinin eğitilmesini, BLEU ve ROUGE gibi NLP ölçütleri kullanılarak performanslarının değerlendirilmesini içermektedir. Türkçenin morfolojik karmaşıklığı ve Kosova Türkçesi için sınırlı miktarda sayısallaştırılmış dilbilimsel veri mevcut olduğu göz önüne alındığında, sinirsel makine çevirisi (Neural Machine Translation) yöntemiyle geliştirmeye odaklanmaktadır. Beklenen sonuçlar arasında Kosova Türkçesi için zenginleştirilmiş bir veri kümesi, sağlam bir çeviri modeli geliştirilmesi, azınlık dillerinin korunması ve çevirisi alanında çalışan araştırmacılar ve kurumlar için dijital bir platform oluşturulması yer almaktadır.