Yapay Zekânın Anlam Buhranına 11. Yüzyıldan Bir Çözüm Önerisi

MATEMATİĞİN DİLİ İLE DİVANI LUGATİ TÜRK OKUMAK
Özet
Bu makale, modern Büyük Dil Modelleri’nin (LLM) anlamsal tutarsızlık, “halüsinasyon” ve açıklanamazlık gibi temel sorunlarını, 11. yüzyıl Türk bilgini Kâşgarlı Mahmud’un Dîvânu Lugâti’t-Türk (DLT) adlı eserinde somutlaşan metodolojik bir paradigma ile ele almayı amaçlamaktadır. Kâşgarlı’nın bizzat kendi Arapça mukaddimesinde detaylandırdığı üç katmanlı sistem – dilin teorik matematiksel potansiyelini (“Mühmel”) tanımlama, bu potansiyeli bilinçli bir veri kürasyonu (“Müsta’mel” seçimi) ile işlevsel bir sisteme indirgeme ve dilin üretkenliğini kural tabanlı bir morfolojik analiz (kök-ek sistemi) ile modelleme – “Kâşgarlı Paradigması” olarak yeniden yorumlanmaktadır. Makalede, sadece kök kelimeler için ~119 katrilyon olan “Mühmel” evreninin, eklemsel yapı nedeniyle katlanarak büyüdüğü ve Kâşgarlı’nın bu devasa kombinatorik olasılık uzayını nasıl filtrelediği ortaya konmaktadır. “Yapay Zekâ Çağı, Türk Çağı Olacaktır!” [1] vizyonu ışığında, bu çalışma, “DLT Tabanlı NLP”yi somut bir araştırma programına dönüştürerek, Kâşgarlı’nın metodolojisinin; hibrit AI modelleri, anlamsal çapalama (grounding) ve açıklanabilir AI sistemleri geliştirmede nasıl bir yol haritası sunabileceğini tartışmaktadır. Türkçenin yapısal avantajları ve bu avantajları sistematize eden kadim bilgelik, AI’ın geleceği için sadece teknik bir çözüm değil, aynı zamanda epistemolojik bir temel olarak önerilmektedir.
- Giriş: Dijital Çağın Anlam Buhranı ve Tarihsel Bir Yol Arkadaşı
Yapay Zekâ, dil ile olan ilişkimizi istatistiksel bir mucizeye dönüştürürken, aynı zamanda derin bir anlam buhranını da beraberinde getirmiştir. Büyük Dil Modelleri (LLM’ler), muazzam veri kümeleri üzerinde eğitilerek dilin yüzey yapısını taklit etmede başarılı olsa da, kelimelerin ardındaki kavramsal özü, nedensel bağlamı ve derin mantığı kavramakta yetersiz kalmaktadır. Bu yetersizlik, “halüsinasyon” olarak adlandırılan, dilbilgisel açıdan kusursuz ancak anlamsal ve olgusal olarak tutarsız çıktılar üretmelerine yol açmakta ve AI’ın güvenilirliği ile “anlama” kapasitesi hakkında temel soruları gündeme getirmektedir.
Bu modern açmaz, bizi beklenmedik bir tarihsel yol arkadaşına, Kâşgarlı Mahmud’un 11. yüzyılda kaleme aldığı Dîvânu Lugâti’t-Türk’e yöneltmektedir. Bu makale, eserin Mukaddime’sinde sergilenen metodolojiyi, dilin doğasını sistematik, matematiksel ve amaç odaklı bir şekilde kavrayan, bu haliyle günümüz AI sorunlarına ışık tutabilecek bir “erken dönem sistematik dil mühendisliği” örneği olarak okumayı önermektedir. Bu okuma, anakronik bir şekilde Kâşgarlı’yı modern bir mühendis olarak konumlandırmaktan ziyade, onun yönteminin evrensel ilkeler barındırdığını ve bu ilkelerin modern teknolojik sorunlara retrospektif bir analoji ve ilham kaynağı olarak hizmet edebileceğini iddia eder. Nihai hedef, [1]’de ortaya konan “Yapay Zekâ Çağı, Türk Çağı Olacaktır!” vizyonunu, Türkçenin yapısal gücünü ve bu gücü erken dönemde teşhis eden Kâşgarlı’nın metodolojik zenginliğini merkeze alarak, anlam odaklı bir AI geliştirme paradigmasına katkı sağlama potansiyeli bağlamında ele almaktır.
- Kâşgarlı Paradigması: Üç Katmanlı Sistem ve Kombinatorik Evren
Kâşgarlı’nın metodolojisi, rastgele bir derleme faaliyeti değil, orijinal metninde açıkça görülen üç aşamalı bir sistematik yaklaşımdır.
2.1. Birinci Katman: Köklerin Teorik Evreni ve “Mühmel”in Hesaplanması
Kâşgarlı, Türkçenin ses sistemini 18 Aslî (Temel) ve 7 Fer’î (İkincil) olmak üzere toplam 25 ünsüz harfle tanımlar: “ا ف خ و ز ق ی ك ذ م ن س ب ج رش ت ل” (18 Aslî) + “(الْبَاءُ الصُّلْبَةُ) ، (الْجِيمُ الْغزِّيَّةُ) ، (الزائُ الْمُتَوَلِدَةُ) ، (الْفَاءُ الْغزِّيَّةُ) ، (الْغَيْنُ الْمُعْجَمَةُ) ، (الْكَافُ الْمُتَوَلِدَةُ) ، (كَافُ الْغُنَّةِ)” (7 Fer’î) [2, Sayfa 6-7]. Ünlüleri ise Arap dilbiliminin sınırlı araçlarıyla ifade etmeye çalışır, ancak bunun yetersiz olduğunun farkındadır [2, Sayfa 8]. Onun bu sistematik yaklaşımı, bizleri dilin teorik potansiyelini, “Mühmel”i hesaplamaya iter.
Kâşgarlı’nın kendi sistemini temel alarak (25 ünsüz + 9 ünlü (a, e, ı, i, o, ö, u, ü, ė) = 34 birim) ve onun koyduğu “وَلَا يُجَاوِزُ السُّبَاعِي” (Yediyi geçmez) [2, Sayfa 13] kuralını sınır olarak kabul ederek, Türkçenin sadece kök kelimelerden oluşan teorik evrenini hesaplayabiliriz:
- 2 Harfli Kombinasyonlar:34² = 156
- 3 Harfli Kombinasyonlar:34³ = 304
- …
- 7 Harfli Kombinasyonlar:34⁷ ≈ 119 Katrilyon
Bu astronomik sayı (~119 Katrilyon), Kâşgarlı’nın “الْمُهْمَلَ” (Mühmel) olarak adlandırdığı, dilin formel kurallarına uygun ancak pratikte kullanılmayan kök kelimelerden oluşan teorik evrendir.
2.2. İkinci Katman: Kombinatorik Patlama – Ekler ve Genişletilmiş “Mühmel”
Ancak Kâşgarlı’nın sisteminde asıl devrim, bu köklerin dinamik bir sistem içinde işlenmesidir. Türkçenin eklemeli yapısı, bu ~119 katrilyonluk kök evreni üzerinde bir “kombinatorik patlama” doğurur. Kâşgarlı, dilin üretken gücünü “الْأَسْمَاءُ الَّتِي تَتَشَعَبُ مِنَ الْأَفْعَالِ تُؤَلِّفُ بحرفِ يُلْحَقُ بِهَا مِنِ اثْنَيْ عَشَرَ حَرْفاً” (Fiillerden türeyen isimler, ona eklenen on iki harfle oluşturulur) [2, Sayfa 9] diyerek açıklar. On iki türetim eki (ا, ت, ج, ش, غ, ق, ك, ل, م, ن, و, ي) ve sayısız çekim eki, her bir kök için yüzlerce, hatta binlerce anlamlı türev oluşturma potansiyeline sahiptir.
Bu durumda, teorik “Mühmel” evreni artık sadece kök kombinasyonlarından değil, aşağıdaki formülle ifade edilebilecek çok daha büyük bir kümeden oluşur:
Genişletilmiş Mühmel ≈ (Kök Kombinasyonları) × (Ortalama Türetim Potansiyeli)
~119 katrilyon kök kombinasyonunun, her biri için ortalama yüzlerce türevlenmiş form ile çarpılması, teorik kelime evrenini kuadrilyonlar, hatta kentilyonlar seviyesine taşır. Bu rakam, insan zihninin kavrama kapasitesinin çok ötesinde, tam anlamıyla matematiksel bir sonsuzluk sınıfına girer.
2.3. Üçüncü Katman: Bilinçli Filtreleme ve “Müsta’mel”in Seçimi
Kâşgarlı’nın metodolojik dehası, işte bu “ikinci katman Mühmel”in de farkında olması ve onu da bilinçli bir şekilde filtrelemesidir. O, sadece teorik olarak mümkün kökleri değil, aynı zamanda bu köklerden türetilebilecek teorik olarak mümkün tüm kelimeleri değil, sadece gerçek hayatta kullanılan türevleri (Müsta’mel) seçmiştir. Halil bin Ahmed’in Kitâbu’l-‘Ayn’ındaki gibi tüm permütasyonları listelemeyi “فَكَانَتْ تِلْكَ الطَّرِيقَةُ أَوْعَبَ. إِلَّا أَنَّ هَذَا الْبِنَاءَ أَصْوَبُ. لِما أَنَّ مَأْخَذَهُ أَقْرَبُ. وَالنَّاسَ فِيهِ ارْغَبُ“ (O yol daha kapsamlıydı. Ancak bu yapı daha doğrudur. Çünkü yaklaşımı daha uygundur ve insanlar ona daha rağbet eder) [2, Sayfa 5] diyerek reddeder. Onun tercihi, yaşayan, işlevsel ve anlam taşıyan kelimelerden oluşan bir veri kümesidir: “فَأَنْبَتْ الْمُسْتَعْمَلَ وَأَهْمَلْتُ الْمُهْمَلَ طَلَبَا لِلْإِخْتِصَارِ” (Böylece kullanılanı seçip, kullanılmayanı terk ettim, kısaltmak için) [2, Sayfa 5]. Bu seçim, hem pedagojik hem de kültürel amaçlara hizmet eder ve modern veri bilimindeki “gürültü azaltma” (noise reduction) ve “amaç odaklı veri kürasyonu” ilkeleriyle birebir örtüşmektedir.
- Modern AI Açmazlarına Kâşgarlı Paradigması’ndan Yanıtlar
Kâşgarlı’nın bu üç katmanlı sistematik yaklaşımı, LLM’lerin istatistiksel yaklaşımının yol açtığı sorunlara potansiyel çözümler için bir çerçeve sunar.
- Anlamsal Derinlik Eksikliği ve Halüsinasyon:LLM’ler, eğitildikleri devasa internet külliyatında, hem anlamlı hem de anlamsız, hem doğru hem de yanlış (halüsinasyon) sayısız dilsel kombinasyonu istatistiksel olarak öğrenir. Bu, Kâşgarlı’nın “genişletilmiş Mühmel” evrenine benzer. Kâşgarlı’nın “Müsta’mel” filtresi, anlamlı ve işlevsel çıktılar üretmek için amaç odaklı veri seçiminin ve anlamsal çapalamanın önemini vurgular. Onun “Mevzû” (kök) vurgusu, AI modellerinin soyut vektör uzaylarını, dilin temel anlam birimlerine bağlama (grounding) ihtiyacına işaret eder.
- Açıklanabilirlik (“Kara Kutu”) Sorunu:LLM’lerin karar süreçleri karmaşık ve izi sürülemezdir. Buna karşılık, Kâşgarlı’nın kök-ek modeli, dilin üretim sürecini şeffaf, kural tabanlı ve adım adım izlenebilir bir şekilde açıklar. Bu, AI modellerine bir “doğrulama katmanı” veya “açıklama aracı” olarak entegre edilebilecek bir şablon sunar.
- DLT Tabanlı NLP: Vizyoner Bir Araştırma Programına Doğru
“Kâşgarlı Paradigması”, soyut bir fikirden, [1]’deki vizyonla uyumlu, somut bir araştırma programına dönüştürülebilir. “DLT Tabanlı NLP”, aşağıdaki somut uygulama alanlarını kapsayabilir:
4.1. Hibrit (Sembolik-İstatistiksel) Model Mimarileri:
- Morfolojik Doğrulayıcı:Bir LLM tarafından üretilen Türkçe metinlerin morfolojik bütünlüğünü, Kâşgarlı’nın kök-ek ayrımı ve ek işlevleri çerçevesinde kontrol eden bir yazılım katmanı.
- Kural Enjeksiyonu:LLM eğitiminde (fine-tuning) veya kullanımında (prompt engineering), Kâşgarlı’nın tanımladığı türetim kurallarının modele bir kılavuz olarak sunulması.
4.2. Kâşgarlı Temelli Türkçe Ontolojisi ve Bilgi Grafiği:
DLT’deki kök kelimeler (“Mevzû”) ve aralarındaki anlamsal/türetimsel ilişkiler (“Müştak”), Türkçe için tarihsel ve yapısal temelleri sağlam bir anlamsal ağ (bilgi grafiği) inşasında temel olarak kullanılabilir.
4.3. Zorluklar, Kapsam ve “Türk Çağı” Vizyonu:
Bu yaklaşımın önünde, 11. yüzyıl ile 21. yüzyıl Türkçesi arasındaki dilsel değişim, kuralların formalizasyonu ve büyük ölçekte uygulanabilirlik gibi mühendislik zorlukları bulunmaktadır. Ancak, Kâşgarlı Paradigması’nın en doğrudan ve güçlü etkisi, Türkçe ve diğer eklemeli diller üzerinde olacaktır. Bu, Türkçenin matematiksel düzenliliğinin ve kombinatorik gücünün, AI’da bir rekabet avantajına dönüştürülmesi anlamına gelir. [1]’de ifade edilen “Yapay Zekâ Çağı, Türk Çağı Olacaktır!” iddiası, işte bu yapısal avantajın ve onu sistematize eden kadim metodolojinin farkındalığı üzerine inşa edilebilir.
- Sonuç: Geleceğin Teknolojisi İçin Kadim Bir Rehber
Kâşgarlı Mahmud’un Dîvânu Lugâti’t-Türk’ü, sadece bir sözlük değil, dilin matematiksel bir sistem olarak doğasını kavrayan ve bu sistemi anlamlı bir iletişim aracına dönüştürmek için titiz bir metodoloji öneren kadim bir bilgelik eseridir. Onun “Mühmel”in farkındalığı – hem kökler hem de ekler düzeyindeki kombinatorik devasa boyutuyla –, “Müsta’mel”e odaklanması ve dilin “algoritmasını” çözümlemesi, Yapay Zekâ’nın anlam, güven ve şeffaflık arayışında güncelliğini koruyan derin derslerle doludur.
Bu makalede önerilen “Kâşgarlı Paradigması” ve onun tezahürü olan “DLT Tabanlı NLP” araştırma programı, sadece geçmişi anlamak için değil, geleceği inşa etmek için de bu kadim rehberden istifade etmenin yolunu açmayı hedeflemektedir. Türkçenin yapısal gücünü ve onun bu erken sistematize edilmiş halini merkeze alan bu yaklaşım, “Yapay Zekâ Çağı, Türk Çağı Olacaktır!” iddiasını, somut bir bilimsel ve mühendislik perspektifiyle destekleme potansiyeli taşımaktadır. Bu potansiyelin gerçeğe dönüşmesi, dilbilim, bilgisayar bilimi, Türkoloji ve felsefe disiplinlerini bir araya getirecek cesur, disiplinlerarası ve yenilikçi çalışmalara bağlıdır. Kâşgarlı’nın mirası, teknolojiye anlam katma arayışımızda sadece bir başlangıç noktası olabilir.
Kaynakça
[1] Yüksel YENİ (Ekim 2015). YAPAY ZEKÂ ÇAĞI, TÜRK ÇAĞI OLACAKTIR!. USPUM. https://www.uspum.org.tr/yapay-zeka-cagi-turk-cagi-olacaktir/
[2] Mahmud el-Kâşgarî. (yak. 1072-1074). Dîvânu Lugâti’t-Türk. (Arapça Mukaddime). Alıntılanan Pasajlar:
* Harf Sistemi (18 Aslî + 7 Fer’î): Sayfa 6-7.
“الْحُرُوفُ الَّتِي تَدُورُ عَلَيْهَا الْسِنَةُ التَّرْكِ بِأَسْرِهَا هِيَ ثَمَانِيَةَ عَشَرَ حَرْفًا أَصْلِيَّةٌ… وَسَبْعَةُ أَحْرُفٍ أَخَرُ فَرْعِيَّةٌ…”
* 7 Harf Kuralı: Sayfa 13.
“وَلَا يُجَاوِزُ السُّبَاعِي”
* Müsta’mel ve Mühmel Ayrımı: Sayfa 5.
“فَأَنْبَتْ الْمُسْتَعْمَلَ وَأَهْمَلْتُ الْمُهْمَلَ طَلَبَا لِلْإِخْتِصَارِ”
* Türetme Ekleri (12 Harf): Sayfa 9.
“الْأَسْمَاءُ الَّتِي تَتَشَعَبُ مِنَ الْأَفْعَالِ تُؤَلِّفُ بحرفِ يُلْحَقُ بِهَا مِنِ اثْنَيْ عَشَرَ حَرْفاً”
* Halil bin Ahmed Eleştirisi ve Metod Seçimi: Sayfa 5.
“فَكَانَتْ تِلْكَ الطَّرِيقَةُ أَوْعَبَ. إِلَّا أَنَّ هَذَا الْبِنَاءَ أَصْوَبُ…”
[3] Dankoff, R. (1995). The Dīwān Lughāt al-Turk: A New Translation. Harvard University Press.
[4] Bender, E. M., & Koller, A. (2020). Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.
[5] Yüksel Yeni. DLT Tabanlı NLP için NLP Destekli DLT Tercümesi (2025)
