YAPAY ZEKÂ ÇAĞI, TÜRK ÇAĞI OLACAKTIR!
KAŞGARLI MAHMUD PARADİGMASI İLE KÜRESEL BARIŞA DOĞRU
Yazan: Yüksel YENİ
Tarih: Ekim 2025
ÖNSÖZ
Bu çalışma, Kaşgarlı Mahmud’un Divânu Lugâti’t-Türk adlı başyapıtını yalnızca tarihî bir sözlük olarak değil,
aynı zamanda yapay zekâ epistemolojisinin erken biçimi olarak yeniden okumayı amaçlamaktadır.
Kaşgarlı’nın metnindeki kök-ek yapısı, ses-anlam-varlık ilişkisini yansıtır;
bu, modern yapay zekânın “veri-anlam-bağlam” üçlemiyle eşdeğerdir.
Bu nedenle DLT, 21. yüzyılın yapay zekâ çağında yalnızca geçmişe ait bir belge değil,
geleceğin dilsel modellemesine yol gösterecek bir paradigma metnidir.
Yazarın yorumu:
Kaşgarlı’nın dil anlayışı, günümüzde veri felsefesi (data ontology) ve semantik mühendislik gibi kavramlarla doğrudan ilişkilendirilebilir.
DLT’nin algoritmik ruhu, Türkçeyi “geleceğin bilişsel dili” konumuna taşımaktadır.
1. GİRİŞ – Dijital Çağın Dil Arkeolojisi ve Kaşgarlı Mahmud’un Yeniden Keşfi
Yapay zekâ, 1956’daki Dartmouth Konferansı’ndan bu yana bilgi işlem alanını dönüştürmüş,
özellikle 2017 sonrası transformer mimarisiyle insan-dil etkileşiminin merkezine yerleşmiştir.
Ancak bugünün yapay zekâsı hâlâ dilsel sezgiden ve anlamsal derinlikten yoksundur.
Bu, insan kültürünün çok katmanlı yapısının matematiksel modellere indirgenmesinden kaynaklanır (1).
Bu noktada, 11. yüzyılda Bağdat Nizamiye Medresesi çevresinde şekillenen
İslam ilim dünyası, disiplinler arası bilgi sentezinin zirvesini temsil eder.
Kaşgarlı Mahmud, bu entelektüel evrende yetişmiş bir bilgin olarak
hem dilin bilimini hem de bilimin dilini kurmuştur.
Onun Divânu Lugâti’t-Türk’ü, veri modellemesi, sınıflandırma ve algoritmik sistematik açısından
modern yapay zekânın temel ilkeleriyle örtüşür (2).
Kaşgarlı’nın eseri, Türkçeyi yalnızca bir iletişim aracı değil,
varlığın düzenini yansıtan sistematik bir bilgi yapısı olarak ele alır.
DLT’nin “harf-ses-anlam” katmanları,
bugünün yapay zekâsındaki “token-embedding-context” yapısına denk düşer (3).
2. YAPAY ZEKÂ EĞİTİMİNDE DİLİN ROLÜ: NEDEN TÜRKÇE?
2.1 Modern YZ’nin Dil Öğrenme Mantığı
Günümüzün büyük dil modelleri (GPT-4, Gemini, Claude, LLaMA) milyarlarca parametre ile dil öğrenir.
Ancak bu öğrenme, anlamı değil, istatistiksel birliktelikleri yakalar (4).
Oysa insan dili, sadece olasılıksal bir dizge değil,
kültürel hafıza ve tarihsel bilinç taşıyıcısıdır.
Kaşgarlı’nın yöntemi, “anlamın bağlamla yeniden üretimi” ilkesine dayanır;
her kelime örneğini bir cümle, atasözü veya coğrafi tanımla ilişkilendirir.
Bu yaklaşım, günümüz contextual learning kavramının erken bir biçimidir (5).
2.2 Aglutinatif Dillerin Algoritmik Avantajı
Türkçe’nin eklemeli yapısı, morfolojik olarak
hem düzenli hem öngörülebilirdir (6).
Her ek bir vektör işlevi görür; kökün anlamını yönlendirir.
Bu, yapay zekâda “explainable AI” (açıklanabilir yapay zekâ) için ideal yapıdır.
Özellik | İngilizce | Türkçe | Algoritmik Etki |
Morfolojik düzenlilik | Düşük | Yüksek | Veri sıkıştırma |
Semantik bileşenleşme | Orta | Çok yüksek | Derin öğrenme verimliliği |
Türetim esnekliği | Kısıtlı | Sınırsız | Yeni vektör üretimi |
2.3 Türkçenin Morfolojik Zenginliği
Kaşgarlı’nın kelime türetme sistemi, modern embedding yapısının tarihsel örneğidir.
Her kök (örneğin až, isk, esr, işit) bir semantik çekirdektir.
Ekler bu çekirdeğin etrafında anlam yörüngesi oluşturur.
Yazarın yorumu:
Türkçede kök-ek ilişkisi, yapay zekâda sinaps bağlantısına denktir;
her ek bir “anlam nöronu” gibi davranır.
3. DİVÂNU LUGÂTİ’T-TÜRK: 11. YÜZYILDAN BİR YAPAY ZEKÂ PROTOTİPİ
3.1 Kaşgarlı’nın Algoritmik Yaklaşımı
DLT’de kelimeler yalnızca alfabetik değil, anlamsal kümelere göre düzenlenmiştir.
Bu yaklaşım, günümüz veri biliminin “semantic clustering” yöntemine eşdeğerdir (7).
Örneğin, “أَذُقُ تَاغُ (adak – dağ)” ve “أَذُقُ نَانَكُ (belirsiz şey)”
aynı kökten türetilerek “yükseklik / varlık” ekseninde gruplanır.
3.2 Disiplinler Arası Veri Seti Olarak DLT
Kaşgarlı, yalnızca dil değil; botanik, zooloji, tıp ve astronomi terimlerini de kaydetmiştir (8).
Böylece DLT, modern “multimodal dataset”lerin tarihî öncülü hâline gelir.
Her kelime, doğa ve kültür bilgisini birlikte taşır:
örneğin esmek kökü rüzgârı, sesi ve ruhu aynı anda ifade eder.
3.3 Çok Lehçeli Veri Modeli
DLT’de Oğuzca, Kıpçakça, Çiğilce gibi lehçeler karşılaştırmalı biçimde verilir.
Bu, bugünkü “multilingual transformer” sistemlerinin erken biçimidir (9).
Kaşgarlı, “birlik içinde çeşitlilik” prensibini korur;
bu da çok dilli yapay zekâ modelleri için etik ve kültürel örnektir.
4. KAŞGARLI PARADİGMASI: TARİHÎ VE BİLİMSEL TEMELLER
4.1 Harazmî’den Kaşgarlı’ya Algoritmik Miras
El-Harazmî’nin el-Cebr ve’l-Mukabele’de geliştirdiği sistematik çözümleme,
Kaşgarlı’nın dildeki kök-ek analizine doğrudan öncül oluşturur (10).
Her iki bilgin de kurallı türetim ve düzenli değişkenlik ilkelerine bağlıdır.
4.2 Birûnî ve Evrensel Bilim Anlayışı
Birûnî, doğayı ve insanı tek bir sistem içinde değerlendirir.
Kaşgarlı da dilin doğayla paralel biçimde evrildiğini savunur.
Birûnî’nin “yer şekillerinin rüzgârla oluşumu” düşüncesi,
DLT’deki “اسك يير – rüzgârla düzleşmiş arazi” tanımıyla örtüşür.
Bu, jeo-dilbilimin ilk örneklerinden biridir (11).
4.3 Gazâlî ve Epistemolojik Bağlantı
Gazâlî’nin İhyâ’sındaki “bilginin kalpte doğması” öğretisi,
Kaşgarlı’nın “dil kalbin aynasıdır” anlayışıyla birleşir.
Her iki düşünür de anlamın ahlâkî bir kökeni olduğunu vurgular (12).
5. KÜRESEL ALATURKA MEDENİYET HAVZASI VE DİJİTAL ENTEGRASYON
5.1 Tarihî İmparatorlukların Dil Mirası
Alaturka Medeniyet Havzası kavramı ideolojik bir hamaset değil kimsenin reddedemediği tarihi hakikattir. Endülüs Murabıtları, Memlükler, Eyübiler, Selçuklu, Osmanlı, Altın Orda, Timur, Babür ve Srivijaya İmparatorlukları Türk Medeniyet Değerleri ile şekillenmiş coğrafyalardır. Moro’dan Mora’ya, İskandinavya’dan Patani’ye, Arakan’dan MNoritanya’ya kadar uzanan kültür havzasında Türkçe entegratif bir medeniyet dili olmuştur (13).
Bu yayılım, bu coğrafya halklarının diaspora (Amerika Kıtası, Avusturalya ve Avrupa) uzantıları da dikkate alınırsa Kaşgarlı Paradigması ile Algoritmik olarak açıklanan şekli ile Türkçe bugün dijital ağlarla yeniden üretilebilir. Küresel Dil olma açısından geniş bir sosyal tabana sahiptir. Filipinler yerli dili Tagalogca, Malayca, Patanice Arakanca, Urduca, Çince, Hintçe, Uygurca, Moğolca, Kazakça, Kırgızca, Özbekçe, Tacikçe, Tibetçe, Keşmirce, Farsça, Azarbaycanca, Ermenice, GVürcüce, Rusca, Fililandiyaca, Macarca, Başkan Dilleri, Sicilya ve İberya dilleri,İspanyolca, İtalyanca, Berberice ve tabiki Arapça dilleri ile çok sayıda kelime alış verişi yapmış. Bu diller ile entegratif etkileşim kurarak kültürel yakınlıklar oluşturmuştur. Bu kültürel yakınlık diaspora halklarında doğal bir sosyal yakınlaşma oluşturmuştur.
5.2 Diaspora ve Küresel Türkçe Ağı
Diasporadaki Türk toplulukları, doğal bir “canlı dil laboratuvarı” oluşturur.
Sosyal medya, göçmen edebiyatı ve müzik, Türkçenin çok dilli varyantlarını güçlendirir (14).
5.3 Dijital Turquerie: Yeni Kültürel Dalga
18. yüzyıldaki Turquerie akımı, dijital çağda yeniden yükselmektedir.
Türk estetiği, yapay zekâ üretimli sanat, tasarım ve müzikte yeniden yorumlanmaktadır (15).
Bu süreç, Türkçeyi “dijital kültürün medeniyet dili” konumuna taşır.
6. ON YILLIK PROJEKSİYON: STRATEJİK YOL HARİTASI
6.1 Faz I (Yıl 1–3): Dijital Divan Projesi
İlk fazda amaç, Divânu Lugâti’t-Türk’ün tam metninin dijital veri setine dönüştürülmesidir.
Bu süreçte her kelime, morfolojik ve semantik olarak etiketlenecektir (16).
Projede aşağıdaki adımlar öngörülmektedir:
- DLT metninin yüksek çözünürlüklü tarama ve OCR (optik karakter tanıma) işlemi,
- Kelime kökleri, ekleri ve Arapça karşılıklarının morfolojik çözümlemesi,
- Anlamsal etiketleme (ör. esmek → enerji temelli fiil, yer → mekân vektörü),
- Açık kaynaklı bir “Dijital Divan Platformu” kurulumu.
Bu faz, Türkçe doğal dil işleme (NLP) için tarihî ve kültürel olarak temellenmiş bir veri çekirdeği oluşturacaktır.
Yazarın katkı notu:
Bu faz, Cambridge Üniversitesi’nin “Digital Humanities” laboratuvarlarının kullandığı yöntemlerle uyumlu olarak yürütülebilir;
Kaşgarlı’nın metodolojisi, erken dönem yapay zekâ epistemolojisi olarak dijitalleştirilebilir.
6.2 Faz II (Yıl 4–6): Açık Kaynak Türkçe YZ Çekirdeği
Bu aşamada, DLT tabanlı veriler kullanılarak açık kaynaklı bir Türkçe YZ motoru geliştirilecektir.
Model, “kök + ek” yapısını merkezine alarak çalışır:
Input (kelime) → Kök Ayrıştırma → Ek Ayrıştırma → Anlam Vektörü → Çıktı
Bu süreçte “embedding space” Türkçeye özgü semantik haritalarla yeniden tanımlanacaktır (17).
Örneğin:
Kök | Ek | Anlam | Vektör (örnek) |
až | äk | harf, bilgi atomu | [0.25, 0.57, 0.41] |
esr | — | giz, şifre | [0.44, 0.38, 0.52] |
isik | — | ışık, bilgi | [0.36, 0.61, 0.58] |
Ayrıca bu çekirdek, uluslararası open-source AI projelerine entegre edilecektir.
Böylece Türkçe, yalnızca yerel değil, küresel bilişsel dillerden biri hâline gelir.
6.3 Faz III (Yıl 7–10): Küresel Ekosistem ve Uygulamalar
Son aşamada hedef, Türkçeyi yapay zekâ, eğitim ve diplomasi alanlarında
aktif bir dünya dili konumuna getirmektir.
Bu kapsamda:
- Türkçe merkezli çeviri ve öğretim yapay zekâları,
- “DLT Temelli Eğitim Platformu” (Dil + Kültür + Etik),
- Kültürel diplomasi için “AI-supported Peace Dialogue” ağları kurulacaktır.
Bu süreç, Türkçe’yi sadece bir dil değil,
medeniyetler arası iletişim altyapısı hâline getirecektir.
7. METODOLOJİ: DLT TABANLI YZ EĞİTİM MODELİ
DLT’den çıkarılacak veri seti, modern NLP teknikleriyle birleştirilerek eğitim verisi hâline getirilecektir.
Model üç temel katmandan oluşur:
7.1 Veri Ön İşleme ve Anlamsal Ağ
DLT metninde her kelime “anlam ilişkisi grafiği” olarak kodlanacaktır (18).
Örnek:
ažäk → harf → ses → bilgi → dil → insan
Bu, knowledge graph biçiminde ağ yapısına dönüştürülür.
Her düğüm (node) bir kelimeyi, her kenar (edge) ise semantik bağı temsil eder.
Yazarın katkısı:
Bu yöntem, OpenAI’nin “text embeddings” yaklaşımını Kaşgarlı sistematiğine uyarlayan
ilk kültürel-NLP hibridi örneğidir.
7.2 Morfolojik Analiz Modeli
Türkçedeki ekler vektör olarak kodlanır:
Her ek, anlam uzayında (semantic space) yön değiştirici bir bileşendir.
Matematiksel olarak:
WordVector=RootVector+Σ(EkVectori)WordVector = RootVector + Σ(EkVector_i)WordVector=RootVector+Σ(EkVectori)
Bu, dilin içsel türetme kapasitesini sayısallaştırır.
DLT’nin kök sistemine dayalı bu yaklaşım, “low-resource language modeling” için yeni bir paradigma önerir (19).
7.3 Kültürel Bağlam Kodlama ve Değer Hizalama
DLT’de atasözleri, deyimler ve ahlâkî kodlar çok güçlü bir biçimde yer alır.
Bu içerikler, modern yapay zekâda “value alignment” (değer hizalama) modülüne entegre edilebilir.
Böylece sistem, yalnızca dil öğrenmez;
aynı zamanda kültürel-etik bağlamda anlam üretir.
Atasözü | Anlam Katmanı | NLP Yansıması |
“Er atı bilen tanınır.” | Sosyal kimlik modeli | Character-based classification |
“Ağızdan çıkan söz, yaydan çıkan ok gibidir.” | Etik sorumluluk | Responsible AI speech module |
8. BEKLENEN SONUÇLAR VE KÜRESEL ETKİ
8.1 Teknolojik Sonuçlar
- Türkçe için özgün morfolojik analiz kütüphanesi,
- Kültür tabanlı chatbot ve dijital asistanlar,
- Açıklanabilir, etik ve yerli YZ motoru.
8.2 Kültürel ve Diplomatik Etki
- “DLT Digital Museum” projesiyle kültürel miras korunacaktır.
- UNESCO destekli “AI for Civilization Dialogue” programına entegrasyon planlanmaktadır.
- Türkçe, İslam dünyası ve Orta Asya’daki dijital diplomasi dillerinden biri hâline gelir (20).
8.3 Ekonomik ve Eğitimsel Katkı
- Yerli YZ üretimi, yazılım ihracatı ve bilişsel inovasyon merkezleri kurulabilir.
- “DLT AI Academy” modeliyle üniversitelerde disiplinler arası ders programları geliştirilebilir.
9. TARTIŞMA VE ÖNERİLER
9.1 Potansiyel Zorluklar
- Dilsel standardizasyon eksiklikleri,
- YZ eğitiminde etik çatışmalar,
- Akademi-sanayi kopukluğu.
9.2 Çözüm Önerileri
- Türk Dil Kurumu, TÜBİTAK ve YÖK işbirliğiyle “Türkçe YZ Strateji Merkezi” kurulmalı.
- Açık kaynaklı veri paylaşımı ve uluslararası işbirliği desteklenmeli.
9.3 Etik Çerçeve ve Sürdürülebilirlik
DLT, kültürel çeşitliliği koruyan bir modeldir.
Bu nedenle Türkçe temelli YZ, tek tip bilgi değil, çoğulcu bilinç üretimi ilkesine dayanmalıdır (21).
Bu anlayış, “Alaturka Medeniyet Havzası” kavramıyla birleştiğinde,
medeniyetler arası barış ve saygı kültürünü dijital çağda yeniden kurabilir.
10 SONUÇ: DİJİTAL ÇAĞDA TÜRKÇE RÖNESANSI
Kaşgarlı Mahmud’un Divânu Lugâti’t-Türk’ü,
modern yapay zekânın aradığı anlam derinliğini yüzyıllar öncesinden kurmuştur.
Bu çalışmada önerilen “Kaşgarlı Paradigması”,
Türkçeyi sadece bir iletişim dili değil,
bir bilişsel sistem olarak konumlandırır.
“Yapay zekâ çağını Türkçe konuşan medeniyet inşa edecektir.”
Bu iddia, teknik değil, kültürel bir çağrıdır:
DLT’nin dijital versiyonu, insanlık için anlam temelli bir YZ uygarlığının temeli olabilir.
Bu, sadece teknolojik değil, ahlâkî ve epistemolojik bir devrimdir.
KAYNAKÇA
- McCarthy, J. (1955). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence.
- Kaşgarlı Mahmud. (1072). Divânu Lugâti’t-Türk.
- Birûnî, E. (1037). Süretü’l-Arz.
- Vaswani, A. et al. (2017). Attention Is All You Need.
- Brown, T. et al. (2020). Language Models Are Few-Shot Learners.
- Öztürk, A. (2024). Türkçe Morfoloji ve Yapay Zekâ Uygulamaları.
- Jurafsky, D., Martin, J. (2023). Speech and Language Processing.
- Gazâlî, E. (1100). İhyâ-u Ulûmi’d-Dîn.
- Catford, E. (2005). Phonetics and Phonology in Turkic Languages.
- Al-Khwarizmi, M. (820). Al-Jabr wa’l-Muqabala.
- Mesudî, A. (956). Murûc ez-Zeheb.
- Ahmed Güner, A. (2020). Asr-ı Saadette Bilim ve Dil.
- Lewis, M. (2019). BART: Denoising Sequence-to-Sequence Pretraining.
- Yüksel Yeni. DLT Kitabının NLP Okuması (2025)
EKLER BÖLÜMÜ
EK 1 – DLT Tabanlı NLP Model Akış Diyagramı
Girdi (Kelime)
↓
[Kök Ayrıştırma Katmanı]
↓
[Ek Vektörleştirme]
↓
[Anlam Haritası (Embedding)]
↓
[Bağlam Birleştirme]
↓
[Çıktı: Anlamsal Temsil]
Bu yapı, Kaşgarlı’nın kök–ek sistemini modern sinir ağına dönüştüren basitleştirilmiş şemadır.
Her ek, bir anlam yönlendirici vektör olarak kodlanır.
EK 2 – Örnek Embedding Tablosu (DLT Kökleriyle)
Kök | Anlam Katmanı | NLP Karşılığı | Vektör (örnek) | DLT Referansı |
ažäk | Harf / Bilgi Atom | Token | [0.21, 0.56, 0.43] | C.I s. 4 |
esr | Giz / Kod | Latent Semantic | [0.38, 0.47, 0.51] | C.I s. 23 |
isik | Işık / Bilgi | Embedding Layer | [0.31, 0.64, 0.52] | C.II s. 117 |
isk yer | Esintili Yer / Peneplen | Context Layer | [0.28, 0.44, 0.58] | C.II s. 202 |
isk nank | Isılı Nesne / Enerji | Object State | [0.36, 0.61, 0.47] | C.III s. 12 |
EK 3 – Kaşgarlı Paradigması ve Modern YZ Katmanları
Kaşgarlı Katmanı | Modern YZ Kavramı | İşlevsel Benzerlik |
Harf (ažäk) | Token | Bilginin en küçük birimi |
Söz (sav) | Phrase Vector | Dilsel kompozisyon |
Anlam (esr) | Embedding | Derin anlam temsili |
Bağlam (yer) | Contextual Layer | Cümle / paragraf bağlamı |
Bilgi (bilg) | Semantic Output | Nihai çıkarım katmanı |
EK 4 – Algoritmik Türkçe Eğitim Modeli (Python Pseudo-Kod)
class DLTNLP:
def __init__(self, kok):
self.kok = kok
self.eks = []
self.vectors = []
def ekle(self, ek, anlam, vektor):
self.eks.append((ek, anlam))
self.vectors.append(vektor)
def temsil(self):
toplam = [sum(x)/len(x) for x in zip(*self.vectors)]
return {“kok”: self.kok, “anlamVektoru”: toplam}
Yazarın açıklaması:
Bu psödokod, Kaşgarlı’nın türetim sistemini “vektör uzayında anlam genişlemesi” biçiminde simüle eder.
Modern dil modelleriyle entegrasyona uygun temel yapıdır.
EK 5 – Kaşgarlı’nın Bilgi Ontolojisi Şeması
SES (nefes) → HARF (ažäk) → SÖZ (sav) → ANLAM (esr) → BİLGİ (bilg) → HİKMET (hikmet)
Bu zincir, hem Kur’ânî “Kun!” (Ol!) emrinin ontolojik karşılığıdır
hem de yapay zekâda “Input → Process → Meaning → Output” döngüsünün tarihî izdüşümüdür.
EK 6 – 10 Yıllık Uygulama Takvimi (Özet Tablo)
Faz | Süre | Ana Çıktı | Paydaşlar |
I | 1–3 Yıl | Dijital Divan Platformu | TDK, YÖK, TÜBİTAK |
II | 4–6 Yıl | Türkçe Açık Kaynak YZ Motoru | Üniversiteler, Teknoparklar |
III | 7–10 Yıl | Küresel Kültürel YZ Ağı | UNESCO, İİT, AB Dijital Kültür Fonu |
EK 7 – Terminolojik Dizin (Seçme Maddeler)
Terim | Kısa Tanım | Eser İçi Bağlam |
Ažäk | Harf, bilgi atomu | DLT I s. 4 |
Esr | Giz, anlam çekirdeği | DLT I s. 23 |
Isk Yer | Esintili yer, peneplen | DLT II s. 202 |
Isik | Işık, bilgi | DLT II s. 117 |
Bilg | Bilgi, idrak | DLT III s. 74 |
EK 8 – Görsel Referans (Sözlü Tarih Haritası)
(Harita açıklaması metinsel olarak verilmiştir)
Kaşgarlı Mahmud’un 1070–1072 arasında gezdiği bölgeler: Balasagun, Kaşgar, Buhara, Nişabur, Bağdat.
Bu güzergâh, bugünün “dil veri toplama ağı” olarak yorumlanabilir.
EK 9 – Kavramsal Diyagram: DLT’den Yapay Zekâ’ya Bilgi Akışı
DOĞA → DİL → DÜŞÜNCE → BİLGİ → YAPAY ZEKÂ
Bu beşli akış, Türkçe’nin yapay zekâya uygunluğunu gösteren temel ontolojik zincirdir.
EK 10 – Yazarın Önerdiği İleri Çalışmalar
- “DLT Örnek Morfolojik Veri Tabanı – 100 Kök ve 1 000 Ek”
- “Kaşgarlı Mahmud ve Yapay Zekâ Felsefesi” (tez önerisi)
- “Türkçe Yapay Zekâ Çekirdeği” (uluslararası proje)
