20-30 yıl önce ilk çıktıklarında Google gibi arama motorları, sonrasında ise Facebook veya Twitter gibi sosyal medya platformları, hevesli internet kullanıcılarının elinde yeni birer oyuncaktı. Bugün dünyada kuralları koyan, iktidarları belirleyen, insan ilişkilerinin yönünü tayin eden güçler haline geldiler. Bugün yine bize oyuncak gibi gelen ChatGPT gibi yapay zekâ büyük dil modelleri de yakın zamanda benzer bir konuma gelebilir mi?
Büyük dil modeli kurmak için üç ana girdiye ihtiyacınız var: İnsan kaynağı, işlemci altyapısı ve veri. İyi yetişmiş insan kaynağı ile modellerinizi kuruyorsunuz. Sonra bulabildiğiniz kadar metin veya resim gibi birçok veriyi bu modellere yükleyerek onları eğitiyorsunuz. Bunun için de çok sayıda işlemci gerekiyor. Gelin bu üç unsura tek tek bakalım.
Büyük dil modeli kurmak teknik açıdan zor bir iş. Bu işleri bilen insan kaynağı kıt. Öte yandan bu insanları çalıştırmak için çok para lazım. Ama para da yetmiyor. Bu adamların, ki çoğu da adam, yaptığı işi, şirketi ve patronlarını da sevmeleri gerekiyor. Bu nedenle Kasım ayında ChatGPT’nin sahibi olan OpenAI’ın yönetim kurulu, şirketin CEO’sunu görevden alınca çalışanlar rahat rahat “biz de gidiyoruz” deyip Sam Altman’ı tekrar başa geçirebildi. İnsan kaynağının nerede olduğunu anlamanın en iyi yolu, büyük dil modelleriyle ilgili bilimsel yayın sayısına bakmak. 2022’de bu alandaki yayınların %70’inden fazlası ABD’den yapılmış. Çin’de ve İngiltere’de yapılan yayınların payı ise sırasıyla %20’ler ve %10’lar civarında. Diğer ülkelerde pek bir şey yok. Daha önemlisi, bu yayınların en çok yapıldığı 10 kuruluştan 6’sı özel şirket. Yani aslan payı üniversitelere ait değil, bu kaynağı kendi menfaatlerine göre kapalı kapılar ardında tutan özel şirketlerin. Google tek başına yayınların %30’a yakınını yapmış. Demek ki, büyük dil modellerine dair insan kaynağı ve bilgi giderek gelişmiş ülkelerin özel şirketlerinde toplanıyor.
İkinci olarak, büyük dil modellerini eğitmek ve çalıştırmak için büyük işlemci yatırımları yapmanız gerekli. Bu işlemcilerde çalışan çiplerin neredeyse tamamına yakınını Nvidia isimli Amerikan şirket tasarlıyor. Öyle bakkala gider gibi Nvidia’nın kapısını çalıp da çip alamıyorsunuz. Üretim kısıtlı olduğu için sıraya girmeniz lâzım. Çipleri alıp, bulut bilişimde büyük veri merkezlerini kuranlar yine Amerikalı şirketler. Amazon, Microsoft ve Google, dünyada 600 milyar dolarlık bulut pazarının neredeyse tamamını kontrol ediyor. Her biri de yeni çıkan büyük dil modeli şirketlerinin yatırım yapıyor. Mesela Microsoft, OpenAI’ın en büyük yatırımcısı. Aynı zamanda yapay zekâ alanındaki önemli teknoloji şirketlerinden Inflection.AI’ın da yatırımcısı. Inflection.AI Google da; Google, Hugging Face’te; Amazon ise Anthropic’te yatırımcı. Yani son birkaç aydır büyük dil modeli işinde çok fazla startup ismi duyup, rekabetin çok keskin olduğunu sansak da bunlar bir şekilde dev teknoloji şirketlerinin güdümüne girebilir.
Üçüncü olarak, büyük dil modellerini eğitmek için çok fazla veriye ihtiyaç var. Dünyadaki yazılı metinlerin, özellikle de dijitalleştirilenlerin büyük kısmı İngilizce. OECD’ye göre, büyük dil modellerinin eğitiminde kullanılan metinlerin yaklaşık %40’ı İngilizceymiş. Bu oran, Almanca için %5, Fransızca ve Türkçe için ise sırasıyla %4 ve %2’ymiş. ChatGPT’nin İngilizce verdiği cevaplarla Türkçe verdiği cevaplar arasındaki kalite farkı buradan ileri geliyor. Zaten siz de GPT’nin Türkçe cevaplarının bozuk bir plaza Türkçesi olduğunu fark etmişsinizdir (Gerçi yine de İstanbul’da işe alacağınız üniversiteden yeni mezun bir çalışandan daha iyi olabilir. En azından metrobüsle seyahat çok uzun sürüyor gibi şikayetleri yok). Ne yazık ki, bazı büyük dil modellerinde Türkçe hiç çalışmıyor. Barcelona Üniversitesi’ndeki hocalar, çeşitli modelleri İngilizce, Almanca, Fransızca, İspanyolca, Katalonca ve Türkçe dillerini kullanarak test edip sonuçları karşılaştırmışlar. En kötü sonuçlar ise Türkçe’de çıkmış!
Aynı insanlar gibi büyük dil modellerinin söyleyecekleri eğitildikleri dillerin dayandığı kültür ve değerler dünyasını yansıtıyor. Önümüzdeki dönemde Kaliforniyalı, beyaz erkeklerin düşünce dünyasının egemenliği, büyük dil modelleri ile daha da güçlenecek. Bunların bazıları, Microsoft’un CEO’su gibi etnik olarak Hintli olabilir. Ama yine de birçoğu aynı değerler sisteminin içinde yoğurulmuş kişiler.
Türkiye gibi küresel sistemin merkezinde değil de çevresinde yer alan ülkeler, eğer gerekli tedbirleri almaz ve kimlerle ortak hareket edeceğine karar veremezse, büyük dil modeli ekonomisinde daha da çevreye itilmeye mahkûm olacak. Bunun bir sonucu olarak, bizler de kuralların başka yerlerde, çoğunlukla da demokratik olmayan şekillerde konduğu bir dünyada yaşamaya devam edeceğiz.