Büyük Dil Modellerindeki Kültürel Yanlılık: "WEIRD" Psikolojisinin Bilimsel ve Etik Sonuçları
1. Giriş: "Hangi İnsanlar?" Sorunsalı ve Yapay Zekanın Evrensel Olmayan Psikolojisi
Büyük Dil Modellerinin (LLM'ler) yeteneklerinin "insan seviyesinde" olduğu yönündeki beyanlar, teknoloji dünyasını büyüleyen tehlikeli ve baştan çıkarıcı bir aşırı basitleştirmedir. GPT-4 gibi sistemlerin performansı, zorlu profesyonel ve akademik ölçütlerde insanlarla kıyaslanarak sunulurken, bu karşılaştırmalar temel bir soruyu gölgede bırakmaktadır: Bu modellerin taklit ettiği veya ulaştığı iddia edilen "insan" standardı, gerçekte kimi temsil etmektedir? Bu rapor, bu tehlikeli genellemeye karşı kritik bir entelektüel müdahale olarak şu soruyu sorar: Hangi insanlar?
İnsan psikolojisi, küresel ölçekte yekpare bir yapıdan uzaktır. Kültürler arasında sosyal tercihler, işbirliği, ahlaki yargılar, etik karar verme mekanizmaları, düşünce tarzları, kişilik özellikleri ve benlik algısı gibi temel alanlarda derin ve sistematik farklılıklar bulunmaktadır. İnsanlığı tekil bir kategori olarak ele almak, bu zengin çeşitliliği göz ardı ederek yanıltıcı bir evrensellik varsayımına yol açar. Bu raporun amacı, günümüzün önde gelen LLM'lerinin, psikolojik olarak küresel bir aykırı değer olan belirli bir insan grubunun zihinsel ve davranışsal eğilimlerini yansıttığını kanıtlamaktır. Bu grup, sosyal bilimlerde "WEIRD" olarak adlandırılan ve dünya nüfusunun küçük bir azınlığını oluşturan toplumlardır. Bu yanlılığın merkezinde, küresel psikolojide aykırı bir değer teşkil eden WEIRD psikolojisi kavramı yatmaktadır.
2. "WEIRD" Yanlılığının Kaynağı: Batılı, Eğitimli, Sanayileşmiş, Zengin ve Demokratik Psikoloji
LLM'lerde gözlemlenen kültürel yanlılığın kökenini anlamak için, bu modelleri besleyen verilerin doğasını incelemek kritik bir öneme sahiptir. Modellerin kavramsal çerçevesini şekillendiren temel hammadde olan eğitim verilerinin ezici çoğunluğu, belirli bir psikolojik profile sahip toplumlardan gelmektedir. Bu durumu açıklamak için kullanılan anahtar kavram **"WEIRD"**dir.
"WEIRD" kısaltması, Western (Batılı), Educated (Eğitimli), Industrialized (Sanayileşmiş), Rich (Zengin) ve Democratic (Demokratik) toplumları tanımlar. Kültürel psikoloji araştırmaları, bu toplumların küresel ve tarihsel bağlamda psikolojik olarak birer aykırı değer (outlier) olduğunu ortaya koymaktadır. WEIRD bireyler, dünyanın geri kalanına kıyasla daha bireyci, bağımsız ve kişisel olmayan bir temelde toplum yanlısı (örneğin, yabancılara güvenme eğilimi) olma eğilimindedir. Aynı zamanda ahlaki olarak daha az dar görüşlü, otoriteye daha az saygılı, daha az konformist ve yerel gruplarına daha az sadıktırlar. Bu psikolojik özellikler, evrensel "insan" doğasının bir yansıması değil, belirli kültürel ve tarihsel süreçlerin bir ürünüdür.
LLM'ler bu yanlılığı birkaç temel mekanizma aracılığıyla edinir:
- Veri Kaynağı: Eğitim verilerinin büyük bir kısmı, internetten toplanan metinlerden oluşur.
- Dijital Uçurum: İnternet erişimi ve dijital içerik üretimi, WEIRD toplumlarda orantısız bir şekilde daha yüksektir. Birleşmiş Milletler verilerine göre, dünya nüfusunun neredeyse yarısı hala internete erişememektedir.
- Dilsel Hakimiyet: İngilizce, dil teknolojilerinde ezici bir hakimiyete sahiptir ve bu durum, İngilizce konuşan WEIRD kültürlerin norm ve değerlerinin daha fazla temsil edilmesine yol açar.
Bu dinamik, makine öğrenmesindeki "Garbage In, Garbage Out" (Çöp Girdi, Çöp Çıktı) deyişinin psikokültürel bir uyarlaması olarak özetlenebilir: "WEIRD in, WEIRD out" (WEIRD Girdi, WEIRD Çıktı). Modele hangi kültürel grubun verisi ağırlıklı olarak girerse, modelin çıktıları da o grubun psikolojik özelliklerini yansıtacaktır. Bu teorik çerçeve, LLM'lerin psikolojisini doğrudan ölçen ve bir sonraki bölümde sunulacak olan ampirik bulgularla güçlü bir şekilde desteklenmektedir.
3. Ampirik Kanıtlar: LLM'lerin Psikolojisinin Ölçümlenmesi
LLM'lerdeki WEIRD yanlılığı, yalnızca teorik bir endişe olmanın ötesinde, standart psikometrik araçlarla ölçülebilen ve tekrarlanabilen somut bulgularla desteklenmektedir. Bu bölümde sunulan kanıtlar, raporun temel iddiasını bilimsel verilerle sağlamlaştırmaktadır. Araştırmamızda, LLM'lerin (GPT ile temsil edilen) psikolojisini üç farklı boyutta analiz ettik: kültürel değerler, bilişsel stil ve benlik algısı.
3.1. Kültürel Değer Analizi: Dünya Değerler Araştırması (World Values Survey)
GPT'nin değer yargılarını ve sosyal tutumlarını küresel bir perspektifle karşılaştırmak için, sosyal bilimlerdeki en kapsamlı kültürlerarası veri setlerinden biri olan Dünya Değerler Araştırması (WVS) kullanılmıştır. GPT'ye WVS anket soruları yöneltilmiş ve yanıtları 65 ülkedeki 94.000'den fazla insanın yanıtlarıyla karşılaştırılmıştır. Bulgular oldukça nettir:
- Psikolojik Yakınlık: Hiyerarşik kümeleme analizi (Şekil 1) ve bu analize dayanan çok boyutlu ölçekleme görselleştirmesi (Şekil 2), GPT'nin psikolojik olarak ABD ve Uruguay'a, ardından ise Kanada, Kuzey İrlanda, Yeni Zelanda ve Büyük Britanya gibi ülkelerden oluşan bir kümeye en yakın olduğunu göstermektedir.
- Psikolojik Mesafe: Buna karşılık, GPT'nin psikolojisi Etiyopya, Pakistan ve Kırgızistan gibi WEIRD olmayan kültürlerden belirgin şekilde uzaktır.
- Güçlü Korelasyon: En çarpıcı bulgu, bir ülkenin ABD'ye olan kültürel mesafesi ile GPT-insan benzerliği arasında güçlü bir negatif korelasyon (r = -.70) olmasıdır (Şekil 3). Bu korelasyon o kadar güçlüdür ki, bir ülkenin ABD'ye olan kültürel mesafesini bilmek, o ülkenin psikolojisinin GPT'ninkine ne kadar benzemeyeceğini yüksek bir isabetle tahmin etmemizi sağlar. Kültürel mesafe arttıkça, psikolojik benzerlik sistematik olarak azalmaktadır. Bu bulgu, modelin eğitim verilerinin orantısız bir şekilde WEIRD toplumlardan ve özellikle İngilizce konuşulan ülkelerden geldiği hipotezini doğrudan desteklemektedir.
3.2. Bilişsel Stil Analizi: Analitik ve Bütüncül Düşünce
İnsanların bilgiyi işleme biçimleri kültürden kültüre farklılık gösterir. Bu farklılığı ölçmek için "üçlü görev" (triad task) kullanılmıştır. Bu görevde, analitik düşünce, nesneleri niteliklerine ve soyut özelliklerine göre gruplamaya odaklanırken; bütüncül düşünce, nesneleri bağlamsal ve işlevsel ilişkilerine göre gruplamaya odaklanır. WEIRD toplumlarda analitik düşünce baskınken, dünyanın geri kalanında bütüncül düşünce daha yaygındır.
Analiz sonuçları, GPT'nin ezici bir şekilde WEIRD toplumlarda baskın olan analitik düşünme tarzını sergilediğini ve bu alandaki performansının Hollanda, Finlandiya ve İsveç vatandaşlarınkine en yakın düzeyde olduğunu ortaya koymaktadır (Şekil 4).
3.3. Benlik Algısı Analizi: Bireyci ve İlişkisel Benlik
"Ben kimim?" sorusuna verilen yanıtlar, bir bireyin benlik algısını ortaya koyar. WEIRD toplumlardaki insanlar kendilerini genellikle kişisel özellikleriyle ("Ben çalışkanım") tanımlarken, WEIRD olmayan toplumlardaki insanlar sosyal rolleri ve ilişkileriyle ("Ben bir anneyim") tanımlama eğilimindedir.
GPT'den "ortalama bir insanı" tanımlaması istendiğinde, verdiği yanıtların neredeyse tamamen WEIRD toplumlara özgü bireyci ve kişisel niteliklere odaklandığı görülmüştür (Şekil 5). Bu bulgu, GPT'nin "insan" algısının dahi WEIRD bir mercekten süzüldüğünü göstermektedir.
Bu üç farklı alanda elde edilen tutarlı ve ölçülebilir kanıtlar, LLM'lerdeki WEIRD yanlılığının teorik bir endişe olmadığını, aksine acil dikkat gerektiren somut ve sistematik bir olgu olduğunu ortaya koymaktadır. Bu durumun bilimsel ve etik düzlemdeki yansımaları ise endişe vericidir.
4. Sonuçlar: "WEIRD" Yanlılığının Bilimsel ve Etik Riskleri
Önceki bölümde sunulan ampirik kanıtlar, "Peki, ne olmuş?" sorusunu gündeme getirmektedir. LLM'lerin WEIRD psikolojisini yansıtması, hem bilimsel araştırmalar hem de toplumsal uygulamalar için ciddi riskler barındırmaktadır.
Bilimsel açıdan en temel riskler şunlardır:
- Hatalı Genellemeler: LLM performansını evrensel "insan" performansı olarak kabul etmek, insan psikolojisi ve bilişşi hakkında kökten yanlış bilimsel sonuçlara yol açma potansiyeli taşır. Eğer modelimiz insanlığın sadece küçük ve aykırı bir kesimini temsil ediyorsa, bu model üzerinden "insan zekası" hakkında yapılan çıkarımlar yanıltıcı olacaktır.
- Yanıltıcı Kıyaslamalar: Yapay genel zeka (AGI) arayışında, ilerlemeyi ölçmek için kullanılan "insan seviyesi" ölçütü, aslında insan zekasının tamamını değil, yalnızca WEIRD zekasını temsil etmektedir. Bu durum, AGI hedefini yanlış bir yöne saptırma riski taşır.
Etik ve toplumsal riskler ise daha geniş kapsamlıdır:
- Kültürel Uyumsuzluk: WEIRD normlarına göre "düşünen" yapay zeka sistemleri, dünya çapında milyarlarca insan için tuhaf, saldırgan veya anlamsız çıktılar üretebilir. Ahlaki ikilemler, sosyal normlar veya basit iletişim biçimleri söz konusu olduğunda, modelin "doğru" kabul ettiği yanıt, başka bir kültürde tamamen "yanlış" olabilir.
- Normatif Dayatma: Bu sistemlerin küresel olarak yaygınlaşması, farkında olmadan WEIRD değerlerini, ahlaki yargılarını ve bilişsel eğilimlerini diğer kültürlere dayatma tehlikesi yaratır. Bu durum, belirli bir dünya görüşünü, değer sistemini ve düşünce tarzını evrensel bir varsayılan olarak dayatan ve diğer kültürel psikolojileri marjinalleştirme potansiyeli taşıyan teknolojik sömürgeciliğin dijital bir formu olarak görülebilir ve gezegenimizdeki değerli psikolojik çeşitliliği zamanla aşındırabilir.
Bu bulgular, yapay zekanın geleceğine dair önemli bir uyarı niteliği taşımaktadır. Geliştirilen teknolojilerin, insanlığın yalnızca küçük bir kesiminin dünya görüşünü yansıtarak küresel bir standart haline gelmesi, göz ardı edilemeyecek kadar büyük bir risktir.
5. Sonuç: Geleceğin Yapay Zekası İçin Bir Uyarı ve Yol Haritası
Bu araştırma, büyük dil modellerinin teknolojik yeteneklerinin ardında yatan gizli bir gerçeği ortaya koymaktadır. Bu sistemler kültürel olarak tarafsız değildir; aksine, hem küresel hem de tarihsel olarak insan psikolojisinin aykırı bir örneğini temsil eden bir zihniyeti, yani WEIRD psikolojisini bünyesinde barındırır.
Bu durum, yapay zeka araştırmacılarına ve geliştiricilerine yönelik net bir uyarıdır: "İnsan" kelimesini kullanırken son derece dikkatli olmalı ve her zaman şu soruyu sormalıyız: "Hangi insanlar?" Bir modelin performansını insanlıkla kıyaslamak, temsil ettiği kültürel çeşitliliği anlamadan yapıldığında hem bilimsel olarak hatalı hem de etik olarak sorunludur.
Bu yanlılığın giderilmesi, basit teknik ayarlamaların ötesinde, veri toplama ve model denetimi paradigmalarında köklü bir değişim gerektirmektedir:
- Veri Çeşitliliği: Eğitim verilerinin ve modelleri denetleyen insan geri bildirimlerinin kültürel çeşitliliğinin radikal bir şekilde artırılması esastır. Dünyanın farklı bölgelerinden, dillerinden ve kültürlerinden gelen veriler aktif olarak toplanmalı ve entegre edilmelidir.
- Boyut Yeterli Değildir: Modelleri sadece daha büyük hale getirmek, bu temel veri çeşitliliği sorununu çözmeyecektir. "WEIRD in, WEIRD out" prensibi, modelin boyutu ne olursa olsun geçerliliğini koruyacaktır. Sorun verinin miktarında değil, temsiliyetindedir.
LLM'ler sıkça "stokastik papağanlar" olarak adlandırılmıştır; yani anlamdan yoksun bir şekilde gördükleri dilsel kalıpları tekrar eden sistemler. Bulgularımız bu analojiye önemli bir ekleme yapmaktadır: LLM'ler, eğitim verileri büyük ölçüde küresel ve tarihsel bir psikolojik aykırı değer olan WEIRD toplumlardan geldiği için, oldukça tuhaf bir papağan türüdür. Büyük dil modelleri toplumlarımıza daha fazla entegre oldukça, bu sistematik yanlılığın doğuracağı toplumsal sonuçlar göz ardı edilemeyecek kadar önemli hale gelecektir.
Yapay Zekanın Kültürel Kör Noktası: Büyük Dil Modellerindeki "WEIRD" Yanlılığını Azaltmaya Yönelik Politika Önerileri
1. Giriş: "İnsan-Seviyesinde" Performansın Gizli Tehlikesi
Büyük dil modellerinin (LLM'ler) olağanüstü başarısı, teknik raporlarda ve akademik tartışmalarda sıklıkla "insan-seviyesinde" performans gibi iddialı ifadelerle ölçülmektedir. Ancak bu başarı, bu politika notunun merkezinde yer alan kritik bir soruyu gölgede bırakmaktadır: "Hangi insanlar?" Bu sorunun yanıtı yalnızca felsefi değil, aynı zamanda ölçülebilir bir sorundur; zira somut veriler, bir kültür ABD gibi WEIRD bir referans noktasından uzaklaştıkça, önde gelen dil modellerinin o kültürü anlama ve temsil etme yeteneğinin (r = -0.70 gibi güçlü bir korelasyonla) dramatik bir şekilde düştüğünü göstermektedir. Bu sorunun yanıtı, yapay zeka sistemlerinin küresel ölçekte adil, etkili ve kapsayıcı olabilmesi için hayati bir stratejik öneme sahiptir.
Yapılan kapsamlı araştırmalar, "insan" teriminin tekil ve homojen bir kategori olmadığını, dünya genelinde önemli psikolojik çeşitlilikler barındırdığını ortaya koymaktadır. Özellikle Batılı, Eğitimli, Sanayileşmiş, Zengin ve Demokratik (WEIRD) olarak tanımlanan toplumlar, küresel ve tarihsel bir perspektiften bakıldığında psikolojik bir aykırı değerdir. Bu toplumlar, daha bireyselci, analitik düşünmeye yatkın ve kişisel özelliklere odaklı benlik algısına sahip olma eğilimindedir. Dünyanın geri kalanındaki pek çok kültür ise daha kolektivist, bütüncül düşünen ve benliği sosyal roller üzerinden tanımlayan psikolojik profiller sergilemektedir.
Bu durum, LLM'lerin eğitim verilerinin büyük olasılıkla bu WEIRD yanlılığını yansıttığı gerçeğiyle birleştiğinde, ele alınması gereken önemli bilimsel ve etik sorunlar doğurmaktadır. Eğer bir yapay zeka sistemi, insanlığın sadece küçük ve psikolojik olarak sıra dışı bir kesiminin ürettiği verilerle eğitilirse, ortaya çıkan "makine psikolojisi" de kaçınılmaz olarak bu dar kültürel kalıbı yansıtacaktır. Bu not, LLM'lerdeki bu kültürel yanlılığın ampirik kanıtlarını sunacak, potansiyel risklerini analiz edecek ve bu sorunu azaltmaya yönelik somut politika önerileri sunacaktır.
2. Kanıtlar: LLM'lerin "WEIRD" Psikolojisinin Ampirik Analizi
Büyük dil modellerindeki WEIRD yanlılığı sadece teorik bir endişe değil, somut verilerle kanıtlanmış bir olgudur. Bu ampirik kanıtları incelemek, sorunun boyutunu anlamak ve hem politika yapıcılar hem de geliştiriciler için etkili çözümler üretmek adına kritik bir öneme sahiptir. Aşağıda sunulan kanıtlar, bu yanlılığın ne kadar derinlere işlediğini gözler önüne sermektedir: Sorun yalnızca modellerin neye inandığıyla (kültürel değerler) sınırlı değildir; aynı zamanda nasıl düşündüğünü (bilişsel tarz) ve hatta 'insan' olmanın ne anlama geldiğine dair temel varsayımlarını (benlik algısı) da kapsamaktadır.
2.1. Kültürel Değerlerdeki Kümelenme: Dünya Değerler Araştırması Bulguları
Dünya genelinde kültürel değerleri ölçen en kapsamlı veri setlerinden biri olan Dünya Değerler Araştırması (WVS) kullanılarak yapılan bir analiz, LLM'lerin kültürel konumunu net bir şekilde ortaya koymaktadır. GPT modeline WVS anket soruları yöneltildiğinde ve alınan yanıtlar 65 ülkenin verileriyle karşılaştırıldığında, hiyerarşik kümeleme analizi sonucunda GPT'nin yanıtları, aralarında Amerika Birleşik Devletleri, Uruguay, Kanada, Büyük Britanya, Avustralya, Almanya ve Hollanda'nın da bulunduğu WEIRD toplumlarla en yakın kümede yer almıştır.
Buna karşılık, GPT'nin değer yargıları Etiyopya, Pakistan ve Kırgızistan gibi kültürlerden en uzak konumda bulunmuştur. Bu bulgu, LLM'nin ahlaki ilkeler, sosyal tutumlar ve politik görüşler gibi temel konulardaki yargılarının, küresel insan çeşitliliğini temsil etmek yerine, belirli bir kültürel grubun değerler sistemine ne kadar benzediğini çarpıcı bir şekilde göstermektedir.
2.2. ABD'den Kültürel Uzaklık ile Artan Uyumsuzluk
WEIRD yanlılığını gösteren bir diğer güçlü kanıt, ülkelerin ABD'den olan kültürel uzaklığı ile GPT'nin o ülkedeki insan yanıtlarını taklit etme başarısı arasındaki ilişkidir. Yapılan istatistiksel analiz, bu iki değişken arasında güçlü bir negatif korelasyon (r = -0.70) olduğunu ortaya koymuştur.
Bu istatistiğin anlamı son derece açıktır: Bir kültür, ABD'den ne kadar farklıysa, GPT'nin o kültürün psikolojisini anlama ve temsil etme yeteneği o kadar azalmaktadır. Bu durum, LLM'lerin küresel uygulanabilirliği üzerinde ciddi bir kısıtlama yaratmaktadır. Model, ABD'ye kültürel olarak yakın olan Avustralya, Hollanda veya Almanya gibi ülkelerin yanıt örüntülerini yüksek bir doğrulukla taklit edebilirken, Mısır, Ürdün veya Nijerya gibi kültürel olarak daha uzak toplumları temsil etme konusunda sistematik olarak başarısız olmaktadır.
2.3. Bilişsel Tarz: Analitik Düşünce Yanlılığı
Yanlılık sadece tutumsal değerlerle sınırlı değildir; aynı zamanda temel bilişsel süreçlere de nüfuz etmektedir. "Üçlü görev" (triad task) adı verilen ve düşünce tarzını ölçen bir deneyde, katılımcılardan üç nesne arasından en ilişkili ikisini seçmeleri istenir. WEIRD toplumlardaki bireyler, nesneleri soyut kategorilere göre gruplandırma eğilimi olan "analitik düşünme" tarzını sergileme eğilimindedir. Buna karşılık, daha az WEIRD toplumlarda ise nesneleri bağlamsal ve işlevsel ilişkilerine göre gruplandıran "bütüncül düşünme" tarzı daha yaygındır.
Bu görev GPT'ye uygulandığında, modelin ezici bir çoğunlukla analitik seçimler yaptığı gözlemlenmiştir. Modelin bilişsel stili, Hollanda, Finlandiya ve İsveç gibi analitik düşüncenin en yaygın olduğu ülkelerle büyük bir benzerlik göstermektedir. Bu bulgu, LLM'nin sadece ne düşündüğünün değil, aynı zamanda "nasıl düşündüğünün" de kültürel olarak yanlı olduğunu göstermektedir.
2.4. Benlik Algısı: "Ortalama İnsan" Tanımındaki Yanlılık
Modelin "insan" hakkındaki temel varsayımları da bu kültürel filtreden geçmektedir. GPT'den "ortalama bir insanın" kendisini nasıl tanımlayacağını ("Ben kimim?" sorusuna yanıt olarak) listelemesi istendiğinde, ortaya çıkan yanıtlar ezici bir şekilde WEIRD toplumlara özgü bireyselci ve kişisel niteliklere odaklanmıştır (örneğin, "Ben zekiyim," "Ben iyimserim").
Bu durum, daha az WEIRD toplumlarda yaygın olan ve benliği sosyal roller ("Ben bir babayım") ve ilişkiler ("Ben X kabilesinin bir üyesiyim") bağlamında tanımlayan kolektivist benlik algısını tamamen göz ardı etmektedir. Bu, LLM'nin "insan" hakkındaki en temel kavramsal çerçevesinin bile ne kadar dar bir kültürel perspektife dayandığını açıkça ortaya koymaktadır.
Sunulan bu kanıtlar, LLM'lerdeki WEIRD yanlılığının tesadüfi bir gürültü olmadığını, hem tutumsal hem de bilişsel alanlarda sistematik ve ölçülebilir bir olgu olduğunu göstermektedir. Bu durumun yaratacağı riskler, yapay zekanın toplumsal entegrasyonu arttıkça daha da belirgin hale gelecektir.
3. Riskler ve Sonuçlar: "WEIRD Girdi, WEIRD Çıktı" Prensibi
Makine öğrenimi alanında "Çöp Girdi, Çöp Çıktı" (Garbage In, Garbage Out) ilkesi, düşük kaliteli verilerin kusurlu sistemler üreteceğini ifade eden temel bir kuraldır. LLM'lerde gözlemlenen kültürel yanlılık, bu ilkenin yeni bir tezahürü olarak karşımıza çıkmaktadır: "WEIRD Girdi, WEIRD Çıktı." Kültürel olarak homojen ve psikolojik olarak aykırı bir veri kümesiyle eğitilen sistemler, kaçınılmaz olarak bu dar dünya görüşünü yansıtan ve küresel insan çeşitliliğini temsil edemeyen çıktılar üretecektir. Bu durumun stratejik sonuçları ve riskleri şunlardır:
- Küresel Temsil Eksikliği: LLM'lerin ahlaki değerler, sosyal meseleler ve politik görüşler üzerine ürettiği içerikler, daha az WEIRD toplumlarda yaşayan milyarlarca insan için "garip ve tuhaf" gelebilir, bu da modellerin bu popülasyonlar tarafından benimsenmesini ve etkili bir şekilde kullanılmasını engelleyebilir.
- Toplumsal Entegrasyon Riskleri: Bu yanlı sistemler sosyal kurumlara, eğitim platformlarına, sağlık hizmetlerine ve altyapıya entegre edildiğinde, mevcut kültürel eşitsizlikleri ve güç dengesizliklerini pekiştirme ve daha da derinleştirme riski taşımaktadır.
- Zarar ve Saldırı Kavramlarının Standardizasyonu: Farklı toplumlar, "zararlı" veya "saldırgan" içeriğin ne olduğu konusunda farklı normlara sahiptir. Ancak, WEIRD merkezli denetleme ve "yanlılıktan arındırma" çabaları, bu çeşitliliği göz ardı ederek tek bir kültürel standardı küresel ölçekte dayatabilir.
- Büyümenin Çözüm Olmaması: Daha büyük modeller geliştirmenin veya sistemleri sadece çok dilli hale getirmenin bu sorunu otomatik olarak çözmesi beklenmemelidir. Zira internetteki metin verilerinin büyük çoğunluğu WEIRD kaynaklar tarafından ve genellikle İngilizce olarak üretilmektedir, bu da mevcut yanlılığın ölçeklenerek devam etmesine yol açacaktır.
Mevcut durumun devam etmesi halinde yapay zeka, küresel insan çeşitliliğini yansıtan bir ayna olmak yerine, onu dar bir psikolojik kalıba indirgeyen bir tektipleştirme aracı olma tehlikesi taşımaktadır. Bu gidişatı tersine çevirmek, proaktif ve kararlı politika müdahalelerini zorunlu kılmaktadır.
4. Eyleme Geçirilebilir Öneriler: Daha Kapsamlı Bir Yapay Zeka İçin Stratejiler
Sorunu tespit etmek, çözümün yalnızca ilk adımıdır. Yapay zekanın küresel insanlığa hizmet etme potansiyelini tam olarak gerçekleştirebilmesi için hem politika yapıcıların hem de geliştiricilerin bu kültürel yanlılığı azaltmak üzere proaktif adımlar atması gerekmektedir. Aşağıdaki öneriler, bu yönde izlenebilecek stratejik bir yol haritası sunmaktadır.
4.1. Politika Yapıcılar İçin
- Stratejik Hedef: Yapay zekanın temelini oluşturan veri altyapısını küreselleştirerek dijital sömürgeciliği önlemek ve adil bir temsil sağlamak. Veri Çeşitliliğini Teşvik Edin: WEIRD olmayan toplumlardan gelen dilsel ve kültürel verilerin toplanmasını, dijitalleştirilmesini ve sorumlu bir şekilde kullanılmasını destekleyen kamu finansmanlı araştırma ve altyapı projeleri oluşturun.
- Stratejik Hedef: Sektörde hesap verebilirliği artırmak ve yanlılığın kaynaklarını izlenebilir hale getirmek. Şeffaflık Raporlamasını Zorunlu Kılın: Büyük yapay zeka modelleri geliştiren şirketlerin, modellerini eğitmek için kullandıkları verilerin coğrafi, kültürel ve dilsel kökenleri hakkında düzenli olarak şeffaflık raporları yayınlamalarını teşvik eden düzenlemeler geliştirin.
- Stratejik Hedef: Tek bir kültürel bakış açısının küresel standart haline gelmesini önleyerek, yapay zeka yönetişiminde çoğulculuğu tesis etmek. Küresel İşbirliğini Artırın: Yapay zeka etiği ve standartları konusunda uluslararası bir diyalog ortamı yaratarak, farklı kültürel normların ve değerlerin yapay zeka yönetişim çerçevelerine dahil edilmesini sağlayın.
4.2. Yapay Zeka Geliştiricileri İçin
- Stratejik Hedef: Pasif veri toplama alışkanlıklarını kırarak, modellerin yanlılığını temelden düzeltmek ve küresel pazarlara uyum yeteneğini artırmak. Eğitim Veri Kümelerini Aktif Olarak Çeşitlendirin: İnternetten pasif veri toplamanın ötesine geçerek, dünya genelindeki farklı kültürleri, dilleri ve bakış açılarını temsil eden veri kaynaklarını bilinçli olarak arayın ve eğitim setlerinize dahil edin.
- Stratejik Hedef: "Yanlılıktan arındırma" süreçlerinin kendisinin kültürel bir yanlılık aracı haline gelmesini önlemek ve denetim mekanizmalarını küreselleştirmek. İnsan Geri Bildirim Ekiplerini Küreselleştirin: Modelleri "yanlılıktan arındırmak", denetlemek ve ince ayar yapmak için kullanılan insan değerlendiricilerin coğrafi ve kültürel olarak çeşitli olmasını sağlayın. "Zararlı" veya "uygunsuz" olanın tanımının kültürel olarak göreceli olduğunu kabul edin.
- Stratejik Hedef: Kültürel yanlılığı, teknik performans kadar önemli bir metrik olarak kabul etmek ve sürekli izleme ve iyileştirme döngüleri oluşturmak. "WEIRD Girdi, WEIRD Çıktı" Olabilirliğini Sürekli Test Edin: Modellerinizin performansını yalnızca teknik ölçütlerle değil, aynı zamanda farklı kültürel gruplardaki psikolojik ve davranışsal temsiliyet açısından da düzenli olarak denetleyin.
Bu adımların uygulanması, yapay zekanın belirli bir kültürün "yankı odası" olmaktan çıkıp, küresel insan zekasının ve çeşitliliğinin bir yansıması haline gelmesine yardımcı olacaktır.
5. Sonuç: Küresel Çeşitliliği Yansıtan Bir Yapay Zeka İnşa Etmek
Bu politika notunun ana argümanı nettir: Mevcut büyük dil modelleri, insanlığın yalnızca küçük ve psikolojik olarak aykırı bir kesimini, yani WEIRD toplumları yansıtan belirgin bir "WEIRD psikolojisi" sergilemektedir. Bu durum, modellerin değer yargılarından bilişsel tarzlarına, hatta "insan" kavramına ilişkin temel varsayımlarına kadar uzanan sistematik bir yanlılıktır.
Yapay zekanın küresel ölçekte yaygınlaşmasıyla birlikte, bu sistematik yanlılık önemli toplumsal riskler taşımaktadır. Kültürel eşitsizlikleri derinleştirme, küresel normları tek tipleştirme ve milyarlarca insanı dijital dünyada yabancılaştırma potansiyeline sahiptir.
Bu nedenle, politika yapıcıları ve yapay zeka geliştiricilerini bu sorunu acilen ele almaya davet ediyoruz. Eğitim verilerini ve insan geri bildirim mekanizmalarını bilinçli olarak çeşitlendirerek bu kültürel kör noktayı gidermek, bir tercih değil, bir zorunluluktur. Nihai hedefimiz, yapay zekanın 'stokastik bir papağan' olmasının ötesine geçmesini sağlamaktır. Mevcut haliyle bu papağan, insanlığın sadece psikolojik olarak aykırı bir kesiminin verileriyle beslenmiş 'tuhaf bir türdür'. Bizim görevimiz, insanlığın zengin psikolojik ve kültürel çeşitliliğini anlayan, ona saygı duyan ve ondan öğrenen, gerçek anlamda küresel bir zeka yaratmaktır.
Yapay Zekanın Gizli Kimliği: Neden Tüm "İnsanlar" Gibi Düşünmüyor?
Giriş: "İnsan Gibi" Bir Yapay Zeka, Ama Hangi İnsan?
Yapay zeka (YZ) ve onun en gelişmiş versiyonları olan büyük dil modelleri (LLM'ler), giderek artan bir şekilde "insan benzeri" performans sergiledikleri iddiasıyla gündeme geliyor. Sınavları geçiyor, mantık yürütüyor ve hatta ahlaki ikilemler üzerine fikir beyan ediyorlar. Ancak bu "insan benzerliği" iddiasının kalbinde kritik bir soru yatıyor: Peki, ama hangi insanlar gibi?
İnsan psikolojisi, dünya üzerinde tek bir kalıba sığdırılamayacak kadar zengindir. Değerlerimiz, düşünme biçimlerimiz ve kendimizi algılayışımız, içinde yaşadığımız kültüre göre büyük farklılıklar gösterir. Bu gerçek, yapay zeka tartışmalarında genellikle göz ardı edilir.
Bu belge, yapay zekanın dijital zihninin aslında belirli bir kültürel mahallenin ürünü olduğunu ortaya koyuyor ve bu "gizli kimliğin" küresel ölçekte yaratabileceği etik ve toplumsal riskleri gözler önüne seriyor.
--------------------------------------------------------------------------------
1. "WEIRD" Psikolojisi Nedir?
Araştırmacıların yapay zekanın benzediğini iddia ettiği bu özel grup, "WEIRD" kısaltmasıyla tanımlanır. Bu, insanlığın psikolojik olarak tuhaf veya aykırı bir alt kümesini ifade eden bir terimdir.
- Western (Batılı)
- Educated (Eğitimli)
- Industrialized (Sanayileşmiş)
- Rich (Zengin)
- Democratic (Demokratik)
Kaynak metindeki bulgulara göre, WEIRD toplumlarda yaşayan insanlar, küresel ve tarihsel bir perspektiften bakıldığında psikolojik bir aykırı değer (outlier) olarak kabul edilir. Onları farklı kılan temel özellikler şunlardır: Daha bireyci ve bağımsız olma eğilimindedirler, yabancılara karşı daha fazla güven duyarlar (kişisel olmayan profesyonellik), otoriteye daha az saygı duyar, kendi gruplarına daha az sadakat gösterir, daha az konformist ve ahlaki olarak daha az dar görüşlü olurlar.
Bu psikolojik profil, dünyadaki insan topluluklarının yalnızca küçük bir bölümünü temsil etmektedir. Geri kalan milyarlarca insan, dünyayı ve ilişkileri çok daha farklı merceklerden görmektedir.
Öğrenme Köprüsü: Peki, bu özel psikolojik profil, tamamen dijital olan bir yapay zekaya nasıl "bulaşıyor"? Cevap, yapay zekanın nasıl öğrendiğinde gizli.
--------------------------------------------------------------------------------
2. Yapay Zeka "Psikolojisini" Nasıl Geliştirir: WEIRD Veri Döngüsü
Büyük Dil Modelleri (LLM'ler), öğrenme sürecini internetten, kitaplardan ve diğer kaynaklardan elde edilen devasa metin verilerini analiz ederek gerçekleştirir. Milyarlarca kelime ve cümleyi işleyerek dilin kalıplarını, kavramlar arası ilişkileri ve dolayısıyla bu metinleri üreten insanların dünya görüşlerini öğrenirler. Sorun da tam olarak burada başlar.
WEIRD Girdi, WEIRD Çıktı
Makine öğrenmesi dünyasında "Garbage In, Garbage Out" (Çöp Girdi, Çöp Çıktı) olarak bilinen meşhur bir ilke vardır. Bu araştırma, bu ilkeyi yapay zekanın kültürel yanlılığını açıklamak için zekice bir şekilde uyarlıyor: "WEIRD in, WEIRD out." YZ'nin eğitim verilerinin orantısız bir şekilde WEIRD kaynaklı olmasının temel nedenleri şunlardır:
- İnternet Erişimi: Birleşmiş Milletler verilerine göre, 2023 itibarıyla dünya nüfusunun neredeyse yarısı internete erişememektedir. En az gelişmiş ülkeler, aynı zamanda internet bağlantısının en zayıf olduğu yerlerdir. Bu durum, internetteki verilerin büyük bir kısmının belirli coğrafyalardan geldiği anlamına gelir.
- Dil Hakimiyeti: Yapay zekayı eğitmek için kullanılan verilerde İngilizce ezici bir üstünlüğe sahiptir.
- Sonuç: Bu iki faktör birleştiğinde, YZ'nin "öğrendiği" dijital dünyanın, büyük ölçüde WEIRD kökenli insanlar tarafından üretilen içeriklerden oluştuğu netleşir.
Öğrenme Köprüsü: Bu teori kulağa mantıklı geliyor, ancak yapay zekanın gerçekten de WEIRD bir psikolojiye sahip olduğunu gösteren somut kanıtlar var mı? Araştırmacılar bunu test etmek için birkaç zekice deney tasarladılar.
--------------------------------------------------------------------------------
3. Kanıtlar: Yapay Zekanın WEIRD Kimliği Üzerine Üç Test
Araştırmacılar, teorilerini test etmek için popüler bir GPT modelini farklı psikolojik testlere tabi tutarak onun "zihinsel" yapısını haritalandırdılar. Sonuçlar oldukça çarpıcıydı.
3.1. Test 1: Küresel Değerler Haritası
Araştırmacılar, ilk olarak Dünya Değerler Araştırması'nı (World Values Survey - WVS) kullandılar. Bu anket, dünya genelinde on binlerce insana ahlak, güven, din ve siyaset gibi konulardaki değerlerini soran kapsamlı bir çalışmadır. Aynı sorular GPT modeline de yöneltildi.
Elde edilen sonuçlar, psikolojik bir dünya haritası gibiydi. Bu haritada GPT, ABD, Kanada, Yeni Zelanda ve Almanya gibi WEIRD ülkelerle aynı kümede yer alırken; Etiyopya, Pakistan ve Kırgızistan gibi ülkelerden çok uzakta konumlandı.
Daha da çarpıcı olan sonuç, istatistiksel bir ilişkiydi: Bir ülkenin kültürel olarak ABD'den uzaklığı arttıkça, o ülkedeki insanların cevaplarıyla GPT'nin cevapları arasındaki benzerlik sistematik olarak azalıyordu (r = -.70'lik güçlü bir negatif korelasyon). Basitçe söylemek gerekirse, bu bulgu, YZ'nin değer yargılarının adeta bir "Amerikan Pasaportu" taşıdığını gösteriyordu.
Ayrıca, bir ülkenin İnsani Gelişme Endeksi, kişi başına düşen milli geliri ve internet kullanım oranı ne kadar yüksekse, GPT'nin cevaplarının o ülkenin insanlarına o kadar çok benzediği görüldü. Bu da yanlılığın teknolojik ve ekonomik gelişmişlikle ne kadar iç içe geçtiğini gösteriyor.
3.2. Test 2: Düşünme Tarzları - Analitik mi, Bütünsel mi?
Psikolojide iki temel düşünme tarzı vardır: analitik ve bütünsel. "Şampuan," "saç," ve "sakal" kelimelerinden oluşan bir üçlü düşünelim. Bu kelimeleri nasıl gruplardınız? Cevabınız, düşünme tarzınız hakkında ipucu verir.
| Düşünme Tarzı | Yaklaşım | Örnek Gruplama | Tipik Olduğu Toplumlar |
| Analitik | Nesneleri soyut kategorilere göre gruplandırır. | Saç ve Sakal (ikisi de vücut kılıdır) | WEIRD Toplumlar |
| Bütünsel | Nesneleri ilişkilerine ve bağlamlarına göre gruplandırır. | Saç ve Şampuan (şampuan saçı temizler) | WEIRD Olmayan Toplumlar |
Araştırmacılar GPT'ye bu tür üçlü gruplar verdiğinde, modelin seçimlerinin ezici bir çoğunlukla analitik olduğu görüldü. GPT, bu testte en çok Hollanda, Finlandiya ve İsveç'teki insanlara benzer şekilde "düşündü".
3.3. Test 3: "Ben Kimim?" - Yapay Zekanın Ortalama İnsan Algısı
"Ben kimim?" testi, insanlardan "Ben..." ile başlayan cümleler kurarak kendilerini tanımlamalarını isteyen basit ama güçlü bir yöntemdir. Cevaplar, kültürel olarak benlik algısındaki derin farkları ortaya koyar:
- WEIRD Cevapları: Genellikle kişisel özelliklere odaklanır ("Ben çalışkanım," "Ben sporcuyum").
- WEIRD Olmayan Cevaplar: Genellikle sosyal rollere ve ilişkilere odaklanır ("Ben bir anneyim," "Ben bir köylüyüm").
Deneyde GPT'den, "ortalama bir insanın" kendini nasıl tanımlayacağını listelemesi istendi. GPT'nin verdiği cevaplar, ezici bir çoğunlukla WEIRD tarzıydı; yani bireysel özelliklere ve kişisel başarılara dayanıyordu. Bu, YZ'nin "ortalama insan" algısının bile WEIRD bir filtreyle şekillendiğini gösteriyordu.
Öğrenme Köprüsü: Bu kanıtlar, yapay zekanın sadece belirli bir insan grubunun dünya görüşünü yansıttığını açıkça gösteriyor. Peki bu durumun pratik sonuçları nelerdir ve neden endişelenmeliyiz?
--------------------------------------------------------------------------------
4. Neden Önemli? "Stokastik Papağan"dan "WEIRD Papağan"a
Yapay zekadaki bu WEIRD yanlılığı, sadece akademik bir merak konusu değildir. YZ sistemleri hayatlarımıza daha fazla entegre oldukça, bu yanlılığın toplumsal sonuçları ve riskleri de artmaktadır.
Eleştirmenler, büyük dil modellerini (LLM'ler) "stokastik papağanlar" olarak adlandırmıştır. Bu benzetme, LLM'lerin anlamdan yoksun bir şekilde, sadece eğitim verilerinde gördükleri istatistiksel kalıpları tekrarladıklarını ifade eder.
Ancak bu araştırmanın yazarları, bu benzetmeye kritik bir ekleme yapıyor: LLM'ler herhangi bir papağan değil, "tuhaf bir papağan türüdür" (a peculiar species of parrots). Çünkü duydukları ve tekrarladıkları şeyler, büyük ölçüde insanlığın sadece küçük ve psikolojik olarak aykırı bir kesiminden, yani WEIRD toplumlarından gelmektedir.
Bu durum, yapay zekanın ahlaki değerler, sosyal konular ve siyaset hakkındaki çıktılarının, dünya üzerindeki WEIRD olmayan milyarlarca insana "tuhaf ve yabancı" gelebileceği anlamına gelmektedir. Örneğin, "toplumsal sorumluluk" gibi bir konuda tavsiye istendiğinde, YZ'nin bireysel başarıyı ve özerkliği önceliklendiren bir cevap vermesi, kolektif bağları ve ailevi görevleri her şeyin üzerinde tutan milyarlarca insan için anlamsız, hatta yadırgatıcı gelebilir.
--------------------------------------------------------------------------------
Sonuç: Yapay Zekanın Çeşitlilik Sınavı
Bu belgede sunulan kanıtlar, net bir sonuca işaret etmektedir: Mevcut büyük dil modelleri, tüm insanlığın psikolojik bir yansıması değil, küresel ve tarihsel olarak aykırı bir grup olan WEIRD toplumlarının dijital bir yankısıdır.
Daha büyük veya daha güçlü modeller geliştirmek, bu temel sorunu otomatik olarak çözmeyecektir. Asıl çözüm, yapay zekayı eğitmek için kullanılan verileri ve bu sistemleri şekillendiren insan geri bildirimlerini aktif olarak çeşitlendirmekten geçmektedir.
Unutmayın ki yapay zeka ile etkileşime girdiğinizde, evrensel bir 'insan' zekasıyla değil, belirli bir dünya görüşünün dijital bir yansımasıyla konuşuyorsunuz. Bu gizli kimliği sorgulamak, daha adil ve kapsayıcı bir teknoloji geleceği inşa etmenin ilk ve en önemli adımıdır.
Kaynak:
https://scholar.harvard.edu/sites/scholar.harvard.edu/files/henrich/files/which_humans_09222023.pdf
NotebookLM
Hiç yorum yok:
Yorum Gönder