Yapay zekaya karşı veri isyanları patlak verdi

Kit Loffstadt, 20 yılı aşkın bir süredir Star Wars kahramanları ve Buffy the Vampire Slayer kötü adamları için alternatif evren fan kurguları yazıyor ve hikayelerini internette ücretsiz olarak paylaşıyor.

Ancak Mayıs ayında Bayan Loffstadt, bir veri şirketinin hikayelerini kopyalayıp onları viral sohbet robotu ChatGPT’ye güç veren yapay zeka teknolojisine aktardığını öğrendikten sonra yarattıklarını yayınlamayı bıraktı. Perişan halde, yazılarını askıya alınmış bir hesabın arkasına sakladı.

Bayan Loffstadt, geçen ay yapay zeka sistemlerine karşı bir isyanın örgütlenmesine de yardım etti. O, diğer düzinelerce hayran kurgu yazarıyla birlikte, yazarların çalışmalarını AI teknolojisine besleyen veri toplama hizmetlerini bunaltmak ve karıştırmak için çevrimiçi olarak bir dizi saygısız hikaye yayınladı.

İngiltere, Güney Yorkshire’dan 42 yaşındaki seslendirme sanatçısı Bayan Loffstadt, “Yaratıcılığımızın sonuçlarının makinelere bırakılamayacağını onlara göstermek için elimizden geleni yapmalıyız” dedi.


Hayran kurgu yazarları, teknoloji ateşi Silikon Vadisi’ni ve dünyayı sardığı için şu anda yapay zeka sistemlerine isyan eden gruplardan yalnızca biri. Son aylarda, Reddit ve Twitter gibi sosyal medya şirketleri, Haber ve NBC News gibi haber kuruluşları ve Paul Tremblay ve aktris Sarah Silverman gibi yazarlar, yapay zekanın verilerini izinsiz olarak emmesine karşı çıktılar.

Protestoları farklı biçimler aldı. Reddit gibi şirketler verilerine erişim için ücret talep ederken, yazarlar ve sanatçılar eserlerini korumak için dosyalarını kilitler veya yapay zeka tarafından üretilen içerik yayınlayan belirli web sitelerini boykot eder. Bu yıl, sistemlerini sanatçıların yaratıcı çalışmaları için izinsiz olarak eğitmekle suçlanan yapay zeka şirketlerine karşı en az 10 dava açıldı. Geçen hafta, Bayan Silverman ve yazarlar Christopher Golden ve Richard Kadrey, ChatGPT’nin yapımcısı OpenAI’ye ve diğerlerine AI’nın çalışmalarını kullanması nedeniyle dava açtı.


İsyanların merkezinde, çevrimiçi bilgilerin -hikayeler, sanat eserleri, haber makaleleri, forum gönderileri ve fotoğrafların- henüz keşfedilmemiş önemli bir değeri olabileceğine dair yeni keşfedilmiş bir anlayış var.

Ürettiği metin, resimler ve diğer içerik nedeniyle “üretken yapay zeka” olarak bilinen yeni yapay zeka dalgası, insan benzeri düzyazı üretebilen büyük dil modelleri gibi karmaşık sistemlere dayanıyor. Bu modeller, insan sorularını yanıtlayabilmeleri, yazı stillerini taklit edebilmeleri veya komedi ve şiir üretebilmeleri için her türden çok büyük miktarda veri üzerinde eğitilmiştir.


Bu, teknoloji şirketlerinin yapay zeka sistemleri için daha da fazla veri aramasına yol açtı. Google, Meta ve OpenAI, büyük hayran kurgu veritabanları, tonlarca haber makalesi ve çoğu çevrimiçi olarak ücretsiz olarak sunulan kitap koleksiyonları dahil olmak üzere esasen İnternet genelindeki bilgilerden yararlandı. Teknoloji endüstrisi tabiriyle buna İnternet’i “kazımak” denir.

OpenAI’nin 2020’de piyasaya sürülen bir yapay zeka sistemi olan GPT-3’ü, her biri esas olarak çevrimiçi bulunan sözcüklerin bölümlerini temsil eden 500 milyar “belirteç” içerir. Bazı yapay zeka modelleri bir trilyondan fazla tokeni kapsar.

İnternet kazıma uygulaması uzun süredir var ve büyük ölçüde bunu uygulayan şirketler ve kar amacı gütmeyen kuruluşlar tarafından ifşa edildi. Ancak, verilerin sahibi olan şirketler tarafından tam olarak anlaşılmadı veya özellikle sorunlu görülmedi. Bu, ChatGPT’nin Kasım ayında kullanıma sunulmasından ve halkın, sohbet robotlarının arkasındaki temel yapay zeka modelleri hakkında daha fazla şey öğrenmesinden sonra değişti.

Bir AI şirketi olan Nomic’in kurucusu ve CEO’su Brandon Duderstadt, “Burada olan şey, verilerin değerinin temelden yeniden düzenlenmesidir” dedi. “Eskiden, verileri herkes için erişilebilir hale getirerek ve reklamlar göstererek verilerden değer elde edebileceğiniz düşünülüyordu. Şimdi düşünce, verilerinizi yapay zekanız için girdi olarak kullandığınızda çok daha fazla değer elde ettiğiniz için kilitlediğinizdir.

Veri protestolarının uzun vadeli bir etkisinin olması pek olası değil. Google ve Microsoft gibi mali açıdan güçlü teknoloji devleri zaten dağlar kadar özel bilgiye ve daha fazlasını lisanslamak için kaynaklara sahip. Ancak, çıkarılması kolay içerik çağı sona ererken, büyük oyuncularla rekabet etmeyi uman daha küçük AI girişimleri ve kar amacı gütmeyen kuruluşlar, sistemlerini eğitmek için yeterli içeriği elde edemeyebilir.


OpenAI yaptığı açıklamada, ChatGPT’nin “lisanslı içerik, kamuya açık içerik ve insan AI eğitmenleri tarafından oluşturulan içerik” konusunda eğitildiğini söyledi. “Yaratıcıların ve yazarların haklarına saygı duyuyoruz ve çıkarlarını korumak için onlarla çalışmaya devam etmeyi dört gözle bekliyoruz.”

Google yaptığı açıklamada, yayıncıların gelecekte içeriklerini nasıl yönetebilecekleri konusundaki tartışmalara dahil olduklarını söyledi. Şirket, “Herkesin canlı bir içerik ekosisteminden yararlandığına inanıyoruz” dedi. Microsoft, yorum talebine yanıt vermedi.

Veri isyanları, ChatGPT’nin küresel bir fenomen haline gelmesinin ardından geçen yıl patlak verdi. Kasım ayında bir grup programcı, Microsoft ve OpenAI’ye karşı, şirketlerin kodlarının yapay zeka destekli bir programlama asistanını eğitmek için kullanılmasının ardından telif haklarını ihlal ettiğini iddia ederek bir toplu dava açtı.

Ocak ayında, stok fotoğraf ve videolar sağlayan Getty Images, metin açıklamalarından görüntüler oluşturan bir yapay zeka şirketi olan Stability AI’ye, girişimin sistemlerini eğitmek için telif hakkıyla korunan fotoğraflar kullandığını iddia ederek dava açtı.

Ardından, Haziran ayında, bir Los Angeles hukuk firması olan Clarkson, OpenAI ve Microsoft’a karşı 151 sayfalık bir toplu dava açtı ve OpenAI’nin reşit olmayanlardan nasıl veri topladığını açıkladı ve web kazımanın telif hakkı yasasını ihlal ettiğini ve “hırsızlık” oluşturduğunu söyledi. şirket Google’a benzer bir dava açtı.


Clarkson’ın kurucusu Ryan Clarkson, “Ülke genelinde gördüğümüz veri isyanı, toplumun büyük teknolojinin herhangi bir kaynaktan herhangi bir bilgiyi alıp kendilerinin yapma hakkına sahip olduğu fikrine karşı savaşma şeklidir” dedi.


Santa Clara Üniversitesi Hukuk Fakültesi profesörü Eric Goldman, davanın iddialarının geniş kapsamlı olduğunu ve mahkeme tarafından kabul edilme olasılığının düşük olduğunu söyledi. Ancak dava dalgası daha yeni başlıyor ve yapay zekanın geleceğini belirleyecek “ikinci ve üçüncü dalgalar” geliyor.

Daha büyük şirketler de AI kazıyıcılarına karşı savaşıyor. Nisan ayında Reddit, uygulama programlama arayüzüne (API) erişim için ücret alacağını duyurdu. Bu, üçüncü tarafların sosyal ağın kapsamlı kişisel konuşma veritabanını indirmesine ve analiz etmesine izin veren yöntemdir.


Reddit CEO’su Steve Huffman o sırada şirketinin “tüm bu değeri dünyanın en büyük şirketlerinden bazılarına ücretsiz olarak vermesi gerekmediğini” söyledi.


Aynı ay, bilgisayar programcıları için bir soru-cevap sitesi olan Stack Overflow, AI şirketlerinden de veriler için ödeme yapmasını isteyeceğini duyurdu. Site yaklaşık 60 milyon soru ve cevap içermektedir. Hareket daha önce Wired tarafından bildirilmişti.

Haber kuruluşları da yapay zeka sistemlerine karşı savaşıyor. The Times, Haziran ayında üretici yapay zekanın kullanımıyla ilgili bir dahili notta, yapay zeka şirketlerinin “fikri mülkiyetimize saygı duyması” gerektiğini söyledi. Bir Times sözcüsü ayrıntı vermeyi reddetti.

Bireysel sanatçılar ve yazarlar için, yapay zeka sistemleriyle mücadele etmek, nerede yayın yapacaklarını yeniden düşünmek anlamına geliyordu.

British Columbia, Vancouver’dan bir illüstratör olan 35 yaşındaki Nicholas Kole, benzersiz sanat tarzının bir AI sistemi tarafından nasıl yeniden üretilebileceği konusunda endişeliydi ve teknolojinin çalışmalarını bozduğundan şüpheleniyordu. Müşterileri cezbetmek için kreasyonlarını Instagram, Twitter ve diğer sosyal medya sitelerinde yayınlamaya devam etmeyi planlıyor, ancak ArtStation gibi insan yapımı içeriğin yanı sıra yapay zeka tarafından oluşturulan içerik yayınlayan sitelerde paylaşım yapmayı bıraktı.


Bay Kole, “Benden ve diğer sanatçılardan ahlaksız bir hırsızlık gibi geliyor,” dedi. “Varoluşsal korkumda bir deliği tetikliyor.”

11 milyondan fazla hikaye içeren bir hayran kurgu veritabanı olan Kendi Arşivimiz’de yazarlar siteye veri kazımayı ve yapay zeka tarafından üretilen hikayeleri yasaklaması için baskı yapıyor.

Mayıs ayında, birkaç Twitter hesabı, popüler hayran kurgu tarzını taklit eden ChatGPT örneklerini paylaştığında ve bunu Kendi Arşivimiz’de yayınladığında, düzinelerce yazar öfkeyle ayağa kalktı. AI kazıyıcılarını yanıltmak için hikayelerini engellediler ve yıkıcı içerikler yazdılar. Ayrıca Archive of Our Own yetkililerini yapay zeka tarafından oluşturulan içeriğe izin vermeyi bırakmaya çağırdılar.

Archive of Our Own’ın hukuk müşaviri ve Tulsa Üniversitesi Hukuk Fakültesi’nde profesör olan Betsy Rosenblatt, sitenin “maksimum kapsayıcılık” politikası olduğunu ve hangi hikayelerin yapay zeka kullanılarak yazıldığını söylemek istemediğini söyledi.

Hayran kurgu yazarı Bayan Loffstadt için yapay zekaya karşı savaş, insanların kıyamet sonrası bir dünyada yapay zeka destekli robotlarla savaştığı bir video oyunu olan Horizon Zero Dawn hakkında bir hikaye yazdığında başladı. Oyunda robotların bir kısmının iyi, bir kısmının kötü olduğunu söyledi.


Ancak gerçek dünyada, “kibir ve kurumsal açgözlülük sayesinde kötü şeyler yapmaya sürükleniyorlar” dedi.