İnsana Karşı Yapay Yaratıcılık: Fark Gerçekten Nerede Yatıyor (Ve Ghibli Tarzı Neden Bize Bir Şey Öğretiyor)
Yapay zeka ve telif hakkı tartışmaları 2024-2025 yıllarında dramatik bir şekilde yoğunlaştı. Bunlar artık teorik tartışmalar değil: New York Times OpenAI'yi telif hakkı ihlali nedeniyle dava etti (Aralık 2023), Getty Images Stability AI'yı dava etti ve binlerce sanatçı toplu davalar açtı. YZ şirketleri, sistemlerinin tıpkı insanlar gibi 'öğrendiğini' söylüyor ama durum gerçekten böyle mi?
İnsan yaratıcılığı her zaman bağlantılar yoluyla gelişmiştir: Shakespeare tarihi kronikler ve halk hikayelerinden esinlenmiş, Van Gogh Japon baskılarını incelemiş, Beatles Amerikan rock'ını çalarak başlamıştır. Sanatçılar her zaman önceki eserleri yeniden yorumlar. Teknoloji şirketleri, yapay zekanın da aynı şeyi yaptığını söylüyor. Ancak 'Ghibli tarzı' vakası bu anlatının ne kadar basit olduğunu ortaya koyuyor.
Midjourney veya DALL-E'ye 'Ghibli tarzı' yazdığınızda Hayao Miyazaki'nin başyapıtlarına çarpıcı biçimde benzeyen görüntüler elde edersiniz: pastel renkler, kabarık bulutlar, rüya gibi manzaralar, büyük gözlü karakterler. Teknik olarak etkileyici. Aynı zamanda son derece sorunlu.
Studio Ghibli'nin bu kendine özgü estetiği geliştirmesi onlarca yıl sürdü: hassas renk paleti seçimleri, geleneksel animasyon teknikleri ve Japon kültürüne ve Miyazaki'nin kişisel vizyonuna dayanan sanatsal bir felsefe. Bir yapay zeka modeli bu 'tarzı' saniyeler içinde kopyaladığında, Miyazaki'nin Disney animasyonundan ve Japon mangasından öğrendiği gibi gerçekten 'öğreniyor' mu? Yoksa binlerce Ghibli karesinden çıkarılan görsel kalıpları izinsiz olarak yeniden mi birleştiriyor?
Aradaki fark felsefi değil, yasal ve ekonomiktir. arXiv'de yayınlanan bir Stanford analizine göre (Carlini vd., 2023), Kararlı Difüzyon gibi difüzyon modelleri, belirli ipuçları istendiğinde vakaların yaklaşık yüzde 3'ünde eğitim setinden neredeyse aynı görüntüleri yeniden üretebilir. Bu 'ilham' değil, depolama ve yeniden üretimdir.
Polonyalı dijital sanatçı Greg Rutkowski, isminin Stable Diffusion'da 1,2 milyon istemde yer aldığını keşfetti; istemeden de olsa, izin vermeden ya da ücret almadan en çok talep edilen 'stillerden' biri haline geldi. MIT Technology Review'a söylediği gibi, "Gururum okşanmadı. Yıllarca inşa ettiğim bir şey benden çalınmış gibi hissediyorum.
Yapay zeka eğitiminin ölçeği daha önce görülmemiş boyutlara ulaşmıştır. Görüntü modelleri için en yaygın kullanılan veri kümelerinden biri olan LAION-5B, telif hakkıyla korunan eserler de dahil olmak üzere internetten toplanan 5,85 milyar görüntü-metin çifti içermektedir. GPT-4, ücretli makaleler, kitaplar ve tescilli yazılım kodları da dahil olmak üzere internetin büyük bölümleri üzerinde eğitilmiştir.
Devam eden önemli yasal işlemler:
YZ şirketleri bu uygulamayı ABD yasalarına göre 'adil kullanım'a başvurarak savunuyor: eğitimin 'dönüştürücü' olduğunu ve orijinal pazarın yerini almadığını iddia ediyorlar. Ancak birkaç mahkeme bu yoruma meydan okuyor.
Getty v. Stability AI davasında Yargıç Katherine Forrest, Ocak 2024'te davanın reddedilmesi talebini reddederek davanın devam etmesine izin verdi: "YZ modellerinin eğitiminin adil kullanım teşkil edip etmediği sorusu karmaşıktır ve gerçeklerin kapsamlı bir şekilde incelenmesini gerektirir. Tercümesi: YZ şirketleri adil kullanımı basitçe öne sürüp bu işi bitiremezler.
Yasal baskı ile karşı karşıya kalan YZ şirketleri lisans görüşmeleri yapmaya başladı. OpenAI ile anlaşmalar yapılmıştır:
Google Reddit, Stack Overflow ve çeşitli yayıncılarla benzer anlaşmalar imzaladı. Anthropic, kitapların kullanımı için yayıncılarla görüşmüştür.
Ancak bu anlaşmalar sadece pazarlık gücü olan büyük yayıncıları kapsamaktadır. Milyonlarca bireysel yaratıcı-sanatçılar, fotoğrafçılar, serbest yazarlar- halihazırda tamamlanmış eğitimlerde kullanılan eserler için tazminat alamamaktadır.
'Yapay zeka insanlar gibi öğrenir' söylemi teknik olarak yanıltıcıdır. Temel farklılıklara bir göz atalım:
Ölçek ve hız: Bir insan sanatçı hayatı boyunca belki yüzlerce veya binlerce eser üzerinde çalışır. GPT-4 trilyonlarca kelime üzerinde eğitilmiştir. Milyarlarca görüntü üzerinde Kararlı Difüzyon. Ölçek kıyaslanamaz ve makul bir 'ilham' tanımını aşar.
Anlamsal kavrayış: Van Gogh Japon baskılarını incelediğinde, görsel kalıpları mekanik olarak kopyalamadı - altta yatan estetik ilkeleri (negatif alan kullanımı, asimetrik kompozisyon, doğaya vurgu) anladı ve bunları Avrupalı post-empresyonist vizyonuyla yeniden yorumladı. Eserleri bilinçli kültürel sentezlerdir.
Yapay zeka modelleri insani anlamda 'anlamaz'. Santa Fe Enstitüsü'nde profesör olan Melanie Mitchell'in "Yapay Zeka: Düşünen İnsanlar İçin Bir Rehber" adlı kitabında açıkladığı gibi: "Derin öğrenme sistemleri örüntü tanıma konusunda mükemmeldir ancak nedensel anlayış, soyut muhakeme veya dünyanın zihinsel modellerinden yoksundur. Stable Diffusion, Ghibli'yi farklı kılan şeyin ne olduğunu 'anlamıyor' - 'Ghibli stili' olarak etiketlenmiş milyonlarca piksel arasındaki istatistiksel korelasyonları çıkarıyor.
Yaratıcı niyetlilik: İnsan sanatçılar, kişisel vizyonlarına, iletmek istedikleri mesaja ve uyandırmak istedikleri duygulara dayalı olarak kasıtlı yaratıcı seçimler yaparlar. Miyazaki çevreci temaları, pasifizmi, feminizmi filmlerine dahil eder - bilinçli ahlaki ve sanatsal seçimler.
Yapay zeka istatistiksel olasılıklar temelinde üretir: "X istemi ve Y eğitim seti verildiğinde, hangi piksel yapılandırması en olasıdır?" Niyet yok, mesaj yok, vizyon yok. Ted Chiang'ın The New Yorker'da yazdığı gibi: "ChatGPT web'in bulanık bir jpeg'idir"- orijinal içeriği değerli kılan nitelikleri tam olarak kaybeden kayıplı bir sıkıştırma.
Dönüşüm ve yeniden birleştirme: Pablo Picasso Afrika maskları üzerine çalıştı ama resimde uzamsal temsili yeniden keşfeden tamamen yeni bir sanatsal hareket olan Kübizm'i yarattı. Dönüşüm radikal ve orijinaldi.
Üretken YZ modelleri gizli uzayda enterpolasyon yoluyla çalışır: eğitim setinin öğelerini yeni konfigürasyonlarda yeniden birleştirirler, ancak üzerinde eğitildikleri verilerin istatistiksel dağılımına bağlı kalırlar. Öğrenilmiş istatistiksel düzenlilikleri ihlal eden gerçekten yeni estetikler icat edemezler. MIT araştırmasının (Shumailov vd., 2023) gösterdiği gibi, önceki yapay zeka çıktıları üzerinde tekrar tekrar eğitilen modeller giderek dejenere olur - bu fenomen 'model çöküşü' olarak adlandırılır.
Temel paradoks şudur: YZ, orijinal görünen (hiçbir insan daha önce bu Ghibli tarzı görüntüyü görmemiştir) ancak istatistiksel olarak türevsel olan (mevcut kalıpların enterpolasyonlarıdır) çıktılar üretebilir. Bu, temel bir yenilik içermeyen yüzeysel bir özgünlük biçimidir.
Bunun derin sonuçları vardır. Filozof John Searle'ün ünlü 'Çin Odası argümanında' savunduğu gibi: bilişsel bir süreci simüle etmek ona sahip olmakla aynı şey değildir. Yapay zeka, insani anlamda yaratıcı olmaksızın yaratıcılığı simüle edebilir.
Tartışmalar karşısında çeşitli çözümler geliştirilmektedir:
Sanatçılar için koruma araçları:
Opt-out kayıtları:
Tazminat Çerçevesi:
Hükümet düzenlemeleri:
AB Yapay Zeka Yasası (Ağustos 2024'te yürürlüğe girmiştir), üretken yapay zeka modelleri sağlayıcılarının kullanılan telif hakkıyla korunan eğitim verilerinin ayrıntılı özetlerini yayınlamalarını gerektirmektedir. Bu, şeffaflığı empoze etmeye yönelik ilk düzenleyici girişimdir.
Tennessee ELVIS Yasası (Mart 2024), ses ve benzerlik sanatçılarını, derin ses ve görsel sahtecilikler için özel bir mevzuatla yapay zekanın ilk ABD eyaletlerinde yetkisiz kullanıma karşı özellikle korur.
ABD Kongresi'ne sunulan teklifler arasında telif hakkıyla korunan eserler için (opt-out yerine) açık opt-in talepleri ve eğitim veri setlerinin kamuya açık kayıtlarının oluşturulması yer almaktadır.
İki gelecek vizyonu karşı karşıya geliyor:
İyimser görüş (YZ şirketleri): YZ, Photoshop veya müzik sentezleyicileri gibi insan yaratıcılığını güçlendiren bir araçtır. Sanatçılar iş akışlarını hızlandırmak, varyasyonları keşfetmek, yaratıcı blokların üstesinden gelmek için yapay zekayı kullanacaklar. İnsanların vizyonu yönlendirdiği ve YZ'nin teknik kısımları gerçekleştirdiği hibrit sanat formları ortaya çıkacaktır.
Somut örnekler halihazırda mevcut: 'The Frost' (2023) filminde arka plan ve doku oluşturmak için yapay zeka kullanıldı ve insan sanatçılar sanat yönetimine rehberlik etti. Müzisyenler Suno ve Udio'yu doğaçlama yapmak üzere altyapı parçaları oluşturmak için kullanıyor. Yazarlar GPT'yi anlatı fikirlerini tartışmak için bir 'lastik ördek' olarak kullanıyor.
Kötümser görüş (birçok yaratıcı): Yapay zeka yaratıcılığı metalaştıracak ve sadece istisnai becerilere sahip elitler hayatta kalana kadar yaratıcı çalışmanın ekonomik değerini aşındıracak. Ortalama yaratıcılığın yerini ucuz jeneratörler alacak ve yaratıcı orta sınıfı yok edecek - tıpkı 19. yüzyılda endüstriyel otomasyonun zanaatkarları ortadan kaldırması gibi.
Ön kanıtlar bu endişeyi destekliyor: Fiverr gibi serbest çalışan platformlarda, illüstratör ve metin yazarı talepleri 2023 yılında %21 oranında düşerken (Fiverr Q4 2023 verileri), 'AI art generation' tekliflerinde patlama yaşandı. Greg Rutkowski, Stable Diffusion'da tarzı popüler hale geldiğinden beri doğrudan komisyonların %40 oranında düştüğünü gördü.
Gerçek muhtemelen ikisinin arasında bir yerde yatıyor: bazı yaratıcı çalışma biçimleri otomatikleştirilirken (genel stok illüstrasyonlar, temel kopya pazarlama), son derece orijinal, kavramsal, kültürel olarak köklü yaratıcılık insan alanı olarak kalmaya devam edecek.
İnsan ve yapay zeka içeriği arasındaki ayrım giderek zorlaşacaktır. Bugün bile, filigran veya açıklama olmadan, GPT-4 metnini insan metninden veya Midjourney görüntülerini fotoğraflardan ayırt etmek genellikle imkansızdır. Sora (OpenAI video üreticisi) halka açık hale geldiğinde, ayrım videoya da yayılacaktır.
Bu da özgünlükle ilgili derin soruları gündeme getiriyor. Yapay zeka tarafından üretilen Ghibli tarzı bir görüntü orijinaliyle aynı duyguları uyandırıyorsa, aynı değere sahip midir? Filozof Walter Benjamin 'Teknik Çoğaltılabilirlik Çağında Sanat Eseri' (1935) adlı eserinde, mekanik çoğaltılabilirliğin orijinal eserin 'aura'sını -uzamsal-zamansal benzersizliğini ve özgünlüğünü- aşındırdığını ileri sürmüştür.
Üretken YZ bu argümanı en uç noktaya taşır: mevcut eserleri yeniden üretmez, ancak orijinali olmadan onu taklit eden sonsuz varyasyonlar üretir. Bu Baudrillardcı simülakrdır - orijinali olmayan kopya.
Yine de, bilinçli yaratıcı eylemde indirgenemez bir şekilde insani bir şey vardır: her fırça darbesini ne iletmek istediğini bilerek seçen sanatçı, her cümleyi belirli duyguları uyandırmak için işleyen yazar, kasıtlı olarak gerilim ve çözüm oluşturan besteci. Yapay zeka sonucu taklit edebilir ancak süreci taklit edemez ve belki de yaratıcılığın gerçek değeri bu süreçte yatmaktadır.
Studio Ghibli'nin bir açıklamasında (Kasım 2023) yazdığı gibi: 'Filmlerimizin ruhu kopyalanabilecek görsel tarzda değil, anlatmak istediğimiz hikayeye hizmet etmek için kare kare verdiğimiz yaratıcı kararlarda yatar. Bu otomatikleştirilemez'.
Nihayetinde sanatın değeri, insan deneyimiyle derinlemesine bağlantı kurma becerisinden kaynaklanır - bizi anlaşılmış, meydan okunmuş, dönüştürülmüş hissettirir. Bunun yapay zeka tarafından gerçekleştirilip gerçekleştirilemeyeceği açık bir soru olarak kalmaya devam ediyor. Ancak sanat insanlar tarafından insanlar için yapıldığı ve insanlık durumundan bahsettiği sürece, hiçbir algoritmanın kopyalayamayacağı bir şeyi koruyacaktır: yaşanmış deneyimin estetik forma dönüştürülmüş özgünlüğü.
Kaynaklar: