Teknoloji
Moderator
The New York Times'ın, telif hakkı ihlali nedeniyle OpenAI ve Microsoft'a dava açtığını sizlere aktarmıştık. OpenAI, The New York Times tarafından açılan telif hakkı davasına kamuoyuna açık bir şekilde yanıt verdi. Paylaştığı blog gönderisinde davayı haksız olarak nitelendiren OpenAI, medya kuruluşuyla hala bir ortaklık kurmayı umduğunu ifade etti.
OpenAI, Times'ın "hikayenin tamamını anlatmadığını" vurguladı.OpenAI, özellikle ChatGPT'nin Times hikayelerini kelimesi kelimesine yeniden ürettiği iddialarına karşı çıktı. Şirket, Times'ın komutları (prompt) manipüle ederek makalelerden alıntılar yaptığını öne sürdü. OpenAI açıklamasında şu ifadelere yer verdi:
Burada regürjitasyon kavramını biraz açmakta fayda var. Regürjitasyon, üretimsel yapay zeka modelleri belirli bir şekilde yönlendirildiklerinde eğitim verilerini kelimesi kelimesine (ya da kelimesi kelimesine yakın bir şekilde) ortaya çıkarması anlamına geliyor. Ünlü bir fotoğrafçı tarafından çekilen bir fotoğrafın aynısını üretmek buna güzel bir örnek olabilir.
OpenAI'ın aktardıklarına göre; şirket, geniş dil modellerinde yeniden üretimi azaltmaya çalışıyor. Bununla beraber, OpenAI, Times'ın davayı açmadan önce bu yeniden üretimin örneklerini paylaşmayı reddettiğini iddia ediyor.
OpenAI'ın belirttiğine göre; kelimesi kelimesine örnekler birden fazla üçüncü taraf web sitesinde çoğalan bir yıllık makalelerden alınmış gibi görünüyor. Bu bağlamda OpenAI, kasıtsız olarak içeriği yeniden üreten Browse adlı bir ChatGPT özelliğini kaldırdığını da ifade ediyor.
Tüm bu açıklamaların yanı sıra OpenAI, yapay zekanın öğrenmesi ve problem çözebilmesi için devasa boyutta insan bilgisi toplamına erişmesi gerektiğini savundu. Şirket, telif hakkıyla korunan eserlere sahip olma konusundaki yasal hakka saygı duymakla birlikte internetten alınan verilerle yapay zeka modellerinin eğitilmesinin, telif hakkıyla korunan eserlerin yeniden kullanılmasına izin veren adil kullanım kuralları kapsamına girdiğine inandığını ifade etti.
Şirket kısa süre önce, tıpkı bu kamuya açık blog gönderisinde olduğu gibi Birleşik Krallık Lordlar Kamarası'na da benzer bir argüman sunmuştu. OpenAI, telif hakkıyla korunan içeriğe erişim olmadan ChatGPT gibi bir yapay zeka sisteminin kurulamayacağını iddia etti. Şirket, yapay zeka araçlarının insan zekası ve deneyiminin tüm çeşitliliğini ve genişliğini temsil etmek için telif hakkıyla korunan eserleri içermesi gerektiğini söyledi.
GPT-4 ve DALL-E 3 gibi insan benzeri metin ve görüntüler üreten yapay zeka sistemleri, milyarlarca sanat eseri, e-kitap ve makale dahil olmak üzere pek çok farklı "örnek" üzerinden öğreniyor. Böyle bakıldığında, OpenAI, bu modellerden para kazansa bile "örnekler" için lisans veya başka bir ödeme yapması gerekmediğine inanıyor.
Şirket, açıklamasında içeriklerin eğitim verilerinin dahil edilmesinin önüne geçilmesine yönelik seçenekler sunduğunu da tekrarladı. Bu noktada 2023'ün Ağustos ayında OpenAI'ın web sitesi sahiplerine GPTBot'u engelleme imkanı sunmaya başladığını hatırlatalım. Web site sahipleri, Robots.txt dosyasına gerekli ayrıntıları ekleyerek veya IP adresini engelleyerek GPTBot arama robotunu engelleyebiliyor. Bu yöntemi kullanan şirketler arasında The New York Times da yer almakta.
Son olarak OpenAI'ın açıklamalarına göre, şirket, Axel Springer ve The Associated Press ile imzaladıklarına benzer bir ortaklık için Times ile görüşmelere devam edebileceğini umuyor. Şirket, The New York Times'ın uzun geçmişine saygı duyduğunu dile getirirken, "yapıcı bir ortaklık için umutluyuz" ifadesini kullandı.
OpenAI, Times'ın "hikayenin tamamını anlatmadığını" vurguladı.OpenAI, özellikle ChatGPT'nin Times hikayelerini kelimesi kelimesine yeniden ürettiği iddialarına karşı çıktı. Şirket, Times'ın komutları (prompt) manipüle ederek makalelerden alıntılar yaptığını öne sürdü. OpenAI açıklamasında şu ifadelere yer verdi:
"Bu tür ikomutları kullanırken bile, modellerimiz tipik olarak New York Times'ın ima ettiği şekilde davranmıyor, bu da ya modele regürjitasyon (yeniden üretim) talimatı verdiklerini ya da örneklerini birçok denemenin ardından seçtiklerini gösteriyor"
Burada regürjitasyon kavramını biraz açmakta fayda var. Regürjitasyon, üretimsel yapay zeka modelleri belirli bir şekilde yönlendirildiklerinde eğitim verilerini kelimesi kelimesine (ya da kelimesi kelimesine yakın bir şekilde) ortaya çıkarması anlamına geliyor. Ünlü bir fotoğrafçı tarafından çekilen bir fotoğrafın aynısını üretmek buna güzel bir örnek olabilir.
OpenAI'ın aktardıklarına göre; şirket, geniş dil modellerinde yeniden üretimi azaltmaya çalışıyor. Bununla beraber, OpenAI, Times'ın davayı açmadan önce bu yeniden üretimin örneklerini paylaşmayı reddettiğini iddia ediyor.
OpenAI'ın belirttiğine göre; kelimesi kelimesine örnekler birden fazla üçüncü taraf web sitesinde çoğalan bir yıllık makalelerden alınmış gibi görünüyor. Bu bağlamda OpenAI, kasıtsız olarak içeriği yeniden üreten Browse adlı bir ChatGPT özelliğini kaldırdığını da ifade ediyor.
Tüm bu açıklamaların yanı sıra OpenAI, yapay zekanın öğrenmesi ve problem çözebilmesi için devasa boyutta insan bilgisi toplamına erişmesi gerektiğini savundu. Şirket, telif hakkıyla korunan eserlere sahip olma konusundaki yasal hakka saygı duymakla birlikte internetten alınan verilerle yapay zeka modellerinin eğitilmesinin, telif hakkıyla korunan eserlerin yeniden kullanılmasına izin veren adil kullanım kuralları kapsamına girdiğine inandığını ifade etti.
Şirket kısa süre önce, tıpkı bu kamuya açık blog gönderisinde olduğu gibi Birleşik Krallık Lordlar Kamarası'na da benzer bir argüman sunmuştu. OpenAI, telif hakkıyla korunan içeriğe erişim olmadan ChatGPT gibi bir yapay zeka sisteminin kurulamayacağını iddia etti. Şirket, yapay zeka araçlarının insan zekası ve deneyiminin tüm çeşitliliğini ve genişliğini temsil etmek için telif hakkıyla korunan eserleri içermesi gerektiğini söyledi.
GPT-4 ve DALL-E 3 gibi insan benzeri metin ve görüntüler üreten yapay zeka sistemleri, milyarlarca sanat eseri, e-kitap ve makale dahil olmak üzere pek çok farklı "örnek" üzerinden öğreniyor. Böyle bakıldığında, OpenAI, bu modellerden para kazansa bile "örnekler" için lisans veya başka bir ödeme yapması gerekmediğine inanıyor.
Şirket, açıklamasında içeriklerin eğitim verilerinin dahil edilmesinin önüne geçilmesine yönelik seçenekler sunduğunu da tekrarladı. Bu noktada 2023'ün Ağustos ayında OpenAI'ın web sitesi sahiplerine GPTBot'u engelleme imkanı sunmaya başladığını hatırlatalım. Web site sahipleri, Robots.txt dosyasına gerekli ayrıntıları ekleyerek veya IP adresini engelleyerek GPTBot arama robotunu engelleyebiliyor. Bu yöntemi kullanan şirketler arasında The New York Times da yer almakta.
Son olarak OpenAI'ın açıklamalarına göre, şirket, Axel Springer ve The Associated Press ile imzaladıklarına benzer bir ortaklık için Times ile görüşmelere devam edebileceğini umuyor. Şirket, The New York Times'ın uzun geçmişine saygı duyduğunu dile getirirken, "yapıcı bir ortaklık için umutluyuz" ifadesini kullandı.