OpenAI, DALL-E’nin Üçüncü Versiyonunu Yayımladı

OpenAI, görsel sanat platformu olan DALL-E’nin üçüncü versiyonunu duyurdu. Bu yeni versiyon, kullanıcıların ChatGPT ile istek oluşturmasına olanak tanıyor ve daha fazla güvenlik seçeneği içeriyor. DALL-E, metin isteklerini görsellere dönüştürüyor. Ancak DALL-E 2’nin bazen belirli kelimeleri göz ardı ettiği gözlemlendi. En son versiyonun, bağlamı çok daha iyi anladığı belirtildi. DALL-E 3’ün yeni bir özelliği, ChatGPT ile entegrasyonudur. ChatGPT’yi kullanarak, bir kişi kendi detaylı isteğini oluşturmak zorunda kalmadan DALL-E 3’ü yönlendirebilir. Diğer kullanıcılar, DALL-E için belirli fikirlere sahip olduklarında kendi isteklerini kullanabilirler.

ChatGPT Entegrasyonu ve Görsel Oluşturma

The Verge’e yapılan bir demo gösteriminde, DALL-E ekibinin başında olan Aditya Ramesh, ChatGPT’den dağlarda bir ramen restoranı için logo oluşturmasına yardımcı olmasını istedi. ChatGPT daha uzun bir istek yazdı ve DALL-E dört seçenek sundu. Bunlardan en beğenileni, dağın bir görseli, ramen kar tepeleri, et suyu gibi akan bir şelale ve bahçe taşları gibi yerde turşulu yumurtalarla idi.

DALL-E’nin Tarihçesi ve Önceki Versiyonları

DALL-E’nin ilk versiyonu 2021’de yayımlandı ve Stability AI ve Midjourney tarafından diğer metin-görsel dönüştürücü AI sanat platformlarından önce geldi. DALL-E 2’nin 2022’de yayımlanmasının ardından, OpenAI, DALL-E’nin gerçekçi görseller oluşturabileceği ve fotoğraflar oluştururken önyargılı olabileceği eleştirilerinin ardından platformu kullanacak kişileri kontrol etmek için bir bekleme listesi oluşturdu. Şirket, geçen yılın Eylül ayında bekleme listesini kaldırdı ve DALL-E 2’yi halka açtı.

Gelişmiş Güvenlik Önlemleri

Bu yeni DALL-E versiyonu, Ekim ayında öncelikle ChatGPT Plus ve ChatGPT Enterprise kullanıcılarına sunulacak, ardından sonbaharda araştırma laboratuvarlarına ve API hizmetine sunulacak. OpenAI, DALL-E 3’ün yayımlanmasını aşamalı olarak planlıyor, ancak ücretsiz bir halk sürümünün ne zaman yayımlanacağına dair bir taahhütte bulunmadı. OpenAI, DALL-E 3 üzerinde çalışırken, müstehcen veya potansiyel olarak nefret dolu görsellerin oluşturulmasını önlemek için sağlam güvenlik önlemleri oluşturmak için çok çalıştığını iddia ediyor. OpenAI, güvenliği test etmek için bir sistemi bilerek bozmaya çalışan bir grup olan dış kırmızı takımlarla çalıştığını ve belirli kelimeleri göz ardı etmek için dil modellerini öğretmenin bir yolu olan giriş sınıflandırıcılarına güvendiğini belirtti. DALL-E 3, istek belirli bir ismi belirttiği sürece kamusal figürlerin görsellerini yeniden oluşturamayacak.

Sanatçıların Hakları ve DALL-E’nin Kısıtlamaları

OpenAI temsilcileri, DALL-E 3’ün, canlı sanatçıların tarzında görseller oluşturmayı reddettiğini belirtti. DALL-E 2’nin aksine, istendiğinde, belirli sanatçıların tarzında sanatı taklit edebilir. OpenAI, muhtemelen davalardan kaçınmak için, sanatçıların metin-görsel AI modellerinin gelecekteki sürümlerinden sanatlarını çıkarmalarına izin verecek. Yaratıcılar, haklarına sahip oldukları bir görseli gönderebilir ve web sitesindeki bir formda kaldırılmasını talep edebilirler. DALL-E’nin gelecekteki bir versiyonu, sanatçının görseli ve tarzına benzer sonuçları engelleyebilir. Sanatçılar, DALL-E rakipleri Stability AI ve Midjourney ile sanat web sitesi DeviantArt’ı, metin-görsel modellerini eğitmek için telif hakkıyla korunan çalışmalarını izinsiz kullanmakla dava etti.

Teknolog 21 Eylül 2023

2 dakika okuma süresi