Midjourney ile sanat dünyasına yolculuk

Arşiv
Arşiv

Kurallara uyduktan sonra nazik bir dilde kullanırsanız yapay zeka araçlarının sizin için yapamayacağı şey yoktur.

Sanat

Sanat, tarihi seyrin tüm dönemlerinde var olmayı başarmış kıymetli bir mefhumdur. Tarihi akışın bütününde yer alması sonucu sanatın ne olduğu üzerine sayısız fikirler öne sürülmüş ve her çağda türlü tartışmalar boy göstermiştir. Günümüze kadar ulaşan mevzubahis tartışmalar henüz sonuçlanmamışken yapay zeka teknolojilerinin sanat dünyasına müdahil olması olayın daha da içinden çıkılmaz bir hal almasına neden olmuştur. Gittikçe güçlenen ve zenginleşen yapay zeka-sanat ilişkisinin geldiği son nokta Amerika Birleşik Devletleri’nde bulunan Colorado Eyalet Sergisi’nin düzenlediği güzel sanatlar yarışması ile gözler önüne serilmiştir. Çünkü bu yarışmanın ödül kazanan eseri “Théâtre D'opéra Spatial” (Uzay Operası Tiyatrosu) bir insana değil bir yapay zeka aracına aitti. Jason Allen tarafından “Midjourney” isimli modele yaptırılan bu eser hem sanatın hem de üretken yapay zekanın sınırlarının yeniden sorgulanmasına sebebiyet vermiştir. Yarışmada yaşanan hadise bir topluluğu sanatı yeniden tanımlama noktasında teşvik etse de büyük bir çoğunluğun da Midjourney’e olan ilgisini kabartmıştır.

Midjourney, Kasım 2022’den bu yana aktif faaliyet gösteren bir yapay zeka modelidir. Çoğunlukla dijital çizimlerle ve manipülatif çalışmalarla beslenmiştir. Birden fazla işlevi olmakla beraber temelde text-to-image (metinden görüntüye) yöntemi kullanarak kullanıcının girdiği metinleri birer görsele dönüştürme kabiliyetine sahiptir. Bununla birlikte kısmi olarak image-to-text (görüntüden metne) özelliğini de barındırmaktadır ve tanımlama metodu ile görselleri kelimelere dökebilmektedir. Aynı zamanda kullanıcı tarafından oluşturulan tüm çıktıları yine kendisini eğitmek için kullanır ve bu yanıyla bir derin öğrenme laboratuvarı gibi çalışmaktadır.

Midjourney modeli, sunucuların üzerine kurulan bir bot mantığı ile çalışır. Aracı kullanmak için bir Discord hesabına sahip olmak gerekir. MidJourney’in kendine ait sunucusuna katıldıktan sonra /imagine: komutunu kullanarak görsel üretmeye başlamak oldukça basittir. Komut oluştururken görsellerin daha profesyonel gözükmesini sağlamak için dikkat edilmesi gereken birtakım hususlar bulunmaktadır. İlk olarak -neredeyse tüm dil tabanlı yapay zeka modellerinde geçerli olduğu üzeredetaylı bir prompt oluşturmak elde edilecek görsel kalitesini önemli ölçüde arttıracaktır. Kullanıcı isteğini ne kadar teferruatlı ve kapsayıcı ifade ederse ortaya çıkacak sonuç da o derecede tatmin edici olacaktır. Talimat verilenin bir insan değil bir makine olduğu ve belirtilmeyen kısımları doldurmak için hayal gücünü değil genelgeçer unsurları tercih edeceği akıldan çıkarılmamalıdır. Ek olarak yapay zeka için esas amaç az efor sarf etmek olduğundan yeterince detaylandırılmamış komutlar daha az güç harcayarak üretilen çıktılar olacaktır. (Tam bu noktada şunu hatırlatmakta fayda var: Midjourney henüz Türkçe dil desteğine sahip değil. Yazı boyunca örnek olarak gösterilen tüm prompt’lar aslında İngilizce yazılmış ve o şekilde sonuç alınmıştır.)

Çıktıyı kaliteli hale getirmenin bir diğer yolu da Midjourney geliştiricileri tarafından belirlenmiş olan parametreleri etkili olarak kullanmaktır. Örneğin “--ar 16:9” parametresini kullanarak oluşacak çıktının boyutlarını, “--q 25” parametresini kullanarak oluşacak görselin çözünürlüğünü ayarlamak mümkün. Bununla birlikte çizim/illüstrasyon dışında gerçek bir fotoğraf görüntüsü oluşturulmak istenirse detaylı bir biçimde kamera ve lens özelliklerinin verilmesi yeterlidir. Böylece ortaya örneğin profesyonel fotoğraf makineleri ile çekilmiş etkileyici bir kuş fotoğrafı çıkarmak hiç de zor olmayacaktır.

Şimdiye kadar anlatılanlardan yola çıkılırsa yapay zekanın görsel üretme konusunda geniş bir yelpazeye sahip olduğu açıkça görülmektedir. Biz de yazımızda Midjourney aracının sınırlarını zorlamayı hedefledik. Bu doğrultuda yalnızca görsel üretme gücünü değil aynı zamanda mevcut sanat eserlerini yorumlama becerisini de sınamak istedik. Ünlü ressamların en bilinen eserleri üzerinde basit ama köklü değişiklikler kurgulayarak sonuçlarını listeledik. Ayrıca yoğun olarak Avrupa tabanlı kaynaklarla eğitilmiş bir model olduğu için minyatür ve ebru sanatlarına olan aşinalığını merak ettik. Sonuçlar fazlasıyla incelemeye değer ve hayret uyandırıcı oldu.

İlk olarak ele aldığımız tablo İtalyan ressam Leonardo Da Vinci’nin meşhur tablosu Mona Lisa oldu. Mona Lisa, Rönesans döneminde resmedilmiş 16. yüzyıl dönemine ait bir yağlı boya portresidir. Orijinal hali Paris’teki Louvre Müzesi’nde sergilenmektedir. Böylesi bilinen bir eserden Midjourney’in de haberdar olduğunu düşünerek Mona Lisa’nın 9-10 yaşlarında bir kız çocuğu olduğunu hayal etmesini istedik. Ancak bunu yaparken tablonun orijinal dokusuna, sanatçının eserdeki imzasına ve yapının genel atmosferine sadık kalması önemliydi. Bu kısımları özellikle belirterek şöyle bir komut oluşturduk ve birkaç denemenin ardından elde edilen sonuç gerçekten inanılmazdı.

Mona Lisa
Mona Lisa

Da Vinci

“Da Vinci’nin ikonik tablosu 'Mona Lisa'yı 9-10 yaşlarında bir kız çocuğu olarak yeniden hayal et, gençliğin ve masumiyetin özünü yakalayarak Leonardo da Vinci'nin imza tarzını sürdür. Genç kızın gizemli gülümsemesi ve meraklı bakışı, orijinal tablo gibi izleyiciyi büyülemelidir. Onu, Da Vinci'nin ayrıntılara olan titiz dikkatini ve ışık ile gölge ustalığını sergileyen Rönesans esintili bir ortamla çevrele. Dönemin renk paletinin altın tonları, sahnenin sıcaklığını artırarak tuvalin üzerinde etkisini göstersin. Bu başyapıtı, tarihi sanatın görkemini çağrıştıran süslü, antik bir çerçeve içine yerleştir. --ar 13:20”

Ortaya çıkan sonuç birçok açıdan beklediğimiz gibiydi. Mona Lisa’nın çocukluk halini akıllarda soru bırakmayacak bir şekilde tasvir etmek konusundaki testi başarıyla tamamladı. Ancak tablonun en çetrefilli ve uğraştırıcı yanı Mona Lisa’nın ellerini doğru bir şekilde çizmesini sağlamaktı. Midjourney her ne kadar 5.2 sürümüne kadar yükselmiş olsa da halen insan eli çizmekten ve elleri kusursuz bir şekilde konumlandırmaktan çok uzak. En azından doğru bir ürün ortaya koyma oranı fazlasıyla düşük. Ayrıca her ne kadar doğru bir yorumlama yapmış olsa da bir insanın yüz hatlarında ufak değişiklikler yaparak çocuksu bir imaj kazandırmak göründüğü kadar zor değil. Bu nedenlerden ötürü bir başka deneme yapma kararı aldık.

İkinci kez denerken üzerinde çalıştığımız tablo Hollandalı ressam Johannes Vermeer’e aitti. İlk eserden çok da farklı olmayan 17. yüzyıla ait “İnci Küpeli Kız” tablosu kimi zaman “Kuzeyin Mona Lisa’sı” olarak da adlandırılmaktadır. Hakkında fazlaca yorum bulunan bu eseri bizim ele alış biçimimiz ise Midjourney ile “İnci Küpeli Adam” oluşturmak üzerineydi. Işık, gölgeler, renk tonları ve küpenin yanı sıra tablodaki kompozisyonu yeniden yorumlamayı gerektiren bu prompt’u şu şekilde hazırladık:

“Johannes Vermeer’e ait meşhur tablon'İncili Küpeli Kız'ın yeni versiyonunda genç bir adamı kullanmıştır.
“Johannes Vermeer’e ait meşhur tablon'İncili Küpeli Kız'ın yeni versiyonunda genç bir adamı kullanmıştır.

Vermeer

“Johannes Vermeer’e ait meşhur tablo 'İncili Küpeli Kız'ın yeni versiyonunda, merkezi figürü büyüleyici özelliklere sahip sakallı bir erkek olarak hayal et. Genç adamın sakalı titizlikle işlenmiş olup, her telin dokusunu ve derinliğini aktarmak için özenle boyanmıştır. Sakal, özgün kompozisyonun yüzün odak noktasına uyum sağlar, çene çizgisinin konturuna dikkat çeker ve cildinin üzerindeki ışık ile gölge oyununu vurgular. Arka plan, orijinalin zamansız atmosferini korurken, soluk tonları erkek konunun canlı varlığına zarif bir kontrast sağlar. Yumuşak, yayılmış ışık adamın yüzünü ve sakalını aydınlatır, parlak noktalar ile gölgelerin zarif bir oyununu yaratır. Seçkin inci küpe, kızın kulağını süsleyen inci küpe, şimdi sakallı adamın kulak memesinden zarifçe sallanır, parlaklığı çevreleyen ortamı yansıtır. Erkek ögenin giyimi, orijinal eserin stilini yansıtır, cinsiyetine uyacak şekilde hafifçe adapte edilmiştir. Dikkatlice sarılmış bir örtü başının üstünde durur, kumaşı aşağı doğru kaskatı iner ve yüzünü çerçeveleyerek gizemli ifadesini daha da vurgular. Giysinin karmaşık kıvrımları ve dokuları titiz detayda işlenir, sanatçının becerikli işçiliğine dikkatini sergiler. Adamın bakışı, orijinalindeki kızın bakışı gibi bir gizem ve cazibe hissi taşır. Uzun kirpikler tarafından çerçevelenen gözleri, merak ve içe dönüklüğün bir karışımını iletmektedir.”

Elde edilen resim orijinaline olan bağlılık kıstası ile incelendiğinde fazlasıyla başarılı görülebilir. Özellikle benzer donuk bakışlar ve kıyafetlerin bir erkek özelinde yeniden kurgulanmış olması başarıyı katlayan gerekçelerdir. Ancak görülen eserde yalnızca bir sanatçıya bağlı kalınmış ve eserin zaman-tarz denklemi tek bir dönem üzerinden kurgulanmıştır. Midjourney’i farklı açılardan sınayabilmek adına bir sonraki prompt’u hazırlarken birden çok ressamın -bir nevi- sanatsal düetini sergilemek istedik. 20. yüzyılın önemli ressamlarından Salvador Dalí'nin (aynı zamanda bir diğer text-to-image modeli Dall-E ismini bu sanatçıdan ilhamla almıştır) gerçeküstü tablosu “Belleğin Azmi”ni konu aldık. Aynı çağın bir başka önemli ressamı Pablo Picasso’nun imzası ile harmanlanmış bir eser üretebilmek için şöyle bir prompt oluşturduk:

Dalí

“’Belleğin Azmi’” adlı eseriyle Salvador Dalì'nin tarzını ve Picasso'nun soyut tarzını birleştir. Eriyen dijital saatleri içeren ve her iki sanatçının ruhunu da yansıtan bir sanat tablosu ortaya çıkar. --ar 4:3”

Öncekilerin aksine kısa bir komut girme nedenimiz ise tamamen sanatçılar üzerinden bir düet oluşturulabilmesine imkan sağlamaktı. İsabetli bir adım atılmış olacak ki ortaya ilk bakışta iki sanatçıyı da fazlasıyla andıran bir sonuç çıktı. Tablonun sağ kısmındaki saatler ve resmin geneline hâkim olan erime/damlama konusu ile soyut çizimlerin hâkim olduğu tema, arzu edilen düzeyde bir sonuca varıldığını gösterdi.

Belirtilen üç örneğin her birinde Midjourney’in ressamların sanat tarzına başarılı bir şekilde bağlı kalmayı başardığı açıkça söylenebilir. Bu durum bir noktada yapay zekanın güçlü analiz kabiliyetini gösterse de bir başka açıdan sınırlayıcı bir etmen olarak düşünülebilir. Çünkü ne kadar yorum katılırsa katılsın en nihayetinde oluşacak görselin sınırları, ressamının sınırları ile eş değer olmak zorundadır. O nedenle son komutu oluştururken sanatçının imzasını bir kenara koyarak esere yeni ögeler eklenmesi talebinde bulunduk. Kurguladığımız prompt şu şekildeydi:

Yıldızlı Gece adındaki eser.
Yıldızlı Gece adındaki eser.

Van Gogh

“Yıldızlı Gece" adlı eseriyle Van Gogh'un tarzına modern yüksek binalar ekleyerek tabloyu yeniden oluştur. Geçmişi ve bugünü bir araya getir. Eklenilen ögeleri resimle uyumlu bir zeminde birleştir ve ortaya doğal bir sonuç çıkar. --ar 128:101”

Sonuncu görselle birlikte ünlü tablolar üzerindeki testlerimizi tamamlamış olduk. Midjourney; mevcut eserdeki unsurları değiştirme, farklı sanatçıların imzasını taklit etme ve tablolara yeni ögeler eklemek konusunda oldukça kabiliyetli. Günden güne daha kaliteli hale gelecek olduğunu tahmin etmek zor değil ayrıca. Ancak bunların yanı sıra Türk-İslam geleneğine ait sanat alanlarına ne derecede hâkim olduğunu gözlemlemek için de birtakım denemelerde bulunduk. Ebru ve minyatür sanatlarını temele alarak bir hikaye çerçevesinde ürünler ortaya koymasını istedik. Bu sayede hem yapay zekanın bireysel kurgu yeteneğini hem de bir sanat dalı çerçevesindeki başarısını gözlemleme şansı bulduk. İlk olarak hazırladığımız komut şu şekildeydi:

Minyatür sanatına ait bir tablo.
Minyatür sanatına ait bir tablo.

Minyatür

“Minyatür sanatına ait bir tablo oluştur, ana tema olarak İslam hanedanlığını seç. Minyatür sanatının doğal bir getirisi olarak gülünç anlatı tarzının gereksinimlerini koru. Heian dönemine özgü iş tasvirlerini içeren bir stilde çalışma ortaya çıkar. Sanat eserinde minyatür sanatının kendine özgü perspektif özelliklerini korumaya dikkat et, renkli ve canlı bir görüntü ortaya koy. -- ar 16:9”

Elde ettiğimiz sonuçta minyatür sanatına ait ögeler görmekte sorun yaşamıyor olsak da minyatür sanat geleneğine ait orijinallere benzeyen bir çalışma görmekte zorlandık. Kişiler ve hikaye hususunda başarılı ancak beslendiği ana kaynaklar itibariyle tam anlamıyla Doğu esintilerinin hâkim olamadığı bir tablo ile karşılaştık. Nispeten daha kolay olacağını düşündüğümüz için bu yöntemi ebru sanatı üzerinde denemeye karar verdik ve şu sonuçları elde ettik.

Ebru

“Geleneksel Türk sanatı Ebru'dan ilham alarak, modern bir dokunuş katılmış bir sanat eseri üret. Ebru'nun büyüleyici tekniklerini içeren bir eser oluştur. Renklerin ve formların uyumlu bir karışımını göster, çeşitlilik içinde birliği yansıt. Ebru'nun karakteristik damgalama tekniğini kullanarak ayrıntılı detaylar ver ve seçilen etkinliğin özünü yakala. Hem geleneksel hem de çağdaş tonları kullanarak eserin ana temasını veya duygularını simgeleyen bir renk yelpazesi kullan. Ebru'nun serbest akışkan formları içinde, eserin günümüze olan bağlantısını temsil eden modern unsurları sanatsal olarak dahil et. Ebru sanatı aracılığıyla, geleneksel güzelliğin zamansızlığı ile modern yaşamın canlılığını ustaca birleştirerek hem tarihle hem de çağdaş dünyayla rezonansa giren büyüleyici bir eser yarat.”

Ebru sanatından alınan sonuç, minyatür sanatına göre çok daha tatmin edici ve göz doldurucuydu. Günün sonunda Midjourney’in renkleri kullanma becerisini bir kez daha deneyimlemiş ve hatırlamış olduk.

Üretilen tüm görseller ele alındığında artısı ve eksisiyle Midjourney’in bir yıldan kısa bir sürede vardığı nokta heyecan verici bir seviyede. Elde edilen çıktıların ne derecede sanat eseri olarak değerlendirilebileceği ve hangi düzeyde bağ kurulabileceği ayrı bir tartışma konusu olsa da her birinin muazzam işler olduğu su götürmez bir gerçek. Siz de burada verilen prompt’ları hayal gücünüzle birleştirerek sayısız içerik oluşturabilirsiniz. Üstelik bunu yaparken Midjourney dışında OpenAi tarafından öne sürülen “Dall-E” modelini, Microsoft’un geliştirdiği “Microsoft Designer” aracını, Stable Diffusion, Hugging Face gibi daha birçok text-to-image çözümünü kullanabilirsiniz.