OpenAI, Metinden Video Oluşturan Yapay Zeka Modeli “Sora”yı Tanıttı: Ağzınızı Açık Bırakacak!
ChatGPT’nin geliştiricisi OpenAI, bugün dünyayı kasıp kavuran yapay zeka modellerine bir yenisini daha ekledi. “ sora“adlı model, metinlerden görseller oluşturabiliyor. Firmanın paylaştığı örnek görseller, modelin korkutucu derecede pürüzsüz olduğunu gösteriyor.
Sora şu anda dezenformasyon, nefret içeriği ve önyargı gibi konularda uzman kişiler tarafından test ediliyor. Şirket, modeli devreye almadan önce gerekli güvenlik adımlarını atmak istediğini belirtiyor.
Sora, metin komutlarıyla 60 saniyelik gerçekçi görüntüler oluşturabiliyor
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
” Güzel, karlı ve canlı şehir Tokyo.Kamera, güzel karlı havanın tadını çıkaran ve yakındaki tezgahlarda alışveriş yapan birkaç kişiyi takip ederek şehrin kalabalık caddesinde ilerliyor. Muhteşem sakura yaprakları rüzgarda kar taneleriyle uçuyor.”
* Videoyu görüntüleyemiyorsanız buradaki kişiye tıklayın.
Başta da belirttiğimiz gibi Sora, metinlerden görseller oluşturmaya yönelik bir model. Yani yazdığınız bir metin komutunu görsele dönüştürebilir. OpenAI, Sora 60 saniye,Bir dakikaya kadar görüntü oluşturabildiğini açıkladı.
bu görsellerden görsel kalite yüksek kalır, oldukça ayrıntılıdır, karmaşık hareketler içerir ve canlı duygulara sahip birden fazla karaktere sahiptir. Yerleştirebildiği belirtildi. Görsellere baktığımızda korkutucu derecede gerçekçi olduğunu görebiliyoruz. OpenAI’nin açıklaması şu şekilde:
Sora, güvenlik testçilerinin yanı sıra sanatçılar, film yapımcıları ve tasarımcılar gibi kişilerin kullanımına da sunulacak. Bu kişiler yapay zeka aracını kullanarak geri bildirim sağlayacak ve modelin daha da geliştirilmesine katkıda bulunacak.
Ayrıca görüntülerden görüntüler üretebilir
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
* Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Bunun dışında OpenAI, yalnızca metinlerden değil görsellerden de görseller oluşturabildiğini ekledi. Şirketin açıklamasına göre mevcut bir görseli alıp ondan bir görsel üretebiliyor. Bu görselde de küçük detaylara ve detaylara dikkat ediyor.
Bazı zayıf yönleri de yok değil.
Elbette model şu anda test aşamasında olduğu için zayıf yönleri de var. OpenAI de bunu kabul ediyor. Şirket bazen karmaşık sahnelerin fiziğini analiz ediyor. Doğru şekilde simüle etmek zor olabilirVe neden-sonuç örneklerini anlamayabilirdiyor.
Örneğin oluşturulan bir görselde bir kişinin kurabiyeyi ısırdığını ancak sonrasında bu kurabiyenin üzerinde herhangi bir ısırık izi kalmadığını görebiliriz. Ayrıca sağ, sol gibi detayları karıştırabileceği ve kameranın gidişatını takip etmek için zamanla oluşabilecek olayları açıklamakta zorluk çekebileceği de söyleniyor.
Yine de örnek görsellere baktığımızda Sora’nın ne kadar potansiyele sahip olduğunu görebiliyoruz. Yapay zeka modellerinde devrim yaratacak potansiyele sahip olduğu aşikar. Herkesin yanına geldiğinde neler yapabileceğini göreceğiz.
Sora ile üretilen daha fazla görsel örneği
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024