Her Dili Konuşun: Synthesia’nın Yapay Zeka Videoları Dil Engellerini Aşıyor

24 Haziran 2024
Her Dili Konuşun: Synthesia’nın Yapay Zeka Videoları Dil Engellerini Aşıyor
72
Gösterim

İngiliz yapay zeka girişimi Synthesia, pazartesi günü aralarında yapay zeka avatarları kullanarak sadece dizüstü bilgisayar web kameranız veya telefonunuzla Apple tarzı sunumlar oluşturma yeteneği bulunan bir dizi yeni ürün güncellemesini tanıttı. Yedi yıllık geçmişe sahip Nvidia destekli firma, yeni ürün güncellemelerinin, kullanıcıların yapay zeka ile oluşturulmuş avatarlar oluşturma yeteneği sunan bir platformdan ziyade, büyük şirketler için daha kapsamlı bir video prodüksiyon paketi haline getireceğini söyledi.

Synthesia’nın piyasaya sürdüğü yeni güncellemeler arasında web kamerası veya telefon kullanılarak yapay zeka avatarları oluşturma, elleri ve kolları olan “tam vücut” avatarlar ve izlerken sizi yönlendiren bir yapay zeka avatarı gösteren bir ekran kaydetme aracı bulunuyor.

Synthesia Neler Yapar?

Fortune 500 şirketlerinin neredeyse yarısı tarafından kullanıldığını söyleyen Synthesia, yapay zeka avatarlarını her türlü amaç için kullanıyor. Bunlar, çalışanları belirli süreçler boyunca yönlendirmek için özel olarak hazırlanmış eğitim videoları oluşturmaktan veya e-posta veya diğer metinsel iletişimler yerine video şeklinde gösterilebilecek tanıtım materyalleri oluşturmaya kadar uzanabilir.

Ancak durum her zaman böyle değildi. Kurucu ortak ve CEO Victor Riparbelli’ye göre, şirketin hikayesinin ilk üç yılında Synthesia, teknolojisini Hollywood ajanslarına ve büyük bütçeli video prodüksiyon şirketlerine satmaya çalıştı. Firma, farklı diller için ağız hareketlerini daha gerçekçi hale getiren bir yapay zeka dublaj aracı için bilgisayar görüşünü kullandı. Riparbelli, CNBC ile Londra ofisinde yaptığı röportajda, “Bunlarla herhangi bir şey yapmak için kalite eşik değerinin çok yüksek olduğunu, ne yaparsak yapalım, çok daha büyük bir sürecin çok küçük bir parçası olacağımızı anladık” dedi. “Daha ilginç olan şey, dünyada video yapmak isteyen milyonlarca insan var, ancak bugün video yapmıyorlar çünkü bütçeleri yok.”

Synthesia’nın CEO’su, şirketin yeni ürünlerini işletmeler tarafından kullanılabilecek daha üretkenliğe odaklı bir araç seti olarak tanıttı. Web Kameranızla Apple Tarzı Tanıtımlar Şirketin sergilediği en büyük yeni özelliklerden biri, web kamerası veya telefonunuzu kullanarak beş dakikadan kısa bir süre kayıt yaparak yapay zeka ile oluşturulmuş avatarlar yapma seçeneğiydi. Avatarların birden fazla dilde konuşmasını sağlamak için sesinizi de klonlayabilirsiniz.

Normalde, Synthesia’nın platformunu kullanarak bir yapay zeka avatarı oluşturmak için stüdyoya şahsen gitmeniz gerekir. İnsan oyuncular kayıt kabinine girer, seslerini kaydeder ve gerçek bir çekim setinde yeşil ekran önünde repliklerini söyler. Bunların hepsi, Synthesia’nın yapay zeka algoritmasına insan benzeri avatarlar oluşturmak için ihtiyaç duyduğu yüz ve ses nüanslarını sağlamak için eğitim verileridir. Synthesia, bu yılın başlarında mutluluk, üzüntü ve hayal kırıklığı gibi insan duygularını ifade edebilen yeni ifadeli avatarlar sunmuştu. Ancak şimdi Synthesia, kullanıcıların sadece bir web kamerası ve Synthesia’nın yazılımını kullanarak herhangi bir yerden kendilerinin dijital bir versiyonunu üretmelerini kolaylaştıracak yeni bir yazılım sunuyor.

Şirket ayrıca, yalnızca portre görünümüyle sınırlı olan Synthesia’nın mevcut avatarlarının aksine, tam vücut avatarları oluşturma yeteneğini de başlatıyor. Artık onlarca kamera, sensör ve ışıkla çevrili bir stüdyoya girerek ellerini hareket ettirebilen avatarlar oluşturabilirsiniz. Ellerin oluşturulması geleneksel olarak yapay zeka için zor olan bir şeydir – çünkü eller genellikle insan vücudunun yalnızca küçük bir parçasıdır ve genellikle görsel içerikte odak noktası değildir. Synthesia ayrıca, istedikleri herhangi bir dilde konuşan yapay zeka avatarlarının videolarını oynatma seçeneğini de sundu.

Yerel Karakter İle Sunum

Synthesia, yapay zeka avatarlarını farklı ülkeler ve kültürler için özelleştirmeyi planlıyor. Bu, avatarların görünümünü, dilini ve davranışlarını yerel normlara ve beklentilere uyacak şekilde uyarlamayı içeriyor. Örneğin, Synthesia, bir Amerikan öğretici videosu için tipik bir Amerikalı görünümlü bir avatar oluşturabilirken, Nijeryalı bir izleyici kitlesi için Nijeryalı bir görünüme sahip bir avatar oluşturabilir. Bu, videoların daha ilgi çekici ve ilişkilendirilebilir olmasını sağlayarak, Synthesia’nın küresel pazardaki etkisini genişletmesine yardımcı olabilir.

Diğer Özellikler

Synthesia, yapay zeka avatarlarının yeteneklerini geliştirmeye de devam ediyor. Gelecekteki güncellemeler, avatarların duyguları daha iyi ifade etmelerini, daha karmaşık etkileşimlere girmelerini ve hatta gerçek zamanlı olarak izleyicilerle etkileşim kurmalarını sağlayabilir.

Kaynak bağlantısını ziyaret edin

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir