Yayınlanan duyuruya göre Microsoft VASA-1, 6,112 ünlü için 1 milyondan fazla söylem içeren VoxCeleb2 Veri Seti’nden elde edilen verilerle eğitilmiş.

Microsoft VASA-1 Fotoğrafları Canlandıran Yapay Zeka! Tehlike Kapıda mı?

yazar:

kategori:

Microsoft VASA-1 yapay zeka teknolojisi sabit fotoğrafları canlandırarak kişilerin konuşmasını veya şarkı söylemesini sağlayan gerçekçi videolar üretme kapasitesine sahip. Yaşanılan bu son gelişme dijital içerik üretiminin geleceğini nasıl şekillendirebileceğine dair çarpıcı bir örnek olarak karşımıza çıkıyor.

Microsoft Research Asia’nın geliştirdiği VASA-1 adlı yeni bir yapay zeka aracı bir kişinin fotoğrafını veya çizimini alıyor, var olan bir ses dosyasıyla birleştirerek gerçek zamanlı ve gerçekçi bir konuşan yüz animasyonu yaratıyor. Yapay zeka türleri arasında olan bu muhteşem araç bir fotoğraftaki yüz ifadelerini ve baş hareketlerini canlandırabiliyor. Ek olarak konuşma veya şarkıya uygun dudak senkronizasyonunu da sağlayabiliyor. Araştırmacılar projenin web sayfasında bir dizi örnek sergiledi ve sonuçlar o kadar mükemmel ki izleyicileri gerçek olduklarına inandırabilecek kapasitede.

Microsoft VASA-1 Potansiyel Tehlike mi?

Testlerde dudak ve baş hareketlerinin robotik ve senkronizasyon dışı olduğu durumlar gözlemlenebiliyor. Teknolojinin kötüye kullanım riskleri de açıkça ortada. Özellikle gerçek kişilerin deepfake videolarını hızlı ve kolay bir şekilde üretmek için kullanılabilir. Yapay zeka uzmanları bu potansiyel tehlikelerin farkındalar. Teknolojilerinin sorumlu bir şekilde ve uygun düzenlemelere uygun olarak kullanılacağından emin olmadan herhangi bir çevrimiçi demo, API, ürün, ek uygulama detayları veya ilgili teklif yayınlamayacaklarını belirtmişler. Kötü niyetli kullanımları örneğin deepfake pornografi veya yanıltıcı bilgi kampanyaları oluşturmak için kullanılmasını engellemek adına alınacak güvenlik önlemleri konusunda ise henüz bilgi vermediler.

Geliştiriciler teknolojinin kötüye kullanım potansiyeline karşın birçok olumlu kullanım alanı olduğuna inanıyorlar. Eğitimde eşitliği artırma, iletişim güçlükleri yaşayan bireylere yardımcı olma ve onlara konuşabilecek bir avatar sağlama gibi yollarla erişilebilirliği iyileştirebileceğini savunuyorlar. İhtiyaç duyan bireylere arkadaşlık ve psikolojik destek sunma imkanı da tanıyorlar. Microsoft VASA-1’in insanlarla etkileşim kurabilecek yapay zeka karakterleri oluşturmak için kullanılabileceği de gündemde.

Microsoft VASA-1 İle Yapılan Paparazzi Şarkısı

Yayınlanan duyuruya göre Microsoft VASA-1, 6,112 ünlü için 1 milyondan fazla söylem içeren VoxCeleb2 Veri Seti’nden elde edilen verilerle eğitilmiş. Araç gerçek yüzler üzerinde eğitilmiş olmasına karşın sanatsal çizimlerde de etkili. Yazılım uzmanları Anne Hathaway’in Lil Wayne’in Paparazzi şarkısını seslendirdiği viral bir video ile Mona Lisa’nın fotoğrafını birleştirerek bunu eğlenceli bir şekilde göstermişler. Bu örnekler teknolojinin olumlu yönlerine şüpheyle yaklaşanlar için dahi dikkate değer. Eğer yapay zeka alanına ilgi duyuyorsanız, yapay zeka alanında kariyer ipuçları makalemiz size ilham olacaktır.

Paylaş, eş dost da duysun!

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir