Fotoğrafı çekmiyor, doğruda o anı oluşturmayı hedefliyor
Hedef VR ve meteverse mi?
Meta, bu yeni oyuncakla nelerin yapılacağına örnekler vermekten kaçınmıyor. Doğrusu Meta açıkça temel maksadını muhakkak etmekten de çekinmiyor: VR, karma gerçeklik ve metaverse. Örneğin, gelecekte büsbütün gerçek 3D sahneleri (ses, hareket vb. ile) anında oluşturabilen bir başlık hayal edin. Ya da sanal oyun geliştiricileri, tasarım süreçlerindeki ayak işlerinin birçoklarını ortadan kaldırmak için bunu kullanabilirler.
Meta blog yazısında, “Tipik yapay zeka sistemlerinde, her bir modalite için belli bir gömme (yani, bilgileri ve makine tahsilindeki münasebetlerini temsil edebilen sayı vektörleri) vardır. ImageBind, her farklı modalite kombinasyonuna sahip bilgiler üzerinde eğitim yapmaya gerek kalmadan birden fazla modalite genelinde ortak bir gömme alanı oluşturmanın mümkün olduğunu gösteriyor.” diyor.
Meta, ImageBind’ı bu noktada durdurmak da istemiyor. Evet, model 6 farklı duyuyu yahut modu birleştiriyor fakat Meta ilerleyen devirlerde altı modalitenin yanında dokunma, konuşma, koku ve beyin fMRI sinyalleri üzere mümkün olduğunca çok sayıda duyuyu birbirine bağlayan yeni modaliteler sunmayı da hedefliyor.