Kitap dünyasına açılan kapınızı aralayın! En sevdiğiniz kitapları indirimli fiyatlarla keşfedin ve hayal gücünüzü genişletin.
Şirket, bu modeli fiziksel dünya yapay zekası kapsamında geliştirdiğini belirterek, robotların algılama, düşünme ve eylem kabiliyetlerini birleştiren ileri bir sistem sunduğunu açıkladı.
Rho-alpha, Microsoft’un Phi serisi görsel-dil modelleri temel alınarak tasarlanan ilk robotik model olarak öne çıkıyor. Şirket, modelin robotların çevreyi algılamasını, insan diliyle verilen komutları yorumlamasını ve bu komutlara fiziksel dünyada cevap vermesini hedeflediğini belirtti. Bu yaklaşım, geleneksel robotik programlamanın ötesine geçerek robotların insan gibi anlayıp eyleme geçmesine olanak tanıyor.
Rho-alpha, yalnızca kameradan görme ve doğal dil anlama kullanmıyor, dokunsal algı yeteneklerini de entegre ediyor. Bu sayede robotlar, yalnızca görsel bilgiye dayanmak yerine temasla ilgili geri bildirimleri de işleyerek daha karmaşık görevlerde hassas hareket kabiliyeti sergileyebilecek. Şirket, ileriye dönük olarak kuvvet algısı gibi ek duyusal modların da modele ilave edileceğini belirtiyor.
Microsoft, Rho-alpha’nın öğrenme sürecini klasik sabit programlardan çıkarmaya çalışıyor. Model, robotun bir görevde hata yapması durumunda operatörlerin gerçek zamanlı müdahalesini örnek olarak alıp bunları öğrenme fırsatı olarak kullanabiliyor. Bu yöntem, robotların ortama ve kullanıcı tercihlerine daha dinamik şekilde uyum geliştirmesine yardımcı oluyor.
Robotik verilerin toplanması, özellikle dokunsal geribildirim gibi duyusal veriler için zor ve maliyetli olduğundan, Microsoft çeşitli veri kaynaklarını bir araya getiriyor. Bunlar arasında: Gerçek robot gösterimleri, simülasyon ortamlarında üretilen sentetik veriler ve web ölçeğinde görsel soru-cevap (VQA) veri kümeleri bulunuyor.