小扎下血本!Meta专为元宇宙搞了个AI模型

 2022-07-29 05:00:14    14  

编辑:David Joey

【新智元导读】专门为元宇宙打造的AI框架,是什么样子的?

人工智能将成为虚拟世界的支柱。

人工智能在元宇宙中可与多种相关技术结合,如计算机视觉、自然语言处理、区块链和数字双胞胎。

2月,扎克伯格在该公司的第一个虚拟活动——Inside The Lab中展示了元宇宙的样子。他说,该公司正在开发一系列新的生成式AI模型,用户只需通过描述就可以生成自己的虚拟现实化身。

扎克伯格宣布了一系列即将推出的项目,例如CAIRaoke项目,一项用于构建设备语音助手的完全端到端的神经模型,可帮助用户更自然地与语音助手进行交流。

同时,Meta正努力构建一个通用语音翻译器,可为所有语言提供直接的语音到语音翻译。

几个月后,Meta兑现了他们的承诺。

然而,Meta并不是唯一一家在游戏中拥有皮肤的科技公司。

英伟达等公司也发布了其自主研发的AI模型以提供更丰富的元宇宙体验。

开源预训练Transformer(OPT-1750亿参数)

GAN verse 3D

GANverse 3D由英伟达AI Research开发,是一种使用深度学习将2D图像处理成3D动画版本的模型,去年的ICLR和CVPR上发表的一篇研究论文中介绍了该工具,它可以用更低的成本更快地生成模拟。

该模型使用StyleGAN可自动从单个图像生成多个视图。该应用程序可以作为NVIDIA Omniverse的扩展导入,以在虚拟世界中准确地渲染3D对象。

英伟达推出的Omniverse可帮助用户在虚拟环境中创建他们最终想法的模拟。

3D模型的制作已成为构建元宇宙的关键因素。耐克和Forever21等零售商已经在元宇宙建立了他们的虚拟商店,以推动电子商务销售。

视觉声学匹配模型(AViTAR)

Meta的现实实验室团队与德克萨斯大学合作,建立了一个人工智能模型,以改善元空间的声音质量。该模型帮助匹配场景中的音频和视频。

它对音频片段进行转换,使其听起来像是在特定环境中录制的。该模型在从随机的在线视频中提取数据后使用了自我监督学习。

理想情况下,用户应该能够在他们的AR眼镜上观看他们最喜欢的记忆,并聆听实际体验中产生的确切声音。

Meta AI发布了AViTAR的开源,同时还发布了其他两个声学模型,考虑到声音是metaverse体验中经常被忽视的部分,这是非常罕见的。

视觉影响的减震(VIDA)

Meta AI发布的第二个声学模型被用来去除声学中的混响。

该模型是在一个大规模的数据集上训练出来的,该数据集有各种来自家庭三维模型的真实音频渲染。混响不仅降低了音频的质量,使其难以理解,而且还提高了自动语音识别的准确性。

VIDA的独特之处在于,它在使用视觉线索的同时也使用音频方式进行观察。在典型的仅有音频的方法的基础上进行改进,VIDA可以增强语音,并识别语音和说话者。

视觉语音(VisualVoice)

Meta AI发布的第三个声学模型VisualVoice可以从视频中提取语音。与VIDA一样,VisualVoice也是根据未标记的视频中的视听线索进行训练。该模型已经自动分离了语音。

这个模型有重要的应用场景,如为听障人士制作技术,增强可穿戴AR设备的声音,从环境嘈杂的在线视频中转录语音等。

Audio2Face

去年,英伟达发布了Omniverse Audio2Face的开放测试版,以生成人工智能驱动的面部动画,以匹配任何配音。该工具简化了为游戏和视觉效果制作动画的漫长而繁琐的过程。该应用还允许用户以多种语言发出指令。

今年年初,英伟达发布了该工具的更新,增加了BlendShape Generation等功能,帮助用户从一个中性头像中创建一组blendhapes。此外,还增加了流媒体音频播放器的功能,允许使用文本到语音应用程序的音频数据流。

Audio2Face设置了一个3D人物模型,可以用音轨做动画。然后,音频被送入一个深度神经网络。用户还可以在后期处理中编辑角色,改变角色的表现。

参考资料:

https://analyticsindiamag.com/ai-models-built-for-the-metaverse/

  •  标签:  
相关推荐
小扎下血本!Meta专为元宇宙搞了个AI模型科技数码

wuhu专题编辑 | 新桥别亦当我们一边在想AI(人工智能)可否取代人类时AI已经不知不觉间渗透到了我们生活中的各个细枝末节在艺术创作领域以AI为核心的众多技术如AI换脸、AI影像、AI角色、AI游戏、AI动画……AI动画黑科技!做动画不用加中间画了?杨幂换脸朱茵!?「AI换脸」!太可怕了!AI一键生成《双城之战》风格?!但如果要说当下最热的AI技术那一定非AI绘画莫属了!甚至有人将今年定义为“AI 绘画元年”从科技大厂纷纷宣布新产品以及众多国内外艺术创作者的反响来看此话不无道理今年4月由艺术家

2022-08-08  4
小扎下血本!Meta专为元宇宙搞了个AI模型科技数码

写在前面2021年年末,《科学》杂志提名了十项年度科学突破,其中不少进展与生命科学息息相关,而且充分展现了现阶段科学突破中,生命科学与其他学科交叉碰撞出来的强大能量。今天我们来聊聊这里面最受瞩目,同时也是连续两年入选的一项——AI预测蛋白质结构。过去的几十年里,世界各地的顶尖结构生物学家完成了大约18万种蛋白质结构的解析;但在过去的两年里,AlphaFold 完成了人体内几乎所有蛋白质的结构预测,AI预测蛋白质结构为何如此神奇?又有哪些价值?我们先不谈蛋白质结构,说到人工智能,大家会想到什么?我

2022-08-08  2
小扎下血本!Meta专为元宇宙搞了个AI模型科技数码

“您好,现在已经过了定时投放时间,请将垃圾投放至附近的误时投放点。”在广州市黄埔区文冲街道瑞东花园社区一个垃圾投放点,清晰的提示语音及时纠正居民错误投放垃圾的行为。自从瑞东花园投放点安装“桶外抓拍和监控系统”后,该小区的市容环境和垃圾分类工作彻底更上新台阶,同时又成为该小区暑假小朋友每日参与垃圾精准分类的网红打卡点。在黄埔区,垃圾分类玩起了“科技范儿”,瑞东花园社区智慧化的投放点即是一个缩影。近年来,黄埔区结合人脸识别、精准溯源等科技元素,不断推动生活垃圾分类工作信息化、科技化,探索构建垃圾分类

2022-08-08  3
小扎下血本!Meta专为元宇宙搞了个AI模型科技数码

最近,人们不难发现一个现象,就是虽然下半年已经经过了一个月,但我们发现手机市场依然十分不火爆,热度不高。虽然到了9月,华为的Mate 50和苹果的iPhone 14系列就将登场,但现在的热度也没法和以前相比了。那么,我们不妨总结下,目前手机市场的趋势有哪些,我们又该如何选购一款称心如意的产品呢,一起来看看。趋势一,新定位,手机已沦为传统产品。根据中国信通院发布的“2022年6月国内手机市场运行分析报告”显示,1-6月,国内市场手机总体出货量累计1.36亿部,同比下降21.7%,降低不少。而调研机

2022-08-07  5
小扎下血本!Meta专为元宇宙搞了个AI模型科技数码

 “白色部分是盐分,它不断溶解结晶,砂岩的表层颗粒会脱落。”在我国文化遗产领域首个多场耦合实验室内,敦煌研究院副院长郭青林认真介绍。  这个位于甘肃省敦煌市的实验室占地1.6万平方米,可模拟日照、降雨、降雪等各种环境条件。  “在实验室建立之前,小样品难以真实模拟自然条件下的劣化过程。”郭青林说,比如,真实环境下,雨水渗入遗址墙体内,又在太阳下蒸发,周而复始。微缩样品难以模拟出这一过程。而在真实自然条件下测试,需要“天公作美”,得等时间,无法做到试验条件的重复。相比之下,多场耦合实验室具有时间可

2022-08-07  3

原文链接:https://www.tscy18.com/kejism/24180.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 315661083@qq.com 举报,一经查实,本站将立刻删除。