为了看看AI有多强,有人带它玩了一次“剧本杀”

 2022-05-06 09:20:14    19  

你爱玩剧本杀吗?

有一个好消息是,再也不用为凑不够队友而发愁了;坏消息是,你再也摸不透、看不穿你的队友了——因为有人借助浪潮信息推出的源1.0模型训练出可以在剧本杀里扮演角色的AI了。

“我第一次玩剧本杀,没想到是和AI一起,我感觉自己不是很入戏,但是这个蔡晓(AI)比我还入戏。在剧情中我的角色是个‘墙头草’,属于被争取票,这个蔡晓太主动了,让我有点招架不住。频繁的向我示好,然后像一个小女生一样和我谈她的梦想,整得我都不好意思拒绝。”一位真人玩家“孔墨”这样说。

以剧本杀这个设定的场景来应用“预训练大模型”AI带给了开发者和玩家们惊喜和意外。没有十全十美的技术,但技术打开了通往新世界的大门。

这道门会通向未来的元宇宙么?

剧本杀里的训练

教AI玩剧本杀的创意来自6位隔离在上海的编程爱好者,他们来自上海交通大学、华东理工大学还有从事VRAR方面的业界人士。

毕竟是训练AI,剧本还是经过了特别改编,选择了有五个角色的微型线上剧本杀。每场召集四个真人玩家,并在他们不知情的情况下,由AI扮演分配剩下的角色。

“本着细节拉满的原则,我们也为AI准备了一个微信账号,并精心为她设定了昵称和头像,甚至每场游戏前我们还会紧扣时事,为她准备近三天的朋友圈内容,游戏后还会继续连发三天朋友圈内容提供延展剧情。”开发者说。

为了看看AI有多强,有人带它玩了一次“剧本杀”

这样的AI陪玩可谓诚意满满,当玩家们得知自己和AI玩了一场剧本杀时都有些错愕。毕竟,当玩家对AI的角色进行表白时,她的表现绝对是一位忠贞的女友,毫不犹豫派发“好人卡”:我们是最好的朋友。

开发周期虽然是短短的一个月左右,迭代可是每天都要进行的。开发者使用了浪潮源1.0,是一种生成式预训练模型,也是目前世界上最大的单体中文NLP大模型。源1.0擅长的是零样本(Zero-Shot)和小样本(Few-Shot)学习,而非目前更多模型所擅长的微调试学习(finetune)。

如果用一串专业性的数据来描述,源1.0开放API使用的是Language Model(LM)模型结构,参数规模高达2457亿,训练采用的中文数据集达5000GB,相比GPT-3模型1750亿参数量和570GB训练数据集,“源1.0”参数规模领先40%,训练数据集规模领先近10倍。

小样本的好处在于2~3个,甚至1个合适example的示范下,模型可以很好地理解开发者希望实现的“对话策略”,仿佛具有“举一反三”的能力。开发者把AI比作天资聪慧的张无忌,但是如果他碰到的不是世外高人,而是凡夫俗子,每天演示的就是如何上班摸鱼、上课溜号是绝无可能练出九阳神功的。“源1.0模型也是这样,虽然它背了5.02TB的中文数据,差不多相当于500多万本书了,但是它也没玩过剧本杀,能做的就是模拟和有样学样。”

AI需要根据剧情对不同角色采用不同而回答策略,“example语料库”被分装成4个TXT文件,程序会根据提问者去对应选择example来源。不过,在实际游戏中,玩家可能的提问措辞是无穷无尽的。开发者还用到了百度飞桨发布的预训练模型——simnet_bow ,能够自动计算短语相似度,而且运算速度快,显存占用低。

可见训练一个成功的AI也需要博采所长。决定采用哪一款开源模型也要受到如模型特性、API是否足够方便使用等诸多因素影响。“浪潮的工程支持还是很到位的,所以开发门槛其实没那么高。API的相关接口给的很全。我其实不是专业程序员,稍微摸索一下都能够用起来,我觉得可以再进一步做成PaaS平台,服务更多人。”开发者告诉第一财经,团队对浪潮针对prompt生成、request提交以及reply查询给出的范本代码评价极高,表示“好到了我们直接拿来用的程度”。

为元宇宙“注入灵魂”

AI玩剧本杀是一次限定场景下紧密结合自然语言生成与自然语言理解的应用,也是虚拟人在“好看的皮囊”之外生成“有趣灵魂”的一次尝试。

NLP领域在生成式预训练大模型方面已经取得了长足进展,但是智能客服还难言智能,陪伴型的服务机器人比如智能音箱类产品还是会愉快地和主人顶嘴。

“对话有两种,一种是开放语境,就是完全不受限制的。这种对AI的最低要求是说人话,但是对逻辑性、对上下文的理解和所谓的目标性是没有要求的,这种很难有现实价值,如果是目标性对话,传统的做法就不太能满足需求。”

AI剧本杀的开发者想要做点改变,引入了“端到端”的做法。“我们也发现AI如果不记忆自己之前的答案,后续生成的结果会比较缺乏连续性,甚至给出前后矛盾的回答。这些问题迫使我们决定增加‘多轮对话记忆机制’。” 在合适的 example的引导下,甚至能够体现出一定的情商,增加了情绪化的表达。

为了看看AI有多强,有人带它玩了一次“剧本杀”

开发者提供示例

“也不是说是每次AI都会这样,是有随机性的。举这个例子说明大模型的生成机制下,它会表现的不仅说人话了,还会带一点人味,这个都是新特性,很有意思的新特性。”开发者告诉第一财经。

此外,就如人类在日常生活中也不会记住所有事情,没有“注意力机制”的“记忆机制”其实对于对话AI来说是弊大于利的。然而,如果要引入“注意力机制”,那就要增加更加复杂的NLU(自然语言理解)算法。好在剧本杀的实际应用场景更多关注当前轮次的对话,对于需要遥远轮次对话内容回答的情况,AI可以托言“忘记了”。

“对于我个人来讲的话,现在对AI的研究和应用完全是兴趣状态,接下来我们可能会跟高校和文娱业内的一些专业人士有一些课题上的研究合作。”AI当然可以陪人类一起玩剧本杀,但是还有更多的可能性等待探索。

  •  标签:  
相关推荐
为了看看AI有多强,有人带它玩了一次“剧本杀”科技数码

社区作为城市的基本细胞,是城市发展水平和人民生活质量的载体。近几年,物业企业在互联网技术快速发展的大趋势下,让社区变治理为“智理”,尤其是在疫情等社会重大事件上,物企打造的智慧社区,形成一套快速反应机制,高效助力疫情防控。“对于物业企业而言,从基础服务拓展到社区治理,这一过程的变化非常明显。”北京物业管理行业协会副会长兼秘书长宋宝程如是说。而从智慧社区的建设来看,虽然还未真正实现大规模应用,但融入社会基层服务治理的大趋势已经显现。【痛点】疫情防控下,小区出入管理效率不高,查验时间过长;有维修需求

2022-05-17  1
为了看看AI有多强,有人带它玩了一次“剧本杀”科技数码

  2020年,宁夏全社会R&D经费支出为59.6亿元,年均增速达到15.3%,R&D经费投入年均增速位居全国前列;  企业研发经费达47亿元,占全社会研发经费的78.8%;  全区万人有效发明专利拥有量达5.31件,是2017年的1.6倍;  宁夏综合科技创新水平指数达到56.11%,迈入二类创新地区;  全区科技成果登记数从2017年的269件增长到2021年的628件,年均增长24%……  这是一张属于宁夏科技创新的5年“成绩单”,也是一幅记载自治区党委、政府认真贯彻习近平总书记视察宁夏重

2022-05-17  1
为了看看AI有多强,有人带它玩了一次“剧本杀”科技数码

36氪获悉,“乐途科技”已于近日完成1800万元天使轮融资。本轮投资由科大讯飞易听说旗下创投基金、浙大校友会基金、以及某产业基金联合投资,融资资金将主要用于直营合伙人门店扩张、AI2.0人工智能私教助手研发上线、数据运营中台能力建设及市场营销等。

2022-05-17  2
为了看看AI有多强,有人带它玩了一次“剧本杀”科技数码

进入自治区科技厅官方网站,前不久新开通的“科技政策咨询投诉平台”十分显眼。公众通过这个平台可进行政策咨询和投诉,近年来国家、自治区出台的各类科技政策落实得怎么样?还存在哪些问题?上平台一查,心中有数。这是我区围绕科技部将今年确定为“科技政策落实年”部署的重要举措,目的是推进一系列科技政策落地见效,更好服务创新发展。九天智能科技(宁夏)有限公司年产2亿片半导体模块一期项目生产车间,工人在作业。    近年来,我区深入贯彻习近平总书记视察宁夏重要讲话精神,全面落实中央和自治区科技创新部署,坚定不移贯

2022-05-17  1
为了看看AI有多强,有人带它玩了一次“剧本杀”科技数码

5月16日,中国信通院公布了今年3月国内手机市场的出货量数据,2022年3月国内手机市场总出货量为2146万部,同比下降了40.5%之多。今年第一季度,国内市场手机总体出货量为6934.6万部,同比下降29.2%,暴跌近三成。中老年人换机频率极低,智能手机的消费主力是年轻人,所以手机出货量暴跌和年轻人换机需求的大幅下滑,有非常大的关系。此前“00后为什么不愿换手机”、“年轻人为什么不愿换手机”都曾引发热议,那为什么大家都不换手机?在笔者看来,无非有以下三点原因。第一,手机性能越来越强,没必要换随

2022-05-17  1

原文链接:https://www.tscy18.com/kejism/15774.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 315661083@qq.com 举报,一经查实,本站将立刻删除。