人工智能会创造自己的语言吗?

 2022-06-11 18:20:09    13  

据澳大利亚“对话”网站6月7日刊登了一篇题为《人工智能真的发明了自身“秘密语言”吗?》的文章,主要内容编译如下:

新一代人工智能模型可以在文本提示的基础上,按照需求制作出“创造性”图像。诸如Imagen、MidJourney和DALL-E 2等图像生成系统正在开始改变创作内容对版权和知识产权的影响方式。

虽然这些模型的输出往往令人震惊,但是现在还难以确定它们究竟是如何产生结果的。上周,美国研究人员令人饶有兴趣地宣称:DALL-E 2模型或许发明了自身的秘密语言。

通过提示DALL-E 2系统创作包含文本字幕的图像,然后再将由此产生的字幕gibberish(令人费解的胡话)输回系统,研究人员发现:DALL-E 2认为“Vicootes”的意思是“蔬菜”,而“Wa ch zod rea”则是指“鲸可能会吃的海洋动物”。

人工智能会创造自己的语言吗?

人工智能(视觉中国)

这些说法令人着迷,如果属实,可能对这种大型人工智能模型产生重要的安全与解读能力影响。那么,真相到底如何呢?

拥有秘密语言?

DALL-E 2可能并无“秘密语言”。或许比较准确的说法是,它拥有自己的词汇,但是即便如此,我们也没把握。

首先,这个阶段,很难证明有关DALL-E 2及其他大型人工智能模型的任何说法,因为只有少数研究人员和创意从业者接触它们。

公开分享的任何图像都应打个折扣,因为它们是由人从人工智能创作的很多图像中“筛选出来的”。

即使是那些接触这些系统的人,也只能有限使用这些模型。比如,DALL-E 2用户可以制作或修改图像,但是(迄今)不能更深入地与人工智能系统互动,比如修改幕后代码。

这意味着不能用“可解释的人工智能”的方法理解这些系统的工作原理,而系统性地研究其行为也非常困难。

一种可能是,“令人费解的胡话”短语与来自非英语的词语有关。比如“Apoploe”,类似于拉丁语“Apodidae”(雨燕科)一词,似乎以Apoploe作提示创作出来的图像都是鸟类。

这似乎是一种合理的解释。比如,DALL-E 2接受大量基于互联网搜索而来的数据的训练,包括很多非英语词语。

类似情况以前也发生过:由于机缘巧合,大型自然语言人工智能模型在没有接受刻意培训的前提下学会了编写计算机代码。

真相扑朔迷离

支持这种理论的一个论点就是如下事实:人工智能语言模型与你我解读文本方式并不相同。相反,它们将输入文本打碎成“令牌”,然后再进行处理。

不同的“令牌化”方法会产生不同的结果。把每个词当作一个令牌,似乎是一种直觉的方法,但是当相同的令牌有不同的意思时(比如“match”一词,当打网球时以及点火时,就有不同的意思),就会引起麻烦。

另一方面,把每一个字母当作一个令牌,所产生的可能的令牌数量较少,但是每个令牌传递的信息含义都要小得多。

DALL-E 2(及其他模型)使用一种中间方法,称做字节对编码(BPE)。检查某些令人费解的胡话的字节对编码表征可以发现,这可能是理解这种“秘密语言”的重要因素。

这种“秘密语言”也可能只是“垃圾进,垃圾出”原则的一个例子。DALL-E 2不会说“我不知道你在说什么”,因此它总是通过给定的输入文本,产生某种图像。

不管怎样,这些选项都不是完整的解释。比如,从令人费解的胡话中去掉个别字母,似乎会以非常具体的方式破坏已产生的图像。而且,将单个胡话词语组合起来,并不一定产生合乎逻辑的复合图像(如果确实存在秘密“语言”,那是可以的)。

正视现有担忧

除了求知欲,你或许在思考这是否真的重要。

答案是,是的。DALL-E的“秘密语言”是机器学习系统“对抗攻击”的一个例子:一种通过故意选择人工智能无法正确处理的数据输入,打破系统的故意行为。

对抗攻击担心的一个原因是:它们挑战我们对这个模型的信心。如果人工智能以意外方式解读胡言乱语,那么它或许也会以意外方式解读有意义的词。

对抗攻击也提出了安全关切。DALL-E 2对输入文本进行过滤,防止用户产生有害或侵权内容,但是令人费解的胡话“秘密语言”可能会让用户规避这些过滤。

近期研究发现:某些语言人工智能模型的对抗“触发短语”——简短的废话,可能触发模型涌出种族主义、有害或带有偏见的内容。这项研究也是目前正在开展的调研活动,以便理解和控制复杂的深度学习系统如何通过数据进行学习。

最后,DALL-E 2“秘密语言”这种现象引起了解读能力担忧。我们希望这些模型按照人类的预期那样表现,但是看到胡言乱语的结构化输出令我们的预期受挫。

你或许还记得2017年关于脸书网站一些“发明了自身语言的”聊天机器人的喧嚣争论。现在局面有点类似:结果令人担忧,但不是那种“‘天网’即将取代世界”式的担忧。

相反,DALL-E 2的“秘密语言”突出了目前对于深度学习系统的稳健性、安全以及解读能力的担忧。

在这些系统较广泛地应用之前,特别是,在来自非英语文化背景的广泛用户能够应用它们之前,我们确实无法真正了解到底在发生什么。

来源:参考消息网

  •  标签:  
相关推荐
人工智能会创造自己的语言吗?科技数码

最近#年轻人不爱换手机#的话题再次登上热搜,在手机技术日新月异的今天,为什么年轻人不愿意买手机了呢?我之前就发表过我的观点,第一是手机单价并不便宜,很多年轻人觉得频繁换手机,钱包伤不起;第二手机更新迭代太快,性能严重溢出,手机几年不卡,导致没有换机欲望。当然,作为万千年轻群体中的一员,我也已经三年没换手机了,一直使用的是三年前买的荣耀20 Pro,这款麒麟980芯片的手机即使用到今天,它的体验也不算差,虽然流畅度和今天的旗舰U,高刷屏没法比,但整体体验并不会让人觉得难受。之前用了3年的荣耀20

2022-06-22  4
人工智能会创造自己的语言吗?科技数码

目前市面上有很多高性价比热门手机都集中在2~3K价位段,这也正好在大多数小伙伴购买手机的预算范围之内。今天就给大家推荐几款该价位段比较值得购买的热门手机。OPPO K10OPPO K10采用了今年比较流行的大视窗相机模组,且与后盖配色保持一致,既有辨识度又精致好看。正面配备了一块6.59英寸LCD 120Hz高刷变速屏,刷新率支持多档调节,既流畅又省电。拥有600nits峰值亮度,户外阳光下也能看得清。性能方面,OPPO K10搭载了天玑8000-Max处理器,拥有旗舰级别的强大性能,且功耗控制

2022-06-22  6
人工智能会创造自己的语言吗?科技数码

近期随着618临近,京东商城各类手机均有一些折扣活动,小编整理了目前在2000元价位最值得购买的手机推荐给大家。OPPO K10目前OPPO K10京东售价1889元,但现在下单可获赠耳机、机器人音箱一个。OPPO K10虽然不到2000元,但配置上却十分讲究。处理器方面这款产品使用联发科天玑8000-MAX芯片,8颗核心运行频率可以达到2.75GHz,足以应对《王者荣耀》这类游戏。此外,这款产品还配备了67W超级闪充以及5000mAh超大电池,这样的配置保障了户外续航和手机充电速度。另一方面O

2022-06-22  5
人工智能会创造自己的语言吗?科技数码

近日知名行业分析机构Strategy Analytics公布了2022年第一季度中国智能手机市场畅销榜前十的名单。iPhone 13不出意外地位居了榜首,下面带大家看看还有哪些机型上榜了吧。iPhone 13系列iPhone 13可以说是去年和现在都十分畅销的智能手机,A15+6.1英寸OLED屏幕的配置使其可以满足大部分用户的使用需求。iPhone 13 128GB版目前在京东自营平台领券到手价为5399元。iPhone13 Pro Max和iPhone13 Pro也均有上榜。荣耀50荣耀50

2022-06-22  5
人工智能会创造自己的语言吗?科技数码

人工智能是业务的一部分吗?或者它是一个实用程序?如果你是数字原生代,人工智能可能是业务运行的燃料的一部分。但在一个拥有传统业务或正在转型的大型组织中,如何衡量投资回报率是他们必须解决的一个基本问题。报道 | 吴昕与以往任何时候相比,现在各企业都对人工智能和机器学习的潜力充满信心并加以投入。根据 2022 年 IBM 全球人工智能采用指数(IBM Global AI Adoption Index 2022),35% 的公司报告称目前在其业务中使用人工智能,另有 42% 的公司表示他们正在探索人工智

2022-06-22  6

原文链接:https://www.tscy18.com/kejism/20320.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 315661083@qq.com 举报,一经查实,本站将立刻删除。