借助AI 人类能听懂动物的“喜怒哀乐”?

 2022-05-09 11:20:33    10  

谭茗洲 远望智库人工智能事业部部长、图灵机器人首席战略官

在《安徒生童话》等文学作品,以及不少优秀的影视作品中都反映了同一个主题——人与动物的交流互动。如今,世界各地的学者们试图通过人工智能等途径打破人与动物的语言屏障,真正实现跨物种的沟通,甚至情感交流。

近日,一个由丹麦哥本哈根大学、瑞士苏黎世联邦理工学院,以及法国国家农业、食品和环境研究所等研究人员组成的国际研究小组,开发出一款人工智能产品,可以翻译家猪在各种场景中发出的声音,成功解码了其叫声中所传递的“喜怒哀乐”。该研究成果发表在最新一期的《科学报道》期刊上。那么,人工智能是否可以实现人与动物的沟通?算法具体是如何分辨动物情绪的?目前,人类要通过AI理解动物语言,还需克服哪些困难?

已通过算法研究多种动物语言

动物和人一样也会有自己的情绪。它们会快乐、难过、恐惧、愤怒,但受限于语言和表达方式,动物的情绪较难为人所知。其实,在我们听起来大同小异的动物叫声中,或许隐藏着它们不一样的情绪。

上述论文显示,研究人员为了训练AI翻译猪的语言,专门录下了411头家猪发生于19种不同场景中的7000多次叫声。算法执行结果表明,猪积极情绪的呼叫声比负面情绪的呼叫声更短且振幅更低。研究人员称,这种算法的准确率高达92%,可以基本准确地从猪叫声中辨别其情绪。

无独有偶,此前剑桥大学一个科研团队让AI仅根据绵羊的面部表情来识别这只羊是否处于困境之中。AI系统首先根据绵羊疼痛的面部表情,列出与不同疼痛程度相关的几个“面部动作单元”(AU),然后在480张绵羊照片中标记了这些AU——鼻孔变形、每只耳朵的旋转和眼睛的缩小等,以此来判断绵羊的处境。

“其实,借助算法研究动物的语言,以及人与动物之间的沟通,早有先例。之前就有研究宠物狗、猫的项目,这些研究的目的在于让人类便于跟它们更好地相处。”5月4日,远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲在接受科技日报记者采访时指出。

例如,为了实现人宠沟通,日本著名声学专家铃木松美博士利用基于机器学习的动物翻译技术,曾经发明过一款“宠物狗翻译器”。宠物主人只需要将一枚迷你麦克风别在衣领上,所收集到的宠物叫声便会传输到翻译器中进行语音识别和转换,进而向主人传达宠物想要表达的意思,了解它们的情绪。

“此外,还有研究人员研究简单动物的群体智慧,如蜜蜂、蚂蚁的沟通方式,这些研究对于军事战术、设备等有一定的仿生借鉴意义;还有对海豚、鲸鱼这类动物组织化能力的跨学科研究,这类研究对于探究生物进化史非常有价值。”谭茗洲进一步解释。

不懂语言也能获得翻译能力

动物有自己的语言吗?如果有的话,它们会聊些什么?了解动物可以说是人类的一个长久研究课题,目前AI正在帮我们探寻答案。谭茗洲表示:“动物没有人类所特有的语言系统,所以研究人员可以通过结合它们的叫声、行为、习性来分析其诉求,以便更好地了解它们。”

一位研究人员曾经旁听了两只位置相对静止的抹香鲸之间断断续续长达40分钟的“对话”,它们的“对话”几乎每一句都不重样,并且伴有各种动作。这令人不禁猜测:是否这两只母鲸在“拉家常”、分享育儿心得?对抹香鲸“对话”内容的研究,正是近几年由国际科学家团队发起、《国家地理》支持的“鲸语翻译计划”(Project CETI)中的研究内容之一。据报道,研究人员正在使用自然语言处理系统(NLP)分析抹香鲸的40亿个交流代码。NLP是人工智能的一个子领域,专注于处理人类的书面和口头语言。研究团队计划让人工智能将每个声音与特定的背景联系起来,这一过程预计至少需要5年时间。如果该团队实现了这些目标,下一步将是开发和部署一个互动聊天机器人,与生活在野外的抹香鲸进行对话。

发表在《自然》期刊的科学研究证明,人工智能在破译古代人类语言方面非常有效。这为使用AI探索动物语言开辟了可能性。该研究称,机器学习技术提供了新的工具,可以帮助考古学家更快地了解过去,特别是在破译古代文字时。该AI系统采用了古希腊语言和整个古代地中海世界的铭文进行训练,训练数据来自相关人文学院提供的最大的希腊铭文数字数据集,而且这些铭文中的每一条都标注了元数据,其中描述了由历史学家考察出来的铭文的书写地点和时间。有了这些数据,AI就能在这些信息中寻找模式和规律,并利用复杂的数学模型来对这些信息进行编码,然后进一步使用这些推测出的信息来对其他铭文的内容、编写地点和年限进行推断。研究显示,该AI在修复受损文字方面达到了62%的准确率。这也为翻译动物语言提供了灵感。

人工智能在破解古文字和翻译动物语言上往往遵循同样的方法和准则。谭茗洲表示:“在翻译这一经典任务上,机器不需要理解语言,而是仅靠单一语言的语料,即可掌握该语言的句法、语法等关键要素。也就是说,深度学习不懂英语和中文,但是通过大量学习语料即可获得中英互译的能力。”

“归根到底,AI能够翻译、理解动物语言,其背后依然是基于人类对语言进行的有效解读。” 谭茗洲说。

实现跨物种交流尚有很长的路要走

“人类的语言有规律可循,因而不同国家的语言是可以遵循规律去学习的。但动物的语言规则存在未知壁垒,因此AI要实现跨物种语言翻译,尚有一段很长的路要走,需要克服一些困难。”谭茗洲表示。

首先,事实证明,利用受人为偏见影响的数据进行训练的算法很容易将结果导向“歧途”。比如,狗会发出急促的叫声,可能是因为想要向主人乞食,也可能是因为提醒主人警惕陌生人,还可能是对主人不陪自己玩的责怪。但如果研究人员仅基于自己的认知,在对这种叫声数据进行标记的时候,认为这种叫声只表达宠物向主人要食物的需求,从而对数据进行单一标记处理,那么人工智能在学习数据、翻译的时候往往就会产生很大的局限性。这种翻译很容易导致人和宠物的沟通障碍,从而丧失宠语翻译的意义。

“在研究中,科研人员需要去‘人类中心’,也就是说,借助于算法实现的跨物种沟通,需要算法避免人类某些偏见。”谭茗洲指出。

其次,通过AI算法将人类语言与动物语言对应,需要大量、广泛、完善的数据采集和场景训练,以完成对动物语言的解读,实现对“规则”的总结。这需要广泛同步采集动物叫声和脑电波数据并进行比对,再将其纳入数据库。然而不同犬种声带特点不同,面对同一场景的发声表现也不同,而这样的场景和叫声的组合有无数个,这为数据采集工作带来了巨大的挑战。

谭茗洲说,在技术方面,一个AI翻译产品做到精确翻译至少需攻破几个难题:在形式端,如果使用拍译的形式要攻克图像识别相关问题,同声翻译形式则要攻克语音识别相关问题;在内容端,AI翻译产品还要攻克文本语言分析、大数据采集等问题。由于AI缺乏对视觉场景、听觉场景、自然语言处理的常识判断,这还需要AI发展到能够极为精确地处理这些问题的阶段。

此外,有学者指出,动物语言和人语之间的代沟是客观存在的,AI所能做的,只能是不断改进自身的功能,用科学手段完善数据库、内容、语料和场景;形式和内容双管齐下,才能将这条横亘在动物和人之间的语言鸿沟填平,在坚实的地基上实现人和动物的有效沟通。

“尽管有些研究也曾获得了很大的进展,但是其中的问题也无法被忽视。目前来看,相关研究仅仅只是在一定程度上实现了人与动物之间简单的信息传递,离实现真正的跨物种交流,恐怕还有很长的一段路要走。从短期来看,要想实现跨物种交流还很难,但越来越多的研究无疑正在为其打开一扇扇大门。”谭茗洲表示。华 凌

来源: 科技日报

  •  标签:  
相关推荐
借助AI 人类能听懂动物的“喜怒哀乐”?科技数码

“水火箭”“空气炮”“编程无人机”“3D打印”……在校园科技节上,同学们踊跃参与、争相体验探索科学的快乐。为培养学生创新精神和实践能力,5月18日,郁南县四一八小学举办第一届校园科技节,全校师生共同参与其中。郁南县政府副县长杨桂平等参加本次活动。一场精彩有趣的科技秀无人机和机械狗最受欢迎本次科技节活动形式多样,共分成十个区域进行展示,设置了水火箭、编程无人机、3D打印等多个项目,涵盖了力学、电学、物理学等多方面的科学知识,现场还有智能机械狗、乒乓球机关枪、空气炮、科学实验等的演示。在分区体验的环

2022-05-19  1
借助AI 人类能听懂动物的“喜怒哀乐”?科技数码

日前,福布斯公布了《全球最大科技公司榜单》,这份榜单实际上年年都会公布,上榜的标准有四个指标,分别是销售额、净收入、资产和市值,当然,这份榜单,那些个金融公司是无缘上榜了,可想而知科技含量究竟有多高。这份榜单第一名是苹果,这一点应该是没人会质疑的,毕竟近年来苹果在科技自研的实力是公认的,比较具有代表性的应该就是M1系列芯片了。然后,在榜单前五,我国的腾讯也是榜上有名,这确实也是一个好消息。只是这一点估计会让很多人难以相信,可能在很多人印象中,腾讯就是一家互联网公司,那么,腾讯究竟为何能登上全球科

2022-05-19  1
借助AI 人类能听懂动物的“喜怒哀乐”?科技数码

一名主播在老舍纪念馆所在的丰富胡同入口处进行直播。新华社发(陈钟昊 摄)新华社北京5月18日电 “突破线下游览的限制,走进原状陈列的‘全景展厅’,仿佛一脚踏入了明清宫廷的生活场景。”36岁的北京市民丁玲在居家隔离期间,在故宫博物院微信公号上,遍览太和殿、寿康宫等原状陈列展厅,还跟随地图导览,细细品味了“何以中国”等展览的“线上全景展厅”。让丁玲更加欣喜的是,故宫馆藏的186万余件文物,被收录入“故宫博物院藏品总目”,实时检索这些文物的名称,就可以反复查看它们的图片。而在“数字多宝阁”,展示了大量

2022-05-19  1
借助AI 人类能听懂动物的“喜怒哀乐”?科技数码

现在,时间来到了2022年5月,距离今年的第一季度已经过去了一段时间。关于这一季度的智能手机市场,也陆续出现了相关的调查报告。Counterpoint此前公布的报告显示,2022 年第一季度国内智能手机销量同比下降14%,共计 7420 万部。不过,在整体市场销量下降的同时,智能手机的销售结构也出现了变化。Counterpoint的最新报告显示,国内智能手机市场 250-399 美元(约合人民币1686~2691元,批发价)的中高端市场占比,在 2022 年第一季度同比增长近 10%,占总销售额

2022-05-19  1
借助AI 人类能听懂动物的“喜怒哀乐”?科技数码

一:什么是人工智能数据标注人工智能数据标注简单来说就是对采集的图像、 文本、语音、视频等数据执行拉框、描点、转写 等操作,以满足相关机器学习的需要,二:项目市场前景我记得毕业那会为了拿五万的数据标志项目,我们三个兄弟每天每夜的干了三天三夜,眼睛都快扣瞎了,去厕所的时间都舍不得,标注大部分都是对图片进行标准,图片本来机器电脑识别就不了 ,只能人工,我现在的那朋友还在上海做这一块,也到了管理层了,年薪50w+,也是他坚持和努力的结果吧,市场需求量大,人工智能是必然的发展方向了三:为什么能够做1:轻资

2022-05-19  2

原文链接:https://www.tscy18.com/kejism/16075.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 315661083@qq.com 举报,一经查实,本站将立刻删除。