企业网站的开发建设方案怎么写,网站全面推广方案,杭州网站建设哪个好,简书 用wordpressimage.png
ChatGPT用它自己的方式来理解世界#xff0c;类似的技术是否也能用来学习动物的语言#xff1f;
所罗门能够与动物交流并不是因为他拥有魔法物品#xff0c;而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》
在《狮子王》、《疯狂动物城》等以动… image.png
ChatGPT用它自己的方式来理解世界类似的技术是否也能用来学习动物的语言
所罗门能够与动物交流并不是因为他拥有魔法物品而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》
在《狮子王》、《疯狂动物城》等以动物为中心的作品中作者经常会将角色拟人化用人类的思考和交流方式来推进剧情。
不过这类作品也会导致认知失调当我们与动物进行交流时可能会把自己的想法和偏见投射到动物身上例如「羊羔跪乳」与感恩、孝道无关而是因为羊特殊的胃部构造但人类会把自身投射到羊羔的行为上。 图片
传统的动物认知工作主要是建立一个词汇表但比如「水」、「喝」、「干燥」等概念在水生生物的世界中可能不存在或没有意义在动物交流中也就不存在和人类概念之间的对应并且动物之间的交流也并不一定通过发声还包括手势、动作序列或皮肤纹理的变化等。
从理论上讲机器学习模型要比人类要更擅长总结出词汇之间松散的相关性神经网络的输入不对输入数据的性质做任何假设只要某种模式频繁出现就有可能发现动物交流中蕴含的信息。
由纽约城市大学、、UC伯克利、MIT、哈佛、谷歌研究院和《国家地理》等研究机构发起的鲸语翻译计划Cetacean Translation Initiative, CETI使用自然语言处理系统分析海量抹香鲸数据并计划未来与野外抹香鲸直接对话。 图片
Aza Raskin等人联合创立的地球物种项目Earth Species ProjectESP开源了首个动物发声基准BEANS可以测量机器学习算法在生物声学数据上的性能还开发了首个用于动物发声的基础模型AVES可用于如信号检测和分类等各种任务。
随着生成式AI技术的进步或许某天我们真有可能揭开动物交流背后的真正含义。
复杂的动物王国
1974年哲学家托马斯·内格尔发表了一篇开创性的论文名为《当蝙蝠是什么感觉》What Is It Like to Be a Bat?”他认为蝙蝠的生活与人类的生活有着非常大的差异以至于人类可能永远无法真正知道这个问题的答案。
我们对世界的理解是由人类的概念塑造的想要知道蝙蝠是什么样子的唯一方法就是成为蝙蝠并拥有蝙蝠的概念。
不过我们还是可以推测出蝙蝠的部分思维方式比如蝙蝠生活在高处可能上下的概念是颠倒的通过回声定位等但我们无法拥有蝙蝠的生活体验。
如果狮子会说话我们也无法理解它因为人类的大脑无法共情狮子语言中所传达的感受和概念。——Ludwig Wittgenstein 图片
但并非所有动物的思维都与人类迥然不同从心理上讲人类与其他灵长类动物的共同点比章鱼和鱿鱼更多人类与黑猩猩的最后一个共同祖先生活在600万到800万年前而与章鱼的最后一个共同祖先生活在大约6亿年前的前寒武纪海洋中。
经过教导后黑猩猩可以学会人类的手语甚至能够理解复杂的人类指令并使用键盘符号进行交流但也正如开头所说的我们可能也过度拟人化地理解了猩猩的行为。
对于与人类关系更远的物种理解他们的交流方式则变得更困难例如蜜蜂和一些鸟类可以看到可见光谱中的紫外线蝙蝠、海豚、狗和猫能听到超声波等每个物种都有其独特性。
用AI理解动物
地球物种项目Earth Species Project的计算机科学家Britt Selvitelle表示他们正在努力破译第一种非人类语言并且有可能在五到十年内实现。
在动物语言领域虽然研究人员数十年来已经积累了大量知识但世界上还并不存在一块能够翻译人类语言和动物语言的「罗塞塔石碑」也就不存在「动物语言」的标注金标准。
从根本上说人工智能是一种数据驱动的工具预训练语言模型可以通过海量数据以无监督的形式学习到数据的内部表征。
从ChatGPT强大的表现来看生成式AI技术可能有自己独特的内部表征方法而非套用人类的概念所以研究人员开始转向AI技术来分析数据获取对动物有意义的术语。 图片
在地球物种项目中收集的数据形式包括声音、运动和视频涵盖野外或圈养环境中的动物数据中还附有生物学家对动物当时在做什么和在什么背景下做什么的注释。
随着物联网的成熟将廉价可靠的记录设备如麦克风或生物记录仪放在野外动物身上也越来越容易可以提供大量数据供人工智能工具进行组织和分析以帮助发现数据背后的意义然后使用生成式方法进行测试最终实现重新创建动物的声音进行双向交流。
动物声音基准BEANS
在生物声学领域基于机器学习技术的成功应用需要在特定任务上精心策划出一组高质量数据但在此之前还不存在一个涵盖多任务、多物种的公共基准无法以受控和标准化的方式测量机器学习技术的性能并将新提出的技术与现有技术进行基准测试。 image.png
论文链接https://arxiv.org/pdf/2210.12300.pdf
数据链接GitHub - earthspecies/beans: BEANS: The Benchmark of Animal Sounds
BEANS(the BEnchmark of ANimal Sounds动物声音的基准是一个生物声学任务和公共数据集的集合专门用于测量生物声学领域机器学习算法的性能包括生物声学中的两个常见任务分类和检测。
BEANS中包括12个数据集涵盖多个物种包括鸟类、陆地和海洋哺乳动物、无尾两栖动物和昆虫。
除了数据集文中还提出了一组标准机器学习方法的性能作为任务性能的基线。 image.png
基准和基线代码都已开源公开研究人员希望BEANS可以为基于机器学习的生物声学研究建立一个新的标准数据集。
动物发声大模型AVES
在生物声学领域由于缺乏标注好的训练数据极大阻碍了该领域以有监督方式训练的大规模神经网络模型的使用。
为了利用大量未标注的音频数据研究人员提出了AVESAnimal Vocalization Encoder based on Self-Supervision基于自我监督的动物发声编码器一种自监督的、基于Transformer模型的音频表征模型可用于编码动物发声。
论文链接https://arxiv.org/pdf/2210.14493.pdf
模型链接GitHub - earthspecies/aves: AVES: Animal Vocalization Encoder based on Self-Supervision
研究人员在一组不同的无标注音频数据集上对AVES模型进行预训练并针对下游生物声学任务对模型进行微调。
分类和检测任务的综合实验表明AVES优于所有强基线甚至优于在带注释的音频分类数据集上训练的有监督topline模型。
实验结果还表明精心设计出一个与下游任务相关的小训练子集是训练高质量音频表示模型的有效方法。
伦理问题
1970年代当西方社会第一次发现鲸鱼的歌声后人类社会暂停了对深海鲸鱼的捕杀并促成了环境保护局Environmental Protection Agency的成立。 image.png
随着地球物种项目技术路线图的推进我们可以更了解周围的生物进行更多的数据收集开发新的基准和基础模型从而可以更好地保护这颗蓝色星球。
Raskin认为在未来12-36个月内团队就可以实现与动物交流比如做出一个人造鲸鱼或乌鸦能以一种无法分辨的方式与鲸鱼或乌鸦交谈不过关键点在于我们也需要理解模型在说什么才能进一步对话。
Raskin团队也在讨论如何负责任地使用这些人工智能方法目前已经规定在任何测试中都要准备好这些方法技术路线中指出了潜在的风险如干扰狩猎和觅食或交配也可能发送错误给动物。
人类是在10万到30万年前才学会如何用声音说话和交流的而鲸鱼和海豚用声音来传承文化和歌曲已经有3400万年历史了。
如果随意在鲸群中发送AI音频可能会对3400万年的文化造成破坏。
这就是为什么到目前为止地球物种项目中的大部分工作都是在收集数据和创建基础即推动未来进步的基准和基础模型与世界各地的公司和组织每天利用人工智能和机器学习所做的事情没有什么不同只是规模更宏大。
如果人工智能可以帮助我们理解动物在说什么那么我们使用人工智能的能力的限制是什么
如果人工智能可以帮助我们了解动物那么它会教我们关于人类的什么 image.png
Raskin 和Zacarian希望动物语言的最终翻译成为世界历史上的转折点之一就像鲸鱼的歌声首次被发现或1990年蓝点A Pale Blue Dot的照片一样这些时刻改变了我们对世界的看法和理解。
参考资料
https://cloud.google.com/blog/transform/can-generative-ai-help-humans-understand-animals-earth-species-project-conservation
更多AI资讯请查阅365文档