安徽省建设厅网站职称,怎么看网站的建设时间,网站建设做的快,企业网站是如何做的来源:集智俱乐部作者:郭瑞东我们都知道大脑是控制身体的中枢#xff0c;或者夸张点说#xff0c;身体只是大脑的傀儡。然而事实果真如此吗#xff1f;认知科学指出#xff0c;人类并不总是“先知后行”#xff0c;很多时候也会“先行后知”#xff0c;身体在塑造精神方面… 来源:集智俱乐部作者:郭瑞东我们都知道大脑是控制身体的中枢或者夸张点说身体只是大脑的傀儡。然而事实果真如此吗认知科学指出人类并不总是“先知后行”很多时候也会“先行后知”身体在塑造精神方面也有着强大的能力。但是人工智能的研究常过于关注“软件”上的智能通过各种算法模拟神经网络却忽略了生命的具身智能。斯坦福人工智能研究所联席主任李飞飞近日在Nature Communications 上以“进化和学习产生的具身智能”一文在模拟环境中证明了人工生命的具身智能为复杂环境下机器人的设计提供了启发。研究领域人工生命、进化算法、具身认知论文题目Embodied intelligence via learning and evolution论文链接https://www.nature.com/articles/s41467-021-25874-z01智能和身体形态有关动物能够完成适合其物理形态的特定任务这被称为具身智能embodied smarts。每个动物的智力在与环境相互作用的过程中都是与其物理形态协同进化的。因此蜘蛛用它们细长的腿编织网海狸拍打它们宽阔的尾巴发出警报猎豹飞快地跑去抓斑马而人类有手指去抓握工具。虽然人工智能也很聪明但它的智慧与动物不同。人工智能通常是无实体的如自然语言处理等机器学习通常是在计算机内部的硅基芯片上完成的在真实世界中没有物理实体。虽然计算机视觉需要摄像机或传感器但它通常独立于任何物理形态。斯坦福大学李飞飞等研究人员想知道物理形态对智力的进化有影响吗如果是这样的话计算机科学家应该如何利用物理形态来创造更聪明的人工智能呢为了回答这些问题它们创建了一个计算机模拟的游乐场。在那里被称为“ unimals”的节肢动物主体可以在突变和自然选择的约束下学习。随后研究人员开始观察unimals的虚拟身体是如何影响其智力进化的。研究发现虚拟生命的身体形态影响了它们学习新任务的能力。在更具挑战性的环境中或在执行更复杂的任务时进化出的生命形态比那些在简单环境中进化出的生命形态能够更快更好地学习。在这项研究中具有最成功形态特征的人工生命相比其前几代祖先能更快地完成任务ーー尽管它们在学习开始时的智力水平与其前几代祖先相同。图1.研究中创建的 Unimal即通用动物universal animal能通过进化产生胳膊以在模拟环境中生存下来。02人工生命的角斗场在模拟中研究者不仅改变了人工生命的身体形态还改变了它们的训练环境和执行的任务使得实验的复杂度远高于之前的同类研究。通过锦标赛式的达尔文进化方案该模拟能够确保每一种人工生命的形态都不会被一票否决就算在不利的环境下依然有机会将形态传递给下一代。该方法既保持了种群的多样性又降低了仿真的计算量。图2. 深度进化强化学习框架Deep Evolutionary Reinforcement Learning绿框标出的强化学习发生在个体层面而红框的突变改变身体形态是该框架中进化算法的体现。每次模拟开始于576个独特的人工生命包括一个“球体”头部和一个由不同数量的圆柱形节肢以不同方式排列而成的“身体”。每个人工生命都以相同的方式感知世界并以相同的神经结构和学习算法开始模拟。换句话说所有的人工生命在开始它们的虚拟生活时都拥有相同程度的智慧只是身体形状不同。图3. 人工生命所需要经历的各类环境然后每一个人工生命都要经过一个学习阶段。在这个阶段中它要么穿越平坦的地形要么穿越包括块状山脊、阶梯和平滑山丘等更具挑战性的地形。还有一些人工生命必须移动箱子到目标位置才可以跨越复杂的地形。图4. 人工生命分别通过平坦、需要绕障和需要将箱子推至指定位置的环境。训练结束后每个人工生命与其它三个在相同的环境/任务组合下训练的人工生命参加锦标赛获胜者能够产生后代。后代在面临与其父母相同的任务之前经历了四肢或关节的微小突变。所有的人工生命包括获胜者都参加了多项锦标赛只有当新的后代出现时才会开始衰老。03身体进化使得习得有利的行为更快在每个环境完成三次进化迭代每次迭代产生4000种形态后幸存下来的人工生命平均经历了10代的进化其形态十分多样包括两足动物、三足动物以及有或没有手臂的四足动物见图5。图5. 在平坦a、需要绕障b和需要将箱子推至指定位置c的三种环境下进化得出的最佳形态十分多样。研究人员从每个环境中挑选出了10种表现最好的人工生命并从头开始训练它们完成绕过障碍物、推球或者把箱子推上斜坡等全新的八个任务见图6。图6. 人工生命需要完成的8种新任务包括巡逻、越障、探索和逃离等。结果是在需要绕障的环境中进化的人工生命比在平坦环境中进化的人工生命表现更好而当在需要将箱子推至指定位置的环境下进化出的人工生命表现最好。表现好的人工生命无论是单独学习通过较少的训练获得更好的表现还是跨代学习都更快。事实上经过10代进化后表现好的人工生命已经十分适应环境以至于它们学习相同任务的时间只需要它们最早祖先的一半。图7.a在三种环境下使种群中表现前100名的主体适应度达到种群初始值的75%所需的平均迭代次数纵轴b三种环境中稳定形态的比例该值在平坦、需绕障和需要推箱子至指定位置的环境中依次增加说明复杂的环境对稳定性的选择压较高c平均工作成本纵轴随进化代数横轴的变化d在平坦环境下不同代人工生命的学习曲线表明后代不仅表现好而且学习的更快。这与19世纪美国心理学家鲍德温Baldwin提出的一个假说是一致的他推测在进化的早期祖先习得的行为将逐渐成为本能甚至可能在后代中遗传。鲍德温效应指出学习适应性优势的能力可以通过达尔文的自然选择遗传给后代即“大自然选择的身体形态变化使得后代能更快学习有利的行为。例如如果一种动物在生命早期不能学会走路可能更容易死亡从而对基因型产生直接的选择压力选出能更快学会走路的动物。该效应描述的从表型到基因型的能力转移可能为习得更复杂的行为如语言能力及模仿能力腾出学习资源。04总结制造更聪明的人工智能该研究在人工生命的演化中结合进化算法和强化学习论证了以下三点首先环境的复杂性能够促进具身智能的进化从而使后代形态有助于学习新的任务。其次人工生命的模拟重现了鲍德温效应进化能够将早期祖先学会的有利行为表达在后代的基因中。第三学习效率和物理形态有关某些形态更加稳定工作效率更高因此可以促进学习和控制。一直以来设计在复杂环境下完成任务的机器人都是一个难题。然而真实世界需要机器人的场景往往又都是复杂的比如爬过核反应堆提取核废物在人体血管中穿行输送药物在地震后的废墟中搜寻生命等。也许解决这一问题的唯一道路是通过进化来设计机器人。通过让人工生命在日益复杂的模拟环境中进化帮助开发现实世界执行复杂任务的机器人增强其泛化能力和稳定性。完未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市大脑研究计划构建互联网城市大脑技术和企业图谱为提升企业行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”