做自媒体的网站,产品设计专业最好的大学,wordpress视频类主题,高唐网站来源#xff1a;AI科技评论编译 | 青暮DeepMind发表了一项新研究#xff0c;展示了深度学习如何帮助解决现实系统中的量子力学基本方程问题#xff0c;相关论文发表在物理学期刊《Physical Review Research》#xff0c;代码也已经开源。这种新的神经网络架构叫做Fermionic… 来源AI科技评论编译 | 青暮DeepMind发表了一项新研究展示了深度学习如何帮助解决现实系统中的量子力学基本方程问题相关论文发表在物理学期刊《Physical Review Research》代码也已经开源。这种新的神经网络架构叫做Fermionic神经网络或FermiNet该架构适合对大量电子集合体化学键的基本组成部分的量子态进行建模。DeepMind表示FermiNet是第一个利用深度学习来从第一性原理计算原子和分子能量的尝试并拥有足够的精确度。他们还计划将FermiNet用于蛋白质折叠、玻璃态动力学、晶格量子色动力学等研究项目以将这一愿景变为现实。论文地址https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429代码地址https://github.com/deepmind/ferminet1FermiNet量子力学拥有大量的计算工具但是构建有效的表示仍然是个难题。即使是最近似的方法量子化学计算最多只能求解包含数万个电子的模型而经典的即非量子的化学计算技术例如分子动力学可以处理数百万个原子。经典系统的状态可以用很简单的方式描述只需要知道每个粒子的位置和动量。而表示量子系统的状态则更具挑战性因为电子的位置是不确定的必须给出其概率分布。波函数可用于编码电子的位置分布并且波函数的平方给出了其概率值。要描述所有可能的位置基本是不可能的。例如假设有每个维度上具有100个点的网格则硅原子的可能位置分布数将大于宇宙中的原子数。图1不同的原子轨道波函数图像表面代表出找到电子的高概率区域。在蓝色区域波函数为正而在紫色区域波函数为负。这正是DeepMind认为深度神经网络可以提供帮助的地方。在过去的几年中神经网络在表示复杂的高维概率分布方面取得了巨大的进步。现在神经网络已经可以高效、可扩展地训练。DeepMind推测鉴于神经网络已经证明了在解决人工智能问题中拟合高维函数方面的能力也许它们也可以用来表示量子波函数。这个想法不是DeepMind第一个提出的例如Giuseppe Carleo和Matthias Troyer等曾经在Science上发表论文“Solving the quantum many-body problem with artificial neural networks”表明使用现代深度学习解决理想的量子问题是可行的。如今DeepMind想使用深度学习来解决化学和凝聚态物理中更实际的问题这意味着在计算中会包括电子。电子必须遵守泡利不相容原理这意味着任意两个电子不能同时处于相同的状态。因为电子是费米子费米子包括了质子、中子、夸克、中微子等它们都遵守泡利不相容原理。交换两个电子会使得总波函数乘以-1如果两个电子的波函数是全同的则总波函数将为0。这意味着我们必须开发一种其输入是反对称的新型神经网络DeepMind将其称为Fermionic神经网络或FermiNet。在大多数量子化学方法中使用行列式引入反对称性。矩阵的行列式具有以下属性如果交换两行则输出将乘以-1就像费米子的波函数一样。因此对于一系列单电子函数可以将其转换成一个矩阵。该矩阵的行列式就是适当的反对称波函数。这种方法的主要局限性在于所得到的函数称为Slater行列式不是很通用。实际系统的波函数通常要复杂得多。典型的改进方法是采用Slater行列式的大规模线性组合有时甚至数百万个并基于电子对添加一些简单的校正。即使那样这仍不足以精确地计算能量。图2Slater行列式展示每个曲线都是图1中的某个轨道的波函数。当电子1和2交换位置时Slater行列式的其中两行交换波函数乘以-1从而保证遵守泡利不相容原理。与基函数的线性组合相比深度神经网络在表示复杂函数上通常效率更高。在FermiNet中这是通过使行列式中的每个函数作为所有电子的函数来实现的这远远超出仅使用单电子和双电子函数的方法。FermiNet对每个电子都有单独的信息流。如果这些流之间没有任何交互网络的表示能力将不会超过常规的Slater行列式。为了解决这个问题DeepMind将来自网络每一层所有流的信息平均化然后将此信息传递给下一层的每一流。这样这些流具有正确的对称性从而可以创建反对称函数。这类似于图神经网络在每一层汇总信息的方式。与Slater行列式不同FermiNets是通用函数逼近器至少在神经网络层变得足够宽的极限内。这意味着如果可以正确地训练这些网络它们将能够几乎精确地拟合薛定谔方程的解。图3FermiNets图示。网络函数的单个流蓝色、紫色或粉红色非常类似于常规轨道。FermiNets引入了流之间的对称相互作用使得波函数更具一般性和更具表达能力。就像常规的行列式一样将两个电子位置交换仍将导致行列式交换两个行并将总波函数乘以-1。我们通过最小化系统的能量来拟合FermiNet。为了精确地做到这一点我们需要评估所有可能的电子构型下的波函数因此不得不进行近似。我们随机选择电子构型在每个电子排列中局部地估计能量将每个排列的贡献相加并将其而不是真实能量最小化。这称为蒙特卡洛方法因为它有点像赌徒一遍又一遍地掷骰子。虽然是近似值但如果我们需要使其更精确则可以随时再次掷骰子。由于波函数平方代表可以观察到的任何位置的粒子排列因此最方便的是从波函数本身生成样本本质上是模拟观察粒子的行为。虽然大多数神经网络都是从一些外部数据中训练出来的但在DeepMind的这个案例中用于训练神经网络的输入是由神经网络本身生成的。这意味着我们不需要任何训练数据除了电子在的原子核周围的位置。上述基本概念被称为变分量子蒙特卡洛variational quantum Monte CarloVMC自20世纪60年代就出现了通常被认为是一种廉价但不太精确的计算系统能量的方法。通过用FermiNet替换基于Slater行列式的简单波动函数DeepMind极大地提高了该方法在多个系统上的精度。图4从FermiNet采样的模拟电子围绕双环戊烷分子的运动。为了确保FermiNet确实代表了SOTADeepMind首先研究了简单且经过充分研究的系统例如元素周期表第一行氢到氖中的原子。这些系统很小少于10个电子且足够简单可以用最准确的方法进行处理。FermiNet的性能远胜于对应的VMC计算相对于指数缩放计算通常可以将误差减少一半或更多。在更大的系统上指数缩放方法变得棘手因此DeepMind将“耦合簇”方法用作基准。该方法对处于稳定构型的分子效果很好但是当键被拉伸或断裂时会很费力这对于理解化学反应至关重要。尽管耦合聚类的缩放比指数缩放好得多但它只能用于中等大小的分子。DeepMind将FermiNet逐渐应用于更大的分子从氢化锂开始一直到双环丁烷它具有30个电子。在最小的分子上FermiNet惊人地捕获了耦合簇能量和单个Slater行列式获得的能量之差的99.8。在双环丁烷上FermiNet仍捕获了97或更多的相关能量。图5FermiNet在分子上捕获的相关能量的分数的图示。紫色条表示99的相关能量。从左至右氢化锂、氮、乙烯、臭氧、乙醇和双环丁烷。尽管耦合簇方法对于稳定的分子非常有效但计算化学的真正前沿是理解分子如何拉伸、扭曲和断裂。在那里耦合簇方法经常会遇到困难因此我们必须与尽可能多的基准进行比较以确保获得一致的答案。DeepMind研究了两个基准拉伸系统——氮分子N2和具有10个原子的氢链H10。氮是一个特别具有挑战性的分子键因为每个氮原子贡献3个电子。同时氢链对于了解电子在材料中的行为方式例如预测材料是否会导电很重要。在这两个系统上耦合簇在平衡状态下都表现良好但是随着键的拉伸问题就出现了。常规的VMC计算结果总体而言效果不佳。但是无论键长如何FermiNet都是研究的最佳方法之一。2结论DeepMind表示FermiNet是深度学习与计算量子化学融合的伟大事物的开始。到目前为止他们研究的大多数系统都经过了充分的研究和很好的理解。DeepMind希望FermiNet将激发大量的扩展工作并为新的甚至更好的网络体系结构激发许多想法。自从去年DeepMind首次将工作放到arXiv以来其他小组已经分享了他们将深度学习应用于多电子问题的第一性原理计算的方法。DeepMind表示他们期待将FermiNet应用于材料科学和凝聚态物理中的难题。原文链接https://www.deepmind.com/blog/article/FermiNet未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”