网站开发安全机制,销售管理软件系统,如何查询网站收录情况,wordpress目录404AIGC正在悄无声息地成为各行各业的必需品。 数科星球原创
作者丨苑晶
编辑丨大兔 国内的大模型混战半年有余#xff0c;传统互联网巨头和人工智能公司纷纷入场。在“百模大战”的关键时刻#xff0c;行业悄然发生分化。一些更具前瞻性的企业开始眺望远方#xff0c;准备打…AIGC正在悄无声息地成为各行各业的必需品。 数科星球原创
作者丨苑晶
编辑丨大兔 国内的大模型混战半年有余传统互联网巨头和人工智能公司纷纷入场。在“百模大战”的关键时刻行业悄然发生分化。一些更具前瞻性的企业开始眺望远方准备打一场“非对称”的商业竞争。 在已闭幕的2023世界人工智能大会中上海天壤智能科技发布“天壤小白”大模型产品“三件套”包含通用语言大模型、应用开发平台和语义搜索引擎。其中天壤小白语言大模型参数规模达1860亿。 自2018年成立天壤一直专注于通用人工智能的研究。目前公司主要服务于企业服务、数字金融、生物科技、城市运行等数字化场景。在与数科星球IDdigital-planet深度交流时天壤创始人兼CEO薛荣贵认为AIGC技术已经成为新一代的“水电煤”人工智能企业的大量涌现将重塑未来的商业格局。 01 生成式内容技术的潜力 在通向AGI时代的过程中语言大模型正在扮演着极其重要的角色虽然AIGC技术包括但不限于语言大模型但后者的重要性却非常大。逻辑上语言大模型是撬动人与机器交互的前提目前已在文本生成、机器翻译和对话系统中得到了充分应用。 可以想见在图像生成、语音生成和3D引擎不断完善后AIGC的应用领域和能力也会不断扩展和提升。 在众多大模型产品中天壤小白的优势在于多轮对话和逻辑推理。 在大模型行业多轮对话有助于理解当前对话的意图和意图背后的逻辑关系从而生成更加准确的回答。这可以被看作是实现更加智能化的交互和服务的钥匙。在技术上由于天壤小白可以建立起对语言的长期记忆和上下文感知从而更好地应对人类的自然语言交流和表达需求。 在薛贵荣的理解中大模型的逻辑推理正在改变行业规则。“以往我们也曾尝试小模型但在提示词的背景下一个知识面不宽的模型所得到的结果也是不丰富的。”另外小模型对多轮对话的支持也较为有限。 此外天壤小白还结合了思维链技术技术上它可以通过将一个复杂的任务分解为多个子任务并在不同的层级上并行处理这些子任务从而提高整个任务的效率和准确性。 具体来说当一个大型的深度学习模型需要完成一个复杂的任务时它通常会被设计成由多个子模块组成每个子模块都负责处理一个特定的子任务。这些子任务可以是图像分类、目标检测、语音识别等。 在推理过程中这些子任务被独立地处理每个子模块都使用不同的数据和参数进行分析。当所有任务处理完成后它可以将这些子模块组合起来形成一个完整的任务解决方案。 天壤内部的技术人员认为这种思维链技术可以帮助拆解复杂的任务并将其分解为多个可管理的子任务。这使得整个任务的训练过程更加高效并且可以在多个子任务之间共享知识和经验从而提高整个模型的性能和准确性。 “总之大模型的理解力、推理能力和分析能力非常不一样。”他总结。而这也是天壤持续推进大模型业务的原因所在。 02 AIGC在智能交通中的应用 众所周知AlphaGo的出现是强化学习领域的一个重要里程碑它的成功表明了强化学习在解决复杂问题方面的巨大潜力。其通过与自己不断对弈逐步提升自己的水平从而在复杂的围棋棋局中做出最优决策。这不仅在围领域引起轰动更进一步打开了人工智能赋能各行各业的全新可能性。 正是受此启发薛贵荣和天壤团队燃起对AI的信心自研AI围棋TRgo仅用AlphaGo 1% 的计算资源成功击败了世界围棋冠军朴廷桓成为国内率先探索强化学习的团队之一。 不仅在围棋领域有所斩获2020年天壤在交通行业取得重要进展。天壤推出了城市级交通拥堵治理系统TRTraffic并助力南昌成为全国首个“交通不限行”城市。 然而天壤在探索通用人工智能和训练大模型的路上也面临着缺数据的难题就像今天的中文版ChatGPT高质量的中文语料数据十分稀缺。对此天壤寻求创新利用机器人对抗生成数据、优胜劣汰迭代优化模型以及利用强化学习进行数据增强等。 这些方法使得模型效果大幅提升也证明了强化学习在应对不同挑战方面的优越性能。 现在随着AI技术的进一步突破他更加看好AI在感知、认知和决策的进步。“我们可以用人工智能解决复杂场景下的应用。”薛贵荣对数科星球IDdigital-planet这样说。 天壤内部技术人员称“人工智能可以帮助城市向不限行城市发展在这之中深度学习、强化学习技术可以运用其中。” 03 各行业大模型的应用 除了在语言大模型方面取得突破天壤还将领先的AIGC技术应用于生物制药领域为该领域带来了巨大的潜力和机遇。 原理上AIGC可以生成全新蛋白质甚至生成的蛋白质可以完全不同于自然界中的天然蛋白质。 在结果上新的技术极大地缩短蛋白质研究的时间和成本开辟了计算生物学研究的全新范式。在目前来看已应用的技术可以避免传统的蛋白质设计方法中的繁琐和不确定性同时也可以大大提高蛋白质的质量和稳定性。薛贵荣对数科星球IDdigital-planet称“生物科技产业将进一步爆发其中AIGC将会成为下一轮爆发的技术底座。” 2021年该公司发布蛋白质结构预测模型TRFold2基于CASP14测试集的预测精准度媲美AlphaFold2。2022年该公司发布蛋白质设计模型TRDesign实现按需设计蛋白质具体项目中则包括 发布蛋白质复合体结构预测模型TRComplex 发布孤儿蛋白质结构预测模型TRFold-Single 打造国内首个蛋白质设计工作台xCREATOR。 与其说“判别式AI”是基于数据做出判断那么生成式AI则因上下文思考能力拓展了AI在决策之时的思考边界。 宏观上AIGC所需要的算力、算法、中间件技术和数据会激发一轮新的投资热潮行业中各行各业结合AIGC将加速智能化的普及速度微观上拥抱智能化速度更快的企业能够获得新的市场竞争力。 04 开放平台背后的价值 大模型虽好但不是任何企业都可以做。其中一大原因是打造用户-数据-能力三位一体的增长飞轮极具挑战 首先多样化的用户需求和反馈可以帮助大模型不断优化和改进。大模型的迭代和改进需要不同用户的需求和反馈作为指导用户可以通过使用大模型来发现其存在的问题和不足并向模型开发者提供反馈和建议。这些反馈和建议可以帮助模型开发者更好地理解用户需求并针对性地进行模型的改进和优化从而提高模型的性能和准确率 其次数据是大模型迭代和智能涌现的基础。大模型需要大量的数据来进行训练和优化只有拥有足够的数据模型才能够不断地迭代和改进。同时数据还可以帮助模型更好地学习和理解自然语言和知识从而提高模型的智能水平和表现能力 基于上述两点可以看到大模型能力的提升是一个由真实的用户反馈和高质量数据迭代构成的双轮效应。两者缺一不可共同推动大模型的智能涌现和发展。 薛贵荣认为ChatGPT3.5-4.0的迭代就是上述逻辑的典范。为了能更快赶上国外先进水平天壤制定了开放平台的策略以应对挑战。 7月7日天壤发布“天壤小白”开放平台。该平台内置其自研大语言模型并将一整套工具和资源整合至平台内。据了解该平台旨在帮助开发者轻松创建AI应用更灵活地探索大模型创造体验更好、超越期待的AI创新产品。 而针对目前大模型落地的关键瓶颈大模型的“幻觉”即一本正经地胡说八道、私有数据的安全、市场缺乏企业级的中文大模型以及大模型自身的封闭性问题天壤则推出“三件套”即大语言模型、语义搜索引擎和开发平台。这三者构成了一个开发智能应用的全栈式支持体系为开发者提供一站式的解决方案。 首先是通用语言大模型通过1860亿参数的深度学习训练具备类ChatGPT的能力能够进行多语言的对话互动、知识问答、逻辑推理等核心功能。它能够理解复杂的上下文信息并根据先前的对话内容做出精准回应。 其次是语义搜索引擎它进一步强化了大模型的生成能力。在生成文本前后该引擎会检索相关事实信息对输入和输出进行验证以确保内容是正确、合理、完整和一致的避免大模型产生“幻觉”或者提供错误或无意义的回答。实际测试中天壤小白的语义搜索模型召回率有着十分出色的表现。其中在与OpenAI的语义搜索引擎TOP1和TOP3的召回率分别统计召回的TOP1、TOP3个结果中包含正确答案的概率对比测试中天壤小白的结果为77%和86%均超过OpenAI 73%和85%的表现。 最后是应用开发平台其采用可视化的界面所见即所得用户在平台左侧栏目输入预置的提示词prompt后当即就能在右侧栏目测试应用效果确保应用效果符合预期。整个创建过程耗时不超过十分钟。 目前来看该开放平台极大降低了用户使用门槛即便没有编程基础也可以通过可视化的操作界面实现应用配置。据开放平台内部员工介绍开发者可以根据不同场景和需求选择不同参数和精度的多元模型服务、配置提示词参数和交互类型以及利用文档集功能进行语义检索从而助力用户创造超越期待的AI应用使应用效果达到最佳状态。 用户也可以根据具体需求选择调用其他大模型或企业私有模型等。 结尾在深度对话中数科星球IDdigital-planet听到多位企业家承认OpenAI具有一定程度的先发优势。 但在国内随着数据沉淀和强化学习技术创新大模型的迭代效应正在展现。 用薛贵荣的话来评价便是“掌握更多的优质数据才能更加逼近人类智能。”现在天壤的破局点是继续加大对大模型的投入以实现规模、深度、广度的全覆盖。 作为一家技术型企业天壤已初步展现出其能挑战AlphaFold的潜力并在AI围棋、智能交通、生物科技等领域有着前沿突破。 时间在中国企业一边或许在未来我们可以见证更多的优秀企业出现。而如今我们正在一步步走向智能时代。