当前位置: 首页 > news >正文

哈尔滨网站建设团队中国能源建设集团招聘

哈尔滨网站建设团队,中国能源建设集团招聘,中国最顶尖的服装设计公司,互联网保险的概念背景 NL-to-SQL#xff08;自然语言到结构化查询语言#xff09;任务是自然语言处理#xff08;NLP#xff09;领域的一个难题。 它涉及将自然语言问题转换为 SQL 查询#xff0c;然后可以针对关系数据库执行该查询来回答问题。 该任务是 NLP 中的一个专门子领域#xf…背景 NL-to-SQL自然语言到结构化查询语言任务是自然语言处理NLP领域的一个难题。 它涉及将自然语言问题转换为 SQL 查询然后可以针对关系数据库执行该查询来回答问题。 该任务是 NLP 中的一个专门子领域与更广泛的自然语言理解 (NLU) 领域以及自然语言与数据库之间的接口 (NLIDB) 密切相关。 随着 GPT-4、Llama2 和 Falcon 等大型语言模型 (LLM) 开发的最新进展业界和学术界对 NL 到 SQL 的关注已经转向利用这些 LLM 为现实世界生成 SQL 用例。 这将非常强大因为它允许非技术用户直接从数据中找到见解。 在 Dataherald我们构建了一个开源自然语言到 SQL 引擎可与不同的 LLM 一起使用尽管我们在企业部署中使用 GPT-4-32K。 当前 NL 到 SQL例如 DAIL-SQL、C3 和 DIN-SQL的最先进研究也使用闭源 LLM例如 GPT-4 和 GPT-3.5-turbo。 这些模型既昂贵又引发了企业的数据隐私问题。 因此我们开始研究 Llama2 和 Mistral 等开源法学硕士如何与 OpenAI 的模型相比较。 以下是我们的结果。 开源的大语言模型 在这篇博文中我们将探讨各个系列的开源 LLM大型语言模型的功能。 这里分享的信息来自最近的三篇论文即大型语言模型之战、大型语言模型支持的文本到SQL、文本到SQL的分解上下文学习以及我们自己进行的内部测试 使用 Google Colab A100 GPU。 涉及的模型列表如下 Llama-7BLlama-33BMISTRAL-7BAlpaca-7BLlama-2-CHAT-7B Llama-2-CHAT-13B Vicuna-7B Vicuna-33B BARD-LAMDA BARD-PALM2 GPT-3.5-turbo GPT-4 其中一些模型如 Llama、Llama2 和 MISTRAL 是类似于 GPT-3.5-Turbo 的预训练模型经过了监督微调和对比微调。 其他模型已经经历了对齐过程其中涉及额外的指令调整并且本质上与预训练的模型共享相同的架构。 特别是Vicuna、Guanaco 和 Alpaca 是在特定数据集上训练的 Llama 模型的对齐版本。 Zero-shot NL-to-SQL 性能 在本节中我们将评估开源LLM的零样本性能并将其与更大的闭源对应项目进行对比。 零样本性能是指LLM仅根据给定问题和问题引用的相应数据库模式生成 SQL 查询的能力而无需提示中的任何少量样本示例。 为了确保公平比较我们对评估中使用的所有LLM保持一致的提示。 用于报告零样本性能的特定提示基于 Rajkumar 等人提出的模板与其他提示格式相比该模板以其卓越的性能而闻名。 我们根据执行准确性评估这些模型的性能其中包括执行模型生成的 SQL 查询和数据库上的参考 SQL 查询然后比较它们的结果。 结果是通过在Spider数据集的开发集上使用LLM获得的。 结果如下 要点 要点很明确 闭源模型GPT 模型和 BARD在 NL 到 SQL 方面的性能显着优于开源模型。 可以肯定的是这是因为他们接受了更多的参数训练。与之前的模型相比采用额外的监督微调步骤的模型表现出显着的性能改进。 例如Alpaca-7B 模型比其前身 Llama-7B 改进了近16%。 这强调了使用相同的底层架构进行微调以实现增强性能的潜力。与前辈相比Mistral-7B 和 Llama2 等较新的开源模型表现出更优越的性能并且正在缩小与闭源模型的差距。 对于 NL 到 SQL 工作负载虽然较新的开源模型正在缩小与 OpenAI 模型的差距但在开箱即用的准确性方面仍然存在很大差距。 然而即使在相同的架构上针对特定数据集的微调似乎也可以大大提高准确性。
http://www.zqtcl.cn/news/297997/

相关文章:

  • 免费网站优化校园电商平台网站建设
  • 宁波市住房和城乡建设局网站成都网站建设网站制作
  • 网站制作还花钱建设银行网站查询密码是啥
  • 周到的做pc端网站产品图册设计公司
  • 淘宝客新增网站网页设计板式类型
  • 怎么使用wordpress建站吃什么补肾气效果好
  • 建设网站中期wordpress做分类信息网站
  • 百色住房和城乡建设部网站江苏交通建设监理协会网站
  • 常州网站建设哪儿好薇有哪些做外贸网站
  • ip域名找网站一级域名和二级域名的区别
  • 手机网站 底部菜单网站切换效果
  • 珠海公司做网站wordpress最近访客
  • 网站设计制作合同html5网页制作源代码
  • 长春网站建设方案咨询朝阳网站建设是什么
  • 网站开发人员是什么网页设计需要学什么书
  • 韩国食品网站设计欣赏深圳最新新闻事件头条
  • 免费的源码网站有哪些ui界面设计总结心得
  • 那个网站可以做视频app制作北京私人做网站
  • 西安市网站制作公司外贸网站建设步骤
  • 学做网站是什么专业广州建站外包公司历史长
  • 网站必备功能桂林网站建
  • 网站导航栏特效网站地图后台可以做吗
  • 站长工具亚洲高清个人网站建设研究意义
  • 网站制作哪家最好数商云怎么样
  • 做棋牌网站违法嘛免费下载百度
  • 兰州营销型网站建设直播app怎么开发
  • 生成拼贴的网站小程序源码之家
  • 想搭建网站学什么长春市建设局网站
  • 深圳做三网合一网站云主机玩游戏
  • 网站打开慢网站制作多少钱?