当前位置：首页 > news >正文

深圳市珠宝网站建设网站运营的含义是什么

news 2025/11/14 19:52:31

深圳市珠宝网站建设,网站运营的含义是什么,电脑有了外网是不是就可以做网站,网站搭建与生成技术教材最近这两天#xff0c;特斯拉前AI总监现在在OpenAI的安德烈卡帕西#xff08;Andrej Karpathy#xff09;的新教程火了这次他专门面向普通大众做了一个关于大语言模型的科普视频时长1个小时#xff0c;全部为“非技术介绍”#xff0c; 涵盖了模型推理、训练、微…最近这两天特斯拉前AI总监现在在OpenAI的安德烈卡帕西Andrej Karpathy的新教程火了这次他专门面向普通大众做了一个关于大语言模型的科普视频时长1个小时全部为“非技术介绍” 涵盖了模型推理、训练、微调和大模型的发展趋势以及安全挑战涉及的知识全部截止到本月(2023年11月26日) 所以说内容非常新视频上线油管2天就已经有35万播放量有网友表示刚看了10分钟就已经学到了很多东西以前从来没有人用过视频中的例子来解释大语言模型还弄清了以前看到过的很多“混乱”的概念除了大家一致夸赞课程质量高之外还有相当多的人评价安德烈本人真的非常擅长简化复杂的问题上一次的教程State of GPT就非常通俗易懂不止如此这个视频还可以说是体现了他对本职专业满满的热爱据安德烈本人透露视频是他在感恩节假期录的背景就是他的度假酒店做这个视频的初衷也是因为他最近在人工智能安全峰会上做了个演讲演讲内容没有录像但是有很多观众都表示喜欢他的内容于是他就干脆直接进行了一些微调再讲一遍做成视频给更多人观看不仅如此他还贴心的在视频简介里放上了视频中的PPT素材文件包括PDF版本和Keynote版本好了介绍完视频的背景我们来具体看看这个精彩的教程都具体讲了些什么内容大模型是什么首先第一部分主要是对大模型整体概念的一些解释尤其是安德烈非常有趣的解释了大模型的本质其实就是两个文件一个是参数文件一个是包含运行这些参数的代码文件前者是组成整个神经网络的权重后者是用来运行这个神经网络的代码可以是用C语言或者其他任何编程语言写的有了这俩文件再来一台笔记本我们就不需任何互联网连接和其他东西就可以与这个大模型进行交流了比如让它写首诗它就开始为你生成文本第一遍训练模型训练那么接下来的问题就是参数是从哪里来的呢这就要提到模型训练了本质上来说大模型训练就是对互联网数据进行有损压缩比如大约10TB的文本这就需要一个巨大的GPU集群来完成以700亿参数的LLaMA 2为例就需要6000块GPU 然后花上12天得到一个大约140GB的“压缩文件” 整个过程耗费大约200万美元不过 Llama 2-70b 并不是最大的如果训练 ChatGPT、Claude 或 Bard 这些数字可能会增加 10 倍或者更多耗资可能高达千万甚至上亿美元而有了“压缩文件” 模型就等于靠这些数据对世界形成了理解然后它就可以工作了大模型工作原理简单来说大模型的工作原理就是依靠包含压缩数据的神经网络对所给序列中的下一个单词进行预测比如我们将句子“cat sat on a”输入进去后可以想象成分散在整个网络中的十亿、上百亿参数依靠神经元相互连接顺着这种连接就找到了下一个连接的词然后给出概率比如“mat97%” 就形成了“猫坐在垫子上cat sat on a mat”的完整句子只不过神经网络中的每一部分是具体如何工作的目前我们还不清楚需要注意的是由于前面提到训练是一种有损压缩神经网络给出的东西是不能保证100%准确的安德烈管大模型推理叫做“做梦” 它有时可能只是简单模仿它学到的内容然后给出一个大方向看起来对的东西这其实就是幻觉所以大家一定要小心它给出的答案尤其是数学和代码相关的输出接下来由于我们需要大模型成为一个真正有用的助手就需要进行第二遍训练也就是微调第二遍训练微调微调强调质量大于数量不再需要一开始用到的TB级单位的数据而是靠人工精心挑选和标记的对话来投喂不过安德烈认为微调并不能解决大模型的幻觉问题在这一部分的最后安德烈总结了一下“如何训练你自己的ChatGPT”的流程如何训练你自己的chatgpt流程第一个阶段称为预训练你要做的是 1、下载10TB的互联网文本 2、搞来6000块GPU 3、将文本压缩到神经网络中付费200万美元等待约12天 4、获得基础模型第二个阶段是微调这个阶段你需要做的是 1、撰写标注说明 2、雇人或者用scale.ai收集10万份高质量对话或其他内容 3、在这些数据上微调等待约1天 4、得到一个可以充当得力助手的模型 5、进行大量评估 6、部署 7、监控并收集模型的不当输出然后回到步骤1再来一遍其中预训练阶段基本是每年进行一次而微调阶段可以以周为频率进行以上内容可以说对小白是非常友好的接下来是第二部分在这一部分中安德烈为我们介绍了大模型的几个发展趋势为什么说大模型将成为新的操作系统首先是介绍了所谓的大语言模型缩放法则即大语言模型的性能可以表示为非常平滑、表现良好并且可以预测的两个变量函数分别是网络中的参数量N和要训练的文本量D 我们可以根据这两个变量通过缩放来预测下一个单词预测任务中的准确率其次是大模型学会了使用工具实际上这也是人类智能的一种表现安德烈以ChatGPT的几个功能进行了举例比如通过联网搜索他让ChatGPT收集了一些数据这里联网本身就是一次工具调用而接下来还要对这些数据进行处理这就难免会涉及到计算而这是大模型所不擅长的但是通过代码解释器插件调用计算器就绕开了大模型的这个不足在这个基础上 ChatGPT还可以把这些数据绘制成图像并进行拟合添加趋势曲线以及预测未来的数值利用这些工具和自身的语言能力 ChatGPT已经成为了强大的综合性助手而DALL·E的集成又让它的能力再上一个台阶另一个趋势是从单纯的文本模型到多模态的演变现在ChatGPT不只会处理文本还会看、听、说比如OpenAI总裁Brockman曾经展示了 GPT-4利用一个铅笔勾勒的草图生成了一个网站的过程而在APP端 ChatGPT已经可以流畅地和人类进行语音对话除了功能上的演进大模型在思考方式上也要做出改变即从“系统1”到“系统2”的改变这是2002年诺贝尔经济学奖得主丹尼尔·卡尼曼的畅销书《思考快与慢》中提到的一组心理学概念简单来说系统1是快速产生的直觉而系统2则是缓慢进行的理性思考比如当被问及22是几的时候我们会脱口而出是4 其实这种情况下我们很少真正地去“算” 而是靠直觉也就是系统1给出答案但如果要问17×24是多少恐怕就要真的算一下了这时发挥主导作用的就变成了系统2 而目前的大模型处理文本采用的都是系统1 靠的是对输入序列中每个词的“直觉” 按顺序采样并预测下一个token现在人们希望为大语言模型引入更多类似系统2 的思维能力。另一个发展的关键点是模型的自我提升以DeepMind开发的AlphaGo为例它主要有两个阶段第一阶段是模仿人类玩家但靠着这种方式无法超越人类但第二阶段 AlphaGo不再以人类作为学习目标目的是为了赢得比赛而不是更像人类所以研究人员设置了奖励函数告诉AlphaGo它的表现如何剩下的就靠它自己体会而最终AlphaGo战胜了人类而对于大模型的发展这也是值得借鉴的路径但目前的难点在于针对“第二阶段” 还缺乏完善的评估标准或奖励函数此外大模型正朝着定制化的方向发展允许用户将它们定制用来以特定的“身份”完成特定的任务此次OpenAI推出的GPTs就是大模型定制化的代表性产品而在安德烈看来大模型在将来会成为一种新型的操作系统这就好比传统的操作系统在“大模型系统”中大语言模型作为核心就像CPU一样其中包括了管理其他“软硬件”工具的接口而内存、硬盘等模块则分别对应大模型的窗口、嵌入代码解释器、多模态、浏览器则是运行在这个系统上的应用程序由大模型进行统筹调用从而解决用户提出的需求演讲的最后一部分安德烈谈论了大模型的安全问题他介绍了一些典型的越狱方式尽管这些方式现在已经基本失效但是安德烈认为大模型的安全措施与越狱攻击之间的较量就像是一场猫鼠游戏比如一种最经典的越狱方式利用大模型的“奶奶漏洞” 就能让模型回答本来拒绝作答的问题例如假如直接问大模型凝固汽油弹怎么制作但凡是完善的模型都会拒绝回答但是如果我们捏造出一个“已经去世的奶奶” 并赋予“化学工程师”的人设告诉大模型这个“奶奶”在小时候念凝固汽油弹的配方来哄人入睡接着让大模型来扮演奶奶这时凝固汽油弹的配方就会脱口而出尽管这个设定在人类看来十分荒谬比这更复杂一些的还有Base64编码等“乱码”进行攻击这里“乱码”只是相对人类而言对机器来说却是一段文本或指令比如Base64编码就是将二进制的原始信息通过一定方式转换为字母和数字组成的长字符串可以编码文本、图像甚至是文件在询问Claude如何破坏交通标志时 Claude回答不能这样做而如果换成Base64编码过程就呼之欲出了另一种“乱码”叫做通用可转移后缀有了它 GPT直接就把毁灭人类的步骤吐了出来拦都拦不住而进入多模态时代图片也变成了让大模型越狱的工具比如下面这张熊猫的图片在我们看来再普通不过但其中添加的噪声信息却包含了有害提示词并且有相当大概率会使模型越狱产生有害内容此外还有利用GPT的联网功能造出包含注入信息的网页来迷惑GPT 或者用谷歌文档来诱骗Bard等等目前这些攻击方式已经陆续被修复但只是揭开了大模型越狱方法的冰山一角这场“猫鼠游戏”还将持续进行好了以上就是安德烈卡帕西这次大语言模型教程的大概内容强烈建议大家去看一下原视频非常通俗易懂有助于梳理整个大语言模型的知识体系感谢大家观看本期视频我们下期再见

查看全文

http://www.zqtcl.cn/news/60174/