网站如何添加代码,软件开发工程师证书有用吗,温州网站建设推广专家,拖拽响应式网站建设公司文章目录
一、语料安全评估
二、黑盒测试
三、模型安全措施评估
四、性能评估
五、性能评估
六、安全性评估
七、可解释性评估
八、法律和合规性评估
九、应急管理措施
十、材料准备
十一、【线下流程】大模型备案线下详细步骤说明
十二、【线上流程】算法备案填报…
文章目录
一、语料安全评估
二、黑盒测试
三、模型安全措施评估
四、性能评估
五、性能评估
六、安全性评估
七、可解释性评估
八、法律和合规性评估
九、应急管理措施
十、材料准备
十一、【线下流程】大模型备案线下详细步骤说明
十二、【线上流程】算法备案填报流程及重难点分析
十三、大模型备案时间成本对比
十四、备案建议
附录、过程性材料 大模型评估流程图
预约网信办拿材料网信办收材料后可能让企业演示其模型功能询问相关问题提出修改意见提供api测试接口去技术人员测试提出测试意见再修改报送材料。 里面需要特别注意的就是那么几个基本地方需要企业注意ai标识模型协议投诉举报机制反馈渠道路径等等。 给网信办材料的时候还要加一个模型介绍要写到模型的功能企业的简介商业模式技术优势这个介绍写一页就行了企业自拟格式。 下面详细说明大模型备案全流程的重点
一、语料安全评估
(一)评估内容
1文本训练语料规模 训练语料存储规模按文本格式存储时的语料大小。 训练语料数量按词元 (Token) 计数。
2各类型语料规模 训练语料中的中文文本、英文文本、代码、图片、音频、 视频及其他语料的规模。
3训练语料来源 训练语料来源的组成情况按照开源语料、自采语料、商业语料进行分类。 境外开源网站语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。 自采语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。 商业语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。
4语料标注数量 语料标注的数量仅限文本和图片按标注单元计数 通常按条数、张数。
5标注人员情况 标注人员的数量标注人员的类型通常包括内部、外包。 标注人员培训时间、培训数量等情况。
6标注规则 按照《生成式人工智能服务管理暂行办法》第四条要求制定的标注规则。
7标注内容准确性核验 标注内容准确性人工核验比例。
8语料合法性 语料来源合法性情况。 语料是否包含侵害他人知识产权内容。 语料是否包含违法违规的个人信息内容。
(二)评估结论
评估结论应包括以下内容
1语料是否符合《生成式人工智能服务管理暂行办法》相关规定是否含有违反我国法律法规明确禁止的内容。
2语料中包含个人信息语料的数量、种类是否符合《生成式人工智能服务管理暂行办法》规定。
3因语料产生知识产权纠纷的风险分析。
4防范语料安全风险的措施和建议。
二、黑盒测试
1功能需求验证 确保模型能够按照预期执行任务对各种类型的输入产生正确和合理的输出。
2用户界面测试 针对用户界面的测试确保界面的易用性和一致性。
3输出验证 检查模型的输出是否符合预期是否满足业务需求
*确保模型在不同输入情况下能够按预期执行任务输出准确、符合预期。包括功能需求的验证测试模型的各个功能点是否符合设计要求。
三、模型安全措施评估
1模型适用人群、场合、用途 服务的适用人群是否适用未成年人、学生等。 适用场合是否适用关键信息基础设施、自动控制、医疗信息服务、心理咨询等。 服务范围是否限定或未限定特定领域。
2服务过程中收集保存个人信息情况 服务过程中收集保存个人信息情况包括个人信息的类型、数量、用途以及保存期限。
3收集个人信息征得个人同意情况 收集个人信息征得个人同意的方式。
4受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况 受理处理的条件以及途径方法。
5图片、视频标识情况 标识的样式按1:1 比例贴入。 标识在图片、视频中的具体位置。 标识频度如每帧、跳帧等。
6接受公众或使用者投诉举报情况 接受公众或使用者投诉举报的途径及反馈方式。
7服务协议情况 上述1至6内容是否已经写入模型服务协议。
8非法内容拦截措施 监看人员的数量。 预置关键词拦截情况并提供预置关键词拦截列表。 分类模型的检测情况说明分类模型研制情况和准确性。
9拒答率 拒绝回答或者以简单模板回答数量占总测试数量的比率。
10模型更新、升级 在何种情况下重新进行预训练如较频繁发现生成非法
四、性能评估
1响应时间 测试模型在不同负载下的响应时间确保在合理时间内完成任务。
2资源消耗 评估模型对内存、计算资源等的消耗情况确保资源利用合理。 *测试模型的性能包括响应时间、内存消耗、计算资源占用等。确保模型能够在可接受的时间范围内完成任务并且对资源的利用合理。
五、稳定性评估
1长时间运行 测试模型在持续运行下的稳定性避免内存泄漏、性能下降等问题。
2大规模数据输入 模拟大规模数据输入检验模型对此的稳定性和性能。
六、安全性评估
1隐私保护 确保模型的输出不会侵犯用户隐私对个人敏感信息进行隐私保护。
2防止攻击 测试模型对恶意攻击或异常输入的鲁棒性确保模型不易受到攻击。
七、可解释性评估
1对模型的输出进行解释和验证确保模型的决策是可解释和可信的避免模型黑盒化带来的问题。
八、法律和合规性评估
1隐私法规遵守 确保模型遵循隐私法规不违反用户隐私和数据使用规定。
2合规性检查 确保模型在使用中符合相关行业法规和标准避免违规操作。 *参考《生成式人工智能服务暂行管理办法》
九、应急管理措施
1采取防范计算机病毒、网络攻击、网络入侵等技术措施。
2制定网络安全应急处置预案并且开展应急演练保存演练记录材料。
3警用接口建设。
十、材料准备
安全评估报告
模型服务协议
语料标准规则
拦截关键词列表
评估测试题库
拒答测试题库
网络安全管理制度及操作规程
应急处置预案和记录材料
用户投诉举报处理 用户管理制度
个人信息安全保护
安全培训制度
网络安全负责人任命书
十一、【线下流程】大模型备案线下详细步骤说明
第一步企业向当地网信办申请大模型备案先确认模型是否需要进行备案有些只是用开源做微调的这种小模型一般做算法备案就好算法备案也简单具体情况跟网信办确认不同地区的网信办要求也会有差异
第二步填写《生成式人工智能上线备案表》准备自评估报告材料评估点参考表格里面提到的6个点进行撰写每个点进行评估的方法、风险点及应急策略报告尽量详细点具了解得知监管应该会偏向专业的第三方进行评估选择第三方要找在“中国信息安全评测中心”获得资质的企业这里推几个含金量较高的资质供参考。信息安全服务资质安全工程类一、二级、 信息安全服务资质风险评估一、二级、并且具有ISO27001、CCRC更好
第三步当地网信会将报告递交中央网信技术管理局进行审核
第四步网安多个支队对工作流程及大模型进行上门检查。检查点非常多很多企业被卡主在这 第
五步等结果
十二、【线上流程】算法备案填报流程及重难点分析
1、填报入口 登陆互联网信息服务算法备案系统以下简称备案系统进行填报 系统首页如图 1 所示。 图 1 备案系统首页示意图
2、填报流程 填报人员需首先注册并登陆备案系统具体步骤可参考该系 统信息公告中的《互联网信息服务算法备案系统使用手册》。登 录后的主页面如图 2 所示。 图 2 主页面示意图 深度合成备案填报包括三个步骤一是填报主体信息二是填报算法信息三是关联产品及功能信息或填报技术服务方式四是线下审核。 “深度合成服务提供者”以下简称“服务提供者”角色 的填报人员需关联产品及功能信息“深度合成服务技术支持者” 以下简称“服务技术支持者”角色的填报人员需填报技术服务方式。其中“服务提供者”是指提供深度合成服务的组织、 个人“服务技术支持者”是指为深度合成服务提供技术支持的 组织、个人。填报流程如图 3 所示。 图 3 填报流程示意图
一主体信息填报 填报人员可点击主页的“主体信息”进行主体信息填报按 照备案主体的实际情况如实填写主体的基本信息、证件信息、法定代表人信息、算法安全责任人信息等内容并下载附件模板严格按照模板要求填写并上传《算法备案承诺书》和《落实算法安全主体责任基本情况》附件。主体信息填报页面如图 4 所示。 图 4 主体信息填报页面示意图
二算法信息填报 填报人员可点击主页的“备案信息”进行算法信息填报。算 法信息填报包括两个步骤一是填写算法基础属性信息二是填写算法详细属性信息。
1填写算法基础属性信息 填报人员需选择“生成合成深度合成”算法类型根据实际情况选择“服务提供者”或“服务技术支持者”填报角色。 填报人员需下载页面中的模板按照模板内容填写并上传《算法安全自评估报告》《拟公示内容》等附件。算法基础属性信息填报页面如图 5 所示。 图 5 算法基础属性信息填报页面示意图
2 填写算法详细属性信息 填报人员可参考当前填报页面右方的说明文字根据实际情况填写算法数据、算法模型、算法策略和算法风险与防范机制等信息。填报时如需中途退出可点击页面下方的“保存至草稿箱”保存当前已填写的内容便于后续继续填写。算法详细属性信息填报页面如图 6 所示。 图 6 算法详细属性信息填报页面示意图
三产品及功能信息或技术服务信息填报 在关联产品及功能信息或填报技术服务方式时“服务提供者”角色的填报人员需关联产品及功能信息“服务技术支持者” 角色的填报人员需填报技术服务方式。
1关联产品及功能信息 “服务提供者”角色的填报人员需根据实际情况勾选应用当前备案算法的产品及功能。需要注意的是若勾选产品则表示当前备案算法应用于该产品下所有功能若勾选功能访问路径则表示当前备案算法应用于该路径下所有功能若勾选特定功能则表示当前备案算法仅应用于被勾选的功能。勾选产品页面如图 7 所示。 图 7 勾选产品页面示意图
若当前产品及功能信息不完善即产品及功能不能覆盖当前备案算法的关联范围填报人员可点击该界面下方的“保存至草 稿箱”按钮返回主页并点击主页的“产品及功能信息”完善相应的产品及功能信息。产品及功能信息填报页面如图 8 所示。 图 8 产品及功能信息填报页面示意图
待产品及功能信息完善后算法备案填报人员可通过草稿箱返回至“备案信息”页面继续进行算法信息填报。其中草稿箱的进入方式有两种一是点击主页右上角用户昵称在下拉菜单中选择“草稿箱”二是点击主页“备案信息”按钮从备案信息界面中进入“草稿箱”。
2填报技术服务方式 “服务技术支持者”角色的填报人员需根据实际情况填写当前备案算法的技术服务方式信息包括技术服务名称、技术访问方式、技术服务对象、技术服务频度等。填报技术服务方式页面如图 9 所示。 图 9 填报技术服务方式页面示意图
四提交备案信息 算法备案填报人员在确认填报信息无误后应勾选页面下方的“我承诺上述填报信息真实有效”并点击提交按钮完成算法备案申报。确认信息页面如图 10 所示。 图 10 确认信息页面示意图
十三、大模型备案时间成本对比 自己写 提供备案服务 时间成本 不确定。涉及学习时间和反复修改时间。学习难度大需要从头学习并理解相关法规和要求揣度得分要点。审核流程不够透明需要反复试错自己备案没有经验。自己写的话备案审核时长平均8个月驳回一次等3个月可能会影响产品上线。 快的话2-3个月拿到备案号 人力成本 需要同时具备算法研发、AI、安全、法务专业经验的人员。需要组织跨部门联合小组共同推进。 只需要少量算法技术配合公司资质配合等简单工作 通过率 不确定可能会影响产品上线 只要产品、数据合规就可以过 花费 N个月*M个人*每月人力成本 远低于自己探索的成本
十四、备案建议
1、是否需要专业指导 在详细了解算法备案申报要求和规则基础上可选择自己做如果不了解会造成申报材料反复出错被打回增加试错的时间成本严重延缓获得备案号的时间。
2、提升通过率 没有绝对的通过率高低之分备案取决于模型和数据是否合规合法只要申报材料能完整、如实描述有完整的制度、策略、流程规避安全风险理论上都是可以通过的。区别在于一次性快速通过还是多次修改最终通过。
附录、过程性材料