在2025年国家网络安全宣传周上,昆明主会场发布重磅内容 ——《人工智能安全治理框架》2.0 版(下文简称为《框架》2.0)正式发布,为我国人工智能安全发展指明了新方向。
在此背景下,网易易盾作为数字内容安全领域的领军企业,在人工智能安全治理分论坛上同中国网络空间安全协会发起《人工智能安全行业自律倡议》(下文简称为《倡议》),并以“GB 45438-2025《网络安全技术 人工智能生成合成内容标识方法》标准(下文简称为《标识办法》)在人工智能服务内容审核系统中的应用实践”成功入选网络安全国家标准应用实践案例库。
这两项重要成果,不仅彰显了网易易盾在AI安全领域的技术实力与行业担当,更与 "人工智能+" 行动的安全要求及新版治理框架形成深度呼应,为构建安全可信的 AI 发展生态注入强劲动力。
锚定《框架》2.0,引领自律新风向
《人工智能安全治理框架》2.0 版在 1.0 基础上实现了横向拓展与纵向加深,新增 "可信应用、防范失控" 核心原则,提出人类最终控制、价值观对齐等8项可信人工智能基本准则,并建立了科学的风险分级机制,将AI安全风险细化为技术内生、技术应用和应用衍生三大类,制定了30项技术应对措施和14项综合治理措施。这一框架升级充分体现了我国在AI治理领域 "发展与安全并重" 的战略思路,为行业发展提供了清晰的合规指引。
在2025国家网络安全宣传周上,网易易盾作为核心企业参与《人工智能安全行业自律倡议》的发布,正是对 “法制化+技术治理” 双轨路径的积极响应。
全文链接:https://mp.weixin.qq.com/s/HNHDxNJPN22ycqVPp6sYWw





