《人工智能安全治理框架》2.0版
定发布了《⼈⼯智能安全治理框架》1.0版。 1.0版发布以来,⼈⼯智能技术和应⽤持续快速发展,个别领域取得超 预期突破。例如,⾼性能推理模型涌现,极⼤提⾼了对数学、物理、代码 等复杂问题的求解能⼒;⾼效能轻量级模型的开源,显著降低了部署应⽤ 的⻔槛,⼈⼯智能应⽤迅速向各⾏业领域渗透普及;⼤模型应⽤形态从机 器问答向嵌⼊业务流程的智能体演进,加速与业务系统融合;具⾝智能、脑 降、决策错误等鲁棒性问题。 (d) 输出决策不可靠。 ⼈⼯智能利⽤有限数据集拟合复杂现实世界, 人工智能安全治理框架2.0 - 4 -⾃主感知、认识、理解、交互的理论基础、技术能⼒还有待突破,基于有 限样本的决策判断、输出结果存在“幻觉”,即看似合理实则不可靠的现象。 (e) 外部对抗攻击。 攻击者利⽤模型算法及其设计实现的缺陷、漏洞, 构造对抗攻击样 污染”模型概率分布,造成决策输出准确性、可信 度下降,甚⾄输出违法有害信息。 (c)训练数据标注不规范。训练数据标注过程中,存在标注规则不完备、 标注⼈员能⼒不⾜、标注错误等问题,影响模型算法准确度、可靠性、有效 性,还可能导致训练偏差、偏⻅歧视放⼤、泛化能⼒不⾜或决策判断输出错 误。 人工智能安全治理框架2.0 - 5 -(d)数据和个⼈信息泄露。⼈⼯智能训练数据蕴含的知识、敏感信息0 魔豆 | 92 页 | 30.37 MB | 1 月前3
共 1 条
- 1