从ChatGPT到AGI:生成式AI的媒介特质与伴生风险(六)
测试中,有的 AI 竟能识破测试环境,故意在测试环境中“放 水”,减少被发现的概率,等到了应用环境中才会暴露本性。 如果 AI 的这种欺骗能力未经约束地持续壮大,同时人类不 加以重视并寻找办法加以遏制,最终 AI 可能会把欺骗当成 实现目标的通用策略。麻省理工学院研究员彼得·帕克(Peter Park)等在权威期刊 Patterns(模式)发表论文,系统梳理 AI 具备欺骗行为的证据、风险和应对措施,指出“人工智能0 魔豆 | 8 页 | 203.25 KB | 3 月前3网络舆情的形成与管理
实应对策 略。 平台自律是互联网企业履行社会责任的重要体现。平台 方应优化推荐算法,避免过度强化用户偏好,促进观点多元 呈现;建立更严格的内容审核机制,对恶意炒作、虚假信息 等行为进行有效遏制。例如,一些平台通过建立内容审核算 法和人工审核相结合的方式,有效识别和处理违规信息,防 止虚假有害内容的传播。 3.3 机构有效利用与参与 各类机构(包括媒体、教育机构、第三方组织等)在网200 魔豆 | 10 页 | 305.67 KB | 2 月前3
共 2 条
- 1