遏制 - 舆知库 · 国内首家舆情知识共享平台

首页文库资料文章资讯上传文档发布文章登录账户

从ChatGPT到AGI：生成式AI的媒介特质与伴生风险（六）

测试中，有的 AI 竟能识破测试环境，故意在测试环境中“放水”，减少被发现的概率，等到了应用环境中才会暴露本性。如果 AI 的这种欺骗能力未经约束地持续壮大，同时人类不加以重视并寻找办法加以遏制，最终 AI 可能会把欺骗当成实现目标的通用策略。麻省理工学院研究员彼得·帕克（Peter Park）等在权威期刊 Patterns（模式）发表论文，系统梳理 AI 具备欺骗行为的证据、风险和应对措施，指出“人工智能

0 魔豆 | 8 页 | 203.25 KB | 3 月前
3
网络舆情的形成与管理

实应对策略。平台自律是互联网企业履行社会责任的重要体现。平台方应优化推荐算法，避免过度强化用户偏好，促进观点多元呈现；建立更严格的内容审核机制，对恶意炒作、虚假信息等行为进行有效遏制。例如，一些平台通过建立内容审核算法和人工审核相结合的方式，有效识别和处理违规信息，防止虚假有害内容的传播。 3.3 机构有效利用与参与各类机构（包括媒体、教育机构、第三方组织等）在网

200 魔豆 | 10 页 | 305.67 KB | 2 月前
3

共 2 条前往

页

ChatGPT AGI 生成生成式 AI 媒介特质伴生风险网络舆情形成管理