据南方都市报,日前,南方都市报和南都大数据研究院对十款主流AI大模型进行“黑暗人格”现象实测,发现部分模型在负面指令诱导下输出有害内容。测试分为“注入反常场景”“反常语料测试”和“有害指令延展测试”三个环节。结果显示,部分大模型未能抵御指令“污染”,其中三款模型在其他领域回答中输出危险方案,如“抢银行”“用水泥灌内胎”等。专家指出,AI行为失控可能源于预训练阶段,但可通过“再对齐”技术纠正。复旦大学教授张谧建议,通过小模型监管大模型或大模型互相监督,并建立伦理审查机制,确保AI模型的安全性和合规性。
部分AI大模型在负面指令测试中出现危险输出(ai大模型在垂直行业的应用)

猜你喜欢
网红“闷闷嗲”涉毒在泰被捕 加盟商损失保证金引发关注
近日,泰国移民局逮捕了一名中国公民,此人因涉嫌涉毒和非法销售电子烟被通缉。经确认,被捕者为上海网红“闷闷嗲”,原名孙江东。天眼查信息显示,孙江东是上海一家餐饮公司的股东,旗下经营着多家“闷闷嗲面馆”加盟店

“史上最强风冷散热”OPPO K13 Turbo 系列手机发布,1799元起
该机搭载“疾风散热引擎”主动散热风扇,号称是 OPPO 史上最强的手机风冷散热技术,其采用 L型超低风阻风道和微型离心风扇系统,使得风量提升了 120%,散热能力提升了 20%,同时风扇支持场景自启动、智…

通信刚需小能手,devicenet转PROFINET网关兼容物流分拣自动化
现代化城市建设者,物流已全面覆盖各类行业,使用自动化系统和机器人搬运进行可靠地分拣和拣选--无论是用于生产还是客户订单--都能在内部物流中为企业节省时间和金钱,并很大限度地确保产品质量。PN – Devic…

鼎捷数智:2025年生成式AI企业应用实务报告(鼎捷数智2025聚英会)
该报告系统阐述了生成式AI在企业中的应用现状、价值及未来方向,核心围绕“数智驱动”展开,强调生成式AI正从效率工具升级为重塑商业模式的核心引擎。 在具体应用上,报告聚焦十大核心模块:数据层面实现多模态信息自…

蔡琳46岁带娃拒再婚,中文流利打破谣言,被赵丽颖羡慕(蔡琳夫妇)
她当时与高梓淇的离婚,也曾被猜测为因为语言不通导致的矛盾,但如今看她如此流利的中文,似乎一切都没有那么简单。 看到高梓淇对蔡琳如此细心——教中文、办两场婚礼、陪她适应中国生活,赵丽颖或许曾经羡慕过蔡琳这种被珍…
