以下文章来源于元透社 ,作者元透社编译
在苹果智能(Apple Intelligence)事件闹得沸沸扬扬之后,BBC对人工智能助手总结新闻的准确性展开了研究,结果不容乐观。
今年1月,苹果的设备端人工智能服务为BBC一则新闻故事生成了标题,该标题出现在iPhone上,称因谋杀医疗保险首席执行官布莱恩·汤姆森(Brian Thomson)而被捕的路易吉·曼吉奥内(Luigi Mangione)自杀了。这显然不符合事实,BBC向这家科技巨头提出了投诉。
苹果先是承诺进行软件更改,以便“进一步明确”显示内容是否为苹果智能提供的摘要,之后又暂时禁用了新闻和娱乐摘要功能。不过,在1月最后一周发布的iOS 18.3版本中,该功能仍然处于未激活状态。
但苹果智能远非唯一具备新闻摘要功能的生成式人工智能服务,这一事件显然让BBC深思。
日前发表的原始研究中,生成式人工智能项目主管皮特·阿彻(Pete Archer)撰写了BBC对这项技术的热情相关内容,详细介绍了BBC内部使用该技术的一些方式,比如利用它为音频内容生成字幕,将文章翻译成不同语言等。
阿彻表示:“当人工智能被负责任地使用时,将会带来真正的价值。”但他也警告称:“人工智能也给受众和英国的信息生态系统带来了重大挑战。”
此次研究聚焦于OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini和Perplexity助手,评估它们回答新闻相关问题的准确性,以及答案是否能忠实反映用作来源的BBC新闻报道。
在研究期间,这些助手被允许访问BBC网站,BBC向它们提出了100个新闻相关问题,并提示它们尽可能从BBC新闻文章中获取信息来源。通常情况下,这些模型是“被限制”访问BBC网站的。
BBC记者(均为所提问题领域的专家)对这些助手的回答进行了审核,评估其准确性、公正性以及体现BBC内容的程度。
那么哪个聊天机器人表现最差呢?BBC报道说:“在回答中,34%的Gemini、27%的Copilot、17%的Perplexity和15%的ChatGPT在体现用作来源的BBC内容方面存在严重问题。最常见的问题是事实性错误、信息来源标注以及缺少背景信息。”
BBC发现的一些令人不安的不准确之处包括:Gemini称“英国国家医疗服务体系(NHS)建议人们不要开始使用电子烟,并且建议想要戒烟的吸烟者应使用其他方法”,而实际上,这家医疗服务机构确实通过“替换戒烟”计划将电子烟作为一种有效的戒烟方法进行推荐。
至于法国强奸受害者吉泽尔·佩利科(Gisèle Pelicot),Copilot表示,失忆和记忆丧失使她发现了针对自己的罪行,而实际上她是警方给她看了从其被拘留丈夫处没收的电子设备上发现的视频后才知道这些罪行的。
当被问及去年在希腊锡米岛失踪的电视医生迈克尔·莫斯利(Michael Mosley)的死因时,Perplexity称他于10月30日失踪,尸体于11月被发现。但实际上,他于2024年6月去世。“同样的回答还歪曲了莫斯利妻子对家人对其死亡反应的描述。”研究人员写道。
论文中还有很多类似的不准确或缺乏背景信息的例子,比如Gemini称“露西·莱特比(Lucy Letby)是否有罪由每个人自己决定”。莱特比因在2015 - 2016年谋杀7名婴儿并企图谋杀另外7名婴儿,已被法院判处15项终身监禁。
在一篇随附的博客文章中,BBC新闻与时事部门首席执行官黛博拉·特内斯(Deborah Turness)写道:
“人工智能带来的非凡益处的代价,绝不能是一个人们搜索答案时得到的是扭曲、有缺陷的内容,而这些内容却自诩为事实的世界。在一个看似混乱的世界里,寻求清晰的消费者却遭遇更多困惑,这显然不对。我们不难想象,人工智能的这种扭曲会多快地破坏人们对事实和经过核实的信息本就脆弱的信任。
我们生活在一个动荡的时代,还要多久,一个被人工智能扭曲的标题就会造成重大的现实伤害?开发生成式人工智能工具的公司正在玩火。”
各种模型的训练截止日期当然无济于事,然而这项研究揭示了生成式人工智能在总结内容方面的弱点。即便这些助手能够直接获取它们被询问的信息,仍然经常凭空捏造“事实”。
科技巨头们正鼓励员工使用生成式人工智能撰写电子邮件、总结会议等。
如果收件人也使用人工智能回复邮件呢?最终,信号将被淹没,一切都将变成噪音。
此外,微软已有研究表明,生成式人工智能正在导致员工的批判性思维能力退化。
《注册者》(The Register)向微软、OpenAI、谷歌、Perplexity和苹果征求了评论。
OpenAI的一位发言人表示:“我们通过帮助每周3亿ChatGPT用户通过摘要、引用、清晰的链接和归属关系发现优质内容,来支持出版商和创作者。我们已与合作伙伴合作提高行内引用的准确性,并尊重出版商的偏好,包括通过在他们的robots.txt文件中管理OAI - SearchBot来控制其在搜索中的显示方式。我们将继续改进搜索结果。”
元透社编译。未做改动。内容不代表元透社立场。
原文:
https://www.theregister.com/2025/02/12/bbc_ai_news_accuracy/
原作者:
Richard Currie