OpenAI语音转写工具Whisper遭遇重大缺陷:生成的转录文本现AI幻觉现象

风君子博客美联社近日的最新报道揭露了一个关于OpenAI的语音转写工具Whisper的重大缺陷。

据超过十位软件工程师、开发人员和学术研究人员透露,Whisper有时会生成大量虚假内容,这些内容被称为“AI幻觉”。这些幻觉内容可能包含种族歧视言论、暴力语言,甚至不实医疗建议。

Whispers的广泛应用和潜在风险

Whisper工具已被广泛应用于全球多个行业,包括翻译、访谈内容转录、生成消费科技文本和视频字幕制作等。这种广泛的应用使得Whisper的“幻觉”问题变得更加严重,因为它可能会在不经意间传播错误信息。

尤其是对于医疗机构来说,这一问题更为棘手。尽管OpenAI已经提醒用户不应在“高风险领域”使用Whisper,但一些医疗机构仍在急于采用基于Whisper的工具来记录医生与患者的咨询记录。

幻觉现象的普遍性

研究人员和工程师在工作中发现,Whisper的幻觉现象相当普遍。例如,密歇根大学的一位研究员在研究公共会议时发现,在尝试改进模型前,他所检查的十份音频转录中,有八份含有虚构内容。另一位机器学习工程师在分析超过100小时的Whisper转录时,发现大约一半的内容存在幻觉现象。

一位开发人员在其用Whisper生成的26000份转录中发现,几乎每一份都带有虚构内容。即便是音质良好的简短音频样本,也未能幸免于这些问题。计算机科学家们的研究表明,在审查的13000多段清晰音频片段中,有187段出现了幻觉现象。

OpenAI的回应

面对这一发现,OpenAI的发言人表示,公司正在持续研究如何减少幻觉,并感谢研究者的反馈。OpenAI承诺将在模型更新中采纳这些反馈,以改善Whisper的性能和可靠性。(Suky)

Published by

风君子

独自遨游何稽首 揭天掀地慰生平