据悉,撰写章过这项研究由史丹福大学生物医学资料科学的半被助理教授 James Zou 所主导,刊登于《Patterns》期刊,检测表示当下的器闹 GPT 检测器实际上存在不足,难以评定文章是乌龙否出自 AI 之手。
▲ 图源 期刊论文
研究者使用了 7 款热门的 GPT 检测器来检查共计 179 篇真人书写的文章,发现这些检测器把一半以上非英语母语者撰写的语母语者语文文章当作是 AI 生成的。
▲ 图源 期刊论文
IT之家查询论文发现,研究者并未公布用来实验的半被 GPT 检测器名称,但研究成果表示,检测当下的 GPT 检测器在“辨识托福文章是否由 AI 撰写”时,错误率高达 61.3%,甚至有一款 GPT 检测器的错误率高达 97.8%,且所有的检测器都一致认为,这些由真人书写的文章中,有 19.8% 的内容“绝对是由 AI 生成的”。
▲ 图源 期刊论文
▲ 图源 Pexels
研究者通过进一步分析发现,造成辨识错误的主要原因是非英语母语者在语言的多样化与词语的选择上较为有限,且掌握的英文词汇相对更“正式”,在部分生活场景中并不常使用,因此产生了 AI 的错误判定现象。
(责任编辑:时尚)