什么是 GPTZero? 如何使用它来检测人工智能生成的文本

核心要点

  • GPTZero 是一款人工智能检测工具,它使用困惑度和爆发性分析,帮助教师区分原创文本和人工智能生成的文本。
  • GPTZero 提供免费和高级版本,功能和限制各不相同,允许用户每月分析数百万字。
  • 尽管 GPTZero 致力于减少误报,教育工作者不应完全依赖其结果,而是应该谨慎使用它,以避免不公平的评分。

自 OpenAI 的 ChatGPT 发布以来,全球教育机构都对其表示关注,因为学生开始利用它来撰写论文和在考试中作弊。由于聊天机器人生成的文本看起来非常自然,教师很难判断学生作业是否为原创。

为了协助教师评估学生作业,一位计算机科学专业的毕业生开发了 GPTZero,这是一款人工智能检测工具,可以识别文本是否为人工智能生成。

这一切听起来都很棒,但 GPTZero 真的能够检测人工智能创建的内容吗?它的准确率如何呢?

什么是 GPTZero,它的工作原理是什么?

GPTZero 是由计算机科学毕业生 Edward Tian 开发的 AI 文本分析工具,旨在帮助教师区分抄袭文本和原创作品。该工具通过分析文本的复杂性和爆发性来判断文本是人工生成还是由人类创作。

在深入探讨之前,让我们了解一下这两个术语的含义:

  • 困惑度是自然语言处理(NLP)中衡量文本随机性的指标。人类书写的文本通常结构较不严谨,更具不可预测性,因此其困惑度值会更高。相反,人工智能生成的文本则应具有较低的困惑度得分。
  • 爆发性则考虑了困惑度没有纳入的其他变量,以改进文本分析。它指的是在随机集群中出现不常见项目的现象。人工智能生成的文本在结构上往往比人类书写的文本更为一致,爆发性有助于识别这一点。

GPTZero Classic 自 2023 年初开始向公众免费开放。然而,免费版本的每个文档的字符数限制为 5000 个字符,并且一次只能批量分析三个文档。

GPTZero 提供了三种高级版本,以满足每月分析数百万字的用户需求:Essential(每月 10 美元)、Premium(每月 16 美元)和 Professional(每月 23 美元)。高级版本的每个文档字符数限制高于免费版本,并且还允许您每小时执行更多扫描等其他优势。

要订阅这些高级版本,请按照以下步骤操作:

  • 访问 GPTZero 的网站
  • 单击页面右上角的仪表板选项卡。
  • 使用现有帐户登录或创建一个新帐户。
  • 登录后,您可以比较可用的方案,并升级到最适合您需求的方案。
  • 或者,当您访问 GPTZero 主页时,点击文本框底部的“升级”按钮即可查看、比较和购买付费方案。

    如何使用 GPTZero 检测人工智能生成的文本

    与 ChatGPT 不同,使用 GPTZero 不需要注册,您可以直接通过网站访问此工具。

  • 访问 GPTZero
  • 将要分析的文本复制并粘贴到文本框中,或上传文件。
  • 点击“检查来源”按钮。
  • 扫描完成后,GPTZero 将会告知您文本是由人编写还是由人工智能生成。

    如何使用 GPTZero 的 Origin 扩展程序来检测人工智能生成的文本

    通过在 Chrome 浏览器上下载 GPTZero 的免费 Origin 扩展程序,您可以扫描整个网页和 Google 文档以查找人工智能生成的文本。这一功能简化了在线验证信息的过程。

  • 访问 Origin 的扩展程序页面 在 Chrome 网上应用商店。
  • 点击“添加到 Chrome”下载扩展程序。
  • 接下来,确认安装以继续。
  • 安装扩展程序后,您可以使用 Google 帐户登录或创建一个新帐户。
  • 要扫描网页或 Google 文档,请点击屏幕上的“来源”按钮,然后选择“扫描整页”。
  • 现在,您可以查看结果并判断内容是由人编写还是由人工智能生成。

    使用 GPTZero 分析您的写作

    GPTZero 与其他几个人工智能检测工具的不同之处在于,它可以分析您的写作风格。该平台提供扫描历史记录,您可以使用它来查看使用该工具扫描的任何文本。

    此外,点击特定的搜索结果可以显示有关您的写作的更详细数据。 从本质上讲,您将能够了解为什么您的写作被认为是人类创作或人工智能生成。

    因此,举例来说,如果 GPTZero 将您编写的内容标记为人工智能生成,访问写作分析将告诉您原因,例如该内容具有低复杂性和高爆发性。您可以修正这些问题,以提高内容的质量、可读性和真实性。

    GPTZero 能否正确识别人工智能生成的文本?

    为了测试 GPTZero 检测人工智能生成文本的准确性,我们分析了该工具中的三种文本:人工智能生成的文本、人类编写的文本,以及经过其他工具释义的人工智能生成的文本。我们来了解一下 GPTZero 如何响应每种输入。

    1. GPTZero 中人工智能生成文本的分析

    为了分析人工智能生成的文本,我们首先使用 ChatGPT(一个由 GPT 技术支持的人工智能聊天机器人)生成文本。为此,请按照下列步骤操作:

  • 访问 OpenAI
  • 点击“尝试 ChatGPT”按钮。
  • 登录或注册以创建一个帐户。
  • 输入任何提示来生成一段文本。
  • 完成后复制该工具生成的文本。
  • 如前所述,在 GPTZero 中分析该文本。
  • 当我们进行这项测试时,GPTZero 对一系列人工智能生成的文本给出了不同的结果。有时,它无法判断文本是否为人工智能生成,而有时,它能正确推测出大部分文本是由人工智能生成的。

    您也可以使用其他人工智能写作工具来生成您想要分析的文本。

    2. GPTZero 中人工智能生成文本的释义分析

    您可以从数百种释义工具中进行选择来释义文本。在本例中,我们使用了 Scribbr。如果您想使用相同的工具,请按照以下步骤操作:

  • 访问 Scribbr
  • 复制我们之前在 GPTZero 中分析的人工智能生成文本,并将其粘贴到该工具中。
  • 点击释义按钮。
  • 让 Scribbr 为您释义文本。
  • 释义后再次运行 GPTZero 测试。
  • 我们发现,轻微的释义使 GPTZero 更难确定文本是否为人工智能生成,但总体而言结果不尽相同。我还想补充一点,转述的输出质量很差。左边的文字是原文,右边的文字是释义后的版本。

    3. GPTZero 中人类编写内容的分析

    在某些情况下,像 GPTZero 这样的工具会返回误报结果,这意味着它们错误地认为某些内容不是人类编写的,但实际上并非如此。为了确定 GPTZero 是否也会产生误报,我们对该工具进行了多项测试,分析了不同的人类编写的文本片段。

    尽管发现一个句子可能由人工智能编写,但 GPTZero 的结果在很大程度上是准确的。

    您应该相信 GPTZero 的结果吗?

    根据我们的测试,仅仅依赖此工具的结果可能存在风险。事实上,每次使用该工具生成结果时,都会出现免责声明,警告教育工作者不要完全依赖该工具的结果。

    因此,除非该工具的开发人员保证其结果万无一失,否则教育工作者不应完全依赖它。为什么?因为学生仅仅因为 GPTZero 返回误报而获得较差的成绩是不公平的。

    GPTZero 致力于最大限度地减少误报

    尽管还有很长的路要走,但 GPTZero 在减少误报方面已经取得了重大进展。该公司部署的新深度学习模型推动了这些努力,使人工智能检测工具比竞争对手的服务更加可靠。

    新的深度学习模型使用更加多样化的验证数据集,利用教育文本、报纸文章、社交媒体帖子和问答内容等来源。这种扩展且多样化的数据集使 GPTZero 能够更好地区分人类生成的数据和人工智能生成的数据。此外,该公司还声称,GPTZero 的预测比以前更加“有信心”。

    不要总是相信人工智能检测结果

    作为 OpenAI GPT 技术的潜在解药,GPTZero 潜力巨大; 然而,它还有很长的路要走。目前,它并不完全值得信赖。但 GPTZero 的主版本是否能够克服所有限制并准确捕捉人工智能内容呢?我们只能拭目以待。