科学家证实ChatGPT改变学术论文风格，百万篇论文词频减少10%

小条 2024-07-05

在最近的一项研究中，意大利国际与高级研究学院（SISSA）的博士生耿明猛量化了ChatGPT对学术写作的影响。

b93472037a2f4efd9adf3dcc9f8f2eb4~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720731717&x-signature=cQEL0QZwwBdCtXL1cx5DnamB60A%3D 图片|耿明萌（来源：耿明萌）

最近在arXiv[1] 上发布了一篇相关论文，标题为《ChatGPT 正在改变学者的写作风格吗？》（Is ChatGPT Transforming Academys’writing Style?）。

ce4914b6a76e4cbc8f7be74fc6fa339e~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720731717&x-signature=GbeyukwxAt7oE7LjC0i1ZZR9pf4%3D 图| 相关资料（来源：arXiv）

该报告称，此前大多数类似研究都分析了特定段落或文章由ChatGPT 生成的可能性。然而，这个结果着眼于大局。

例如，一项成熟的运动不仅需要伟大的运动员，还需要球迷、教练、投资者、裁判员等。

眼下已经不需要大模型的普及了，这个球场甚至显得有些拥挤。在此背景下，耿明萌想从事足球裁判或数据分析师工作。

事实上，就在一年前，他还不是ChatGPT的粉丝，也无意跟随大模型研究热潮。

2023年夏天，耿明猛老师将之前的论文初稿提交给导师后，导师并没有直接修改原文，而是给出了一些简单的建议和意见，其中很多都是为了写关于问题。

这时，耿明猛考虑使用ChatGPT来修改和完善自己的论文，但很快就意识到ChatGPT的风格与人类的不同，包括单词的使用频率。

因此，他想从词频方面分析ChatGPT对人类论文的影响。耿明猛导师日常工作是天文学和统计学，没有自然语言处理方面的经验。

导师还奇怪为什么还没人用这么简洁明了的方法来研究ChatGPT的效果。所以我暂时搁置了这个想法，猜测是因为它不可行。

2023 年秋天，情况出现了好转。当时讲师经常出差宣传他的新书，没有时间讨论研究组的项目。

于是耿明猛决定亲自尝试一下。

我特别记得万圣节假期的前一天晚上，我们解决完所有数据问题后，我们旅行了两周以获得初步结果，然后又回来了一周。

也就是说，ChatGPT出现后，学术写作中某些词语的使用频率发生了明显的变化。

为了方便起见，耿明猛选取了当时arXiv 上最新的100 万篇论文摘要进行分析。这是因为，尽管摘要很短，但它比论文的其余部分更具表现力。

结果我们发现，近年来论文数量增长很快。例如，从2018年到2023年，向arXiv提交的论文超过100万篇。大约90%的论文来自三个领域：数学、物理和计算机科学。

当然，初步的发现也很有趣：比如“significant”的词频增加了近两倍，而“is”和“are”的词频则下降了约10%。

4cedbc62ba774da69d19f12a51fbea29~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720731717&x-signature=itXvHRSiFFuVZup%2BW1JbGDuvKQU%3D （来源：arXiv）

因此，耿明猛挑选了2022年arXiv上的前2万篇论文摘要，通过ChatGPT API进行修改和打磨，并分析ChatGPT的用词偏好。

发现2023年ChatGPT修改论文前后的词频变化与2022年的词频变化密切相关。然而，与2021 年相比，2022 年的词频变化几乎没有相关性。

95fd77cb104b4664b8efbb4c6f62534b~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720731717&x-signature=gAuYGPtmXrHC%2BXJgUCJa%2BXWsKRk%3D （来源：arXiv）

如果你使用ChatGPT处理一些文章摘要，并且有一些未经ChatGPT处理的文章摘要的混合，你可以根据词频的变化来估计ChatGPT处理的文章摘要的比例是不是。那么，我们应该选择什么词呢？

为了回答这些问题，耿明猛提出了一个带有噪声项的模型，并证明在某些情况下选择更多的词并不是更好。

相反，您应该主要考虑两个标准： ChatGPT 处理前后的词频和变化率。

另外，针对不同类别、不同混合比例的摘要，所选用词也应有所不同。然后，通过标定和测试，上述理论分析也在仿真中得到了验证。

40656707851c41ada8187c746b195080~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720731717&x-signature=sWto8o3%2FM0rwjhZoy4tz5WjsQQU%3D （来源：arXiv）

基于此，他开始根据实际的arXiv 摘要数据来估算ChatGPT 的影响。

这个分析是基于ChatGPT API的模拟输出对于每个提示都有不同的输出结果，因此结果是相对的。

以“纠正下列句子”的结果为基准，ChatGPT 纠正的“百分比”约为35%。

如果研究人员在使用ChatGPT时能够使用更精确的提示，那么ChatGPT对文章摘要的贡献率很有可能会超过100%。

不过，耿明猛更喜欢从“影响力”而不是“比例”来看待结果。

不同的提示会产生不同的输出，因此相同的利用率会产生不同的估计结果。考虑到真实的使用场景，很有可能你在使用ChatGPT后故意删除了一些痕迹。

尽管有些作者的写作风格确实受到了ChatGPT 的影响，但他们最终并没有使用ChatGPT 来完善他们的论文摘要。同时，其他大型模型中的词频可能相似但不相同。

f16a3a93850e42c7b59b65272a3b93a4~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1720731717&x-signature=8sr6QDD%2FlUPsvtexKVvUyCVufAA%3D （来源：arXiv）

总的来说，耿明猛还是认为用ChatGPT等工具润色翻译论文没有什么问题，但注意修改前后存在语义差异，需要这样做。

对于母语不是英语的研究人员来说，合理使用这些新工具固然可以促进公平性，但直接使用这些工具生成论文段落并不推荐。

研究ChatGPT对论文风格的影响可以帮助研究人员更好地使用类似的工具。

参考：

1.https://arxiv.org/pdf/2404.08627

管理及排版：何晨龙

科学家证实ChatGPT改变学术论文风格，百万篇论文词频减少10%

猜你喜欢

科学家证实ChatGPT改变学术论文风格，百万篇论文词频减少10%

macOS版ChatGPT被指以纯文本存储AI对话，OpenAI紧急更新修复

腾讯dnf案，旭旭宝宝腾讯协议

dnf:旭旭宝宝懵了，dnf旭旭宝宝停播

dba博士值得读吗，dba博士学位

interesting千万别乱用！这里有大坑（interestinng）

drs华为云，华为云dmk

dba在数据库里是啥意思，数据库管理dba前景

丹桂村在哪里，丹桂村景点

什么是DBA，什么是dba岗位