第一个站内站

第一个站内站

LLM学术影响力日益深化,如何甄别其“隐形手”?


在学术的殿堂里,一篇篇论文如同璀璨的星辰,照亮了知识的天空。然而,随着人工智能技术的飞速发展,一个“隐形的手”正悄然伸向这片净土——那就是大型语言模型(LLM)。它们以强大的文本生成能力,为科研工作者提供了前所未有的便利,但同时也带来了新的挑战:如何甄别论文中LLM的“隐形手”?

近年来,LLM在学术领域的应用日益广泛,许多作者开始将LLM融入日常写作,甚至与其合作撰写论文。然而,这种合作并非总是那么隐秘。和人类作者一样,LLM也喜欢在论文中留下自己独特的写作印记,这些印记成为了发现LLM的线索。

研究团队对PubMed上发布的数百万篇摘要进行了深入分析,通过构建词汇出现的二元矩阵,计算词汇频率,发现了LLM的“蛛丝马迹”。在2024年以前,类似“coronavirus”的名词被超额使用;而到了2024年之后,则以“intricate”、“notably”等与研究内容无关的风格词为主。这些词汇大多都是多余的风格性动词和形容词,只改变了文体,并不影响内容。

这些发现揭示了LLM在学术写作中的“华丽风”偏好,它们喜欢使用夸张、复杂的词汇来修饰句子,使得论文读起来更加“高大上”。然而,这种风格化的写作却让使用LLM的论文极易被察觉。通过将低频风格词和高频风格词组合计算,研究人员发现在2024年的论文中,至少有10%-11%的摘要中使用了LLM,部分子语料库中这一比例甚至高达30%。

进一步的研究还发现,LLM在不同学科、地域和期刊中的使用存在显著差异。在计算领域、生物信息学等学科中,由于行业技术日新月异,研究者需要迅速掌握新技术,因此更依赖LLM协助,约占20%。而在中国、韩国等非英语国家中,由于需要LLM辅助英语写作,LLM使用率可达15%。相比之下,像英国、澳大利亚等英语国家的LLM使用率则相对较低。此外,一些低门槛的开放获取期刊中LLM的使用率也较高,而像《Nature》、《Science》等顶刊则相对较低。

然而,随着LLM使用的日益普及,一些作者开始意识到其“隐形手”可能带来的问题,于是开始引导LLM规避明显的AI痕迹。这使得研究人员现在难以准确判断论文与LLM的关系。尽管如此,研究人员表示,他们将通过统计大量文本中常见词汇的频率来进一步估计AI对学术文献的影响,而不仅仅只针对单个短文本进行检测。

LLM在科研工作中的影响力日益增长,这无疑为科研工作者带来了便利,但同时也带来了新的挑战。如何更好地让AI参与学术写作、AI使用的边界在哪里等问题,都值得我们重新思考。在未来的学术道路上,我们需要更加谨慎地使用LLM,确保其在为科研服务的同时,不会干扰到学术的纯净和严谨。
cache
Processed in 0.014638 Second.