前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

抖音热门 2026年07月01日 14:56 10 aa

论文简介

文章标题

Does GenAI Rewrite How We Write? An Empirical Study on Two-Million Preprints生成式AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

作者

Minfeng Qi , Zhongmin Cao , Qin Wang , Ningran Li , Tianqing Zhu

City University of Macau

CSIRO Data61

The University of Adelaide

文章情况

arXiv 预印本https://arxiv.org/abs/2510.17882

摘要

本研究对四大预印本平台（arXiv、bioRxiv、medRxiv、SocArXiv）上超过210万篇时间跨度近十年（2016-2025）的论文进行了大规模实证分析，旨在探究生成式AI（GenAI）对学术出版生态的深远影响。研究发现，LLM的普及显著加速了论文的投稿与修订周期，小幅提升了摘要的语言复杂性，并极大推动了AI相关研究主题的扩张。然而，这种影响并非均衡分布于各个学科，计算密集型领域从中受益尤为明显。我们的结论是，GenAI并非一个普适性的“颠覆者”，而更像一个“选择性催化剂”：它放大了部分领域的既有优势，同时也可能加剧了不同学科之间的发展鸿沟。

研究背景与核心问题

学术出版与GenAI的两大变革

近十年来，学术出版的格局正经历着深刻的结构性变革。一方面，以arXiv和bioRxiv为代表的预印本平台，因其较少的审稿限制，已成为学术交流的关键枢纽。它们允许研究者在同行评审前快速分享研究成果，为我们观察大规模、演进中的学术写作与传播实践提供了独特的窗口。

与此同时，以Transformer架构为基础的生成式AI技术迅猛发展，使得LLM只需简单提示即可生成逻辑连贯的学术文本。从GPT-3到ChatGPT及其后续模型，AI辅助写作工具正加速融入科研工作流程。

GenAI在科研领域的广泛应用，引发了关于知识生产与传播方式的根本性问题。AI系统不仅能加速写作与修订，还可能改变科研合作的结构，甚至重塑学术语言与学科范式。尽管各大出版商和顶尖高校已相继出台相关的使用规范与指南，但关于GenAI究竟如何影响学术产出的系统性实证研究仍然付之阙如。这正是本研究的核心动机：GenAI仅仅是提升了写作效率，还是已经开始重塑知识生产的底层逻辑？

核心问题与研究框架

我们认为，GenAI带来的影响并非一系列孤立的现象，而是一个环环相扣的变革链条：从加速研究周期，到重组学术劳动，再到重导研究焦点，最终可能引致学科版图的重构。基于此，我们提出以下五个核心研究问题（RQ）：

• RQ1 (加速):GenAI是否加快了学术出版的整体节奏？
• RQ2 (重组):GenAI是否改变了研究者的合作模式与产出效率？
• RQ3 (表达):GenAI是否影响了学术写作的语言风格与复杂性？
• RQ4 (重导):GenAI是否将学术界的注意力引向了AI相关的新兴主题？
• RQ5 (重构):GenAI是否改变了不同学科在学术产出中的比重与格局？

图1：研究问题概览

现有研究多集中于文献综述、引用分析或基于个人经验的评论，缺乏大规模、跨学科的数据驱动分析。本研究旨在填补这一空白，通过对四大主流预印本平台（arXiv, bioRxiv, medRxiv, SocArXiv）超过210万篇论文的实证分析，构建一个从宏观趋势到具体学科差异的多层次分析框架，系统地量化GenAI对学术出版的真实影响。

研究设计与分析方法

语料库构建：跨学科的大规模预印本数据集

本研究的数据来源于涵盖自然科学、生命科学、医学及社会科学的四大预印本平台，时间跨度为2016年至2025年。为保证研究的可复现性，所有数据均通过官方API获取。我们提取了论文的标题、摘要、作者列表、学科分类、提交与更新日期等关键元数据，这些数据为后续的投稿动态（RQ1）、合作模式（RQ2）、语言特征（RQ3）、主题演化（RQ4）和学科差异（RQ5）分析提供了基础。我们选择分析摘要而非全文，以确保跨平台数据的一致性与可比性。所有数据都经过了严格的清洗、标准化和去重处理。

图4：2016-2025年语料库在各平台的构成。

伦理考量：本研究所有数据均来自公开渠道，严格遵守各平台服务条款，不涉及作者的非公开个人信息，所有分析均在聚合层面进行。

多层次分析框架

我们为每个研究问题设计了针对性的分析方法。

图3：研究方法论

表3：我们的分析框架速览

RQ1 (加速)：出版节奏分析

为探究LLM是否改变了学术产出的节奏，我们采用中断时间序列（ITS）回归模型来检验关键时间点（GPT-3与ChatGPT发布）前后的结构性变化。模型如下：

其中，为月度投稿量，和为干预变量，标记模型发布后的时间段。该模型能够区分LLM带来的长期趋势变化（斜率改变）与短期冲击（水平改变），同时控制了新冠疫情等外部因素的干扰。

RQ2 (重组)：合作模式与生产力分析

作者署名模式是洞察科研组织方式的窗口。我们通过平均作者数量和单作者论文比例来衡量合作模式的变迁。同时，我们通过作者年均发文量来评估个人生产力。此外，我们定义**“修订节奏”**为同一作者连续两次投稿的时间间隔，用以衡量研究迭代与成果传播的效率。

RQ3 (表达)：语言风格分析

为评估学术文本的语言特征是否变化，我们从可读性和语言复杂性两个维度进行分析。可读性采用弗莱士阅读易读性（FRE）和弗莱士-金凯德可读性等级（FKGL）两个经典指标。语言复杂性则通过平均句长、词汇密度（实词占比）、从属子句比例（衡量句法深度）和难词比例四个互补指标进行量化。

RQ4 (重导)：研究主题分析

为追踪AI相关主题的演变，我们结合了关键词检测与主题建模。我们利用正则表达式（如“ChatGPT”、“LLM”、“transformer”）和基于非负矩阵分解（NMF）的主题模型，从海量文本中识别AI相关研究，并量化其在总论文中的占比变化。通过t检验和OLS回归，我们能判断AI相关主题在ChatGPT发布后是否经历了显著的加速增长。

RQ5 (重构)：学科差异分析

LLM的影响在各学科间存在差异。我们利用各平台自身的学科分类体系，对所有论文进行归类。通过分析各学科内AI相关论文的占比及其随时间的变化，我们可以比较不同领域对AI技术的采纳速度和整合程度，揭示其影响的不均衡性。

实证发现：多维度量化GenAI影响

RQ1 (加速): 投稿量呈现“短期扰动，中期加速”模式

图5：各平台投稿量变化趋势。前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

表4：月度投稿量的中断时间序列分析结果。

图5直观展示了投稿量的变化。在经历2020年疫情带来的波动后，arXiv和bioRxiv等主要平台的投稿量在2022年底（ChatGPT发布后）出现了新一轮的加速增长。ITS回归模型（表4）为这一观察提供了数据支持：模型结果显示，ChatGPT的发布虽在短期内造成投稿量的小幅下降，但随后带来了增长斜率的显著提升（例如，arXiv每月投稿量增速额外增加477篇）。这表明，在短暂的适应期后，学术界的产出节奏显著加快。

发现1：投稿动态呈现出“短期扰动后中期加速”的模式。ITS模型证实，在ChatGPT发布后，所有平台的投稿增长斜率均显著增加，尤以arXiv（+477, p

RQ2 (重组): 合作规模扩大，研究周期缩短

图6：每篇论文的平均作者数。前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

图7：每位作者的年均发表量。前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

图8：各平台论文的修订节奏。

我们的数据显示，科研合作的规模正稳步扩大。如图6所示，所有平台的平均作者数均呈上升趋势，其中医学（medRxiv）和生命科学（bioRxiv）领域的团队规模增长尤为显著。与此同时，作者的个人年均发文量（图7）则表现出学科差异，arXiv的作者产出效率最高。更值得注意的是，图8揭示了研究周期的普遍缩短。所有平台的平均修订间隔在2020年后均出现明显下降，尤其是在GPT-3和ChatGPT发布后，下降趋势愈发陡峭。

发现2：各学科的平均团队规模持续扩大（例如，arXiv从4.8人增至6.0人），而个人生产力则表现出学科异质性。论文的平均修订间隔在2020年后缩短了约30%，这表明由LLM赋能的工作流可能系统性地加速了各领域的研究迭代与成果传播。

RQ3 (表达): 摘要的语言复杂度微升，但可读性未变

图9：摘要可读性分析。前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

图10：摘要语言复杂性指标（2016-2025）。

可读性分析（图9）表明，尽管LLM工具普及，但论文摘要的整体可读性并未发生显著变化，其理解门槛依然维持在较高的专业水平。然而，语言复杂性指标（图10）却揭示了细微的转变。尽管平均句长等句法结构指标保持稳定，但词汇密度和难词比例在2022年后均呈现缓慢上升的态势。这说明摘要的行文风格并未改变，但其承载的信息密度和专业词汇量有所增加。

发现3：摘要的整体可读性（FRE和FKGL指数）保持稳定，表明ChatGPT并未从根本上改变学术写作的易读性。然而，词汇密度与难词比例的微升（约5-8%），暗示着文本的信息含量和技术专业性在逐步提升。

RQ4 (重导): AI相关研究主题呈爆炸式增长

图13：AI相关论文在各平台的占比变化。前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

图11：NMF主题模型提取的各平台代表性AI主题词云。

数据显示，AI相关研究在LLM时代正经历急剧扩张。如图13所示，AI主题论文的占比在2022年后出现明显拐点，尤其在arXiv平台，该比例从不足5%飙升至接近20%。主题模型（图11）的分析进一步揭示，这种增长并非局限于计算机领域，而是广泛渗透到了生命科学（如基因组学）、医学（如临床诊断）和社会科学（如政策建模）等多个学科。

发现4：ChatGPT发布后，AI相关论文的占比从2022年的不足2%激增至2025年的约9%。计算机科学、生物信息学和医学诊断等领域的增长尤为强劲。持续加速的趋势（β_post ≈ 0.2, p

RQ5 (重构): 学科间影响差异显著，“马太效应”初现

图12：各学科AI相关论文占比的时间动态。前沿编译丨AI是否正在重塑我们的写作方式？一项基于两百万篇文章的实证研究

图14：AI主题的跨学科采纳模式。

LLM带来的影响在学科间呈现出巨大的不均衡性。如图12和图14所示，AI技术的采纳高度集中于计算密集型领域。例如，在计算机科学内部，相关论文占比可超过50%；而在物理、数学等传统学科，该比例则普遍低于20%。生命科学（如基因组学）和部分社会科学（如计算社会科学）呈现中速增长，而更多依赖实验或质性研究的领域则增长缓慢。这种异质性表明，一个学科的既有数据文化和方法论基础，是决定其能否快速整合LLM的关键。

发现5：AI技术的采纳在各学科间极不均衡。计算机科学采纳率超过50%，而物理、数学等领域低于20%；生命科学和部分社科领域则处于中间地带。这种差异表明，LLM的整合程度深受学科自身数据文化与研究范式的影响，而非统一的技术驱动过程。

讨论：从实证发现到理论洞察

各项发现的内在逻辑：从加速到重构的连锁反应

本研究的各项发现共同描绘了一幅由GenAI驱动的学术生态系统变革的全景图。这个变革过程存在一个清晰的逻辑链条：首先，LLM通过降低写作与修订的门槛，直接带来了科研工作流的 “加速”（RQ1, RQ2）。效率的提升与工具本身的普及，共同“重导”了学术界的注意力，催生了大量关于AI本身及其跨学科应用的研究（RQ4）。随着AI相关主题的激增，整个知识版图的学科构成发生了“重构”，计算密集型学科的论文占比显著增加（RQ5）。最后，这种学科构成的变化，体现在了整体语言风格的“构成性转变”上（RQ3）：我们观察到的语言复杂度提升，并非因为所有研究者的写作风格都变得“AI化”，而是因为本身就使用更密集技术词汇的计算学科论文在语料库中的权重增加了。

研究局限与因果推断

尽管我们的分析揭示了强相关性，但在进行因果推断时仍需保持谨慎。本研究存在以下局限：1）分析基于预印本，结论能否完全推广至经同行评审的正式出版物有待验证；2）语言分析仅限于摘要，无法完全代表全文的风格变化；3）AI主题的增长不完全等同于AI工具的使用；4）时间上的重合不等于因果，尽管我们控制了疫情等变量，但仍无法完全排除其他混杂因素的影响。

核心洞见：证据表明，LLM并非以统一方式变革学术出版，而是扮演了“选择性催化剂”的角色：在那些已具备计算基础的领域，它极大地放大了产出效率；而在其他领域，其影响则相对有限。这种差异化的影响，是理解GenAI时代学术生态演变的关键。

实践意义与治理挑战

作者身份与智力贡献的边界模糊

LLM正在模糊作者身份的传统定义。过去，“作者”同时意味着思想的原创者和文本的创作者。如今，这两者正逐渐分离。当文本的起草与润色可部分交由AI完成时，人类学者的核心贡献更多地转向了高阶的“策划”工作：提出问题、设计实验、解读结果、整合思想。这种转变挑战了传统的署名与问责体系，核心问题已从“谁写了文本”转变为“谁贡献了核心智力成果”。

学科间不平等的加剧

我们的研究揭示，LLM带来的效率增益在学科间分布极不均衡，这可能加剧“马太效应”。计算密集型领域凭借其固有的技术亲和性，能够更快地利用LLM提升产出速度和影响力，而其他学科可能进一步被边缘化。这种趋势若不受引导，长此以往可能固化甚至加剧全球范围内机构与地区间的科研实力鸿沟。

学术治理面临的规范性挑战

LLM的普及给学术治理带来了三大挑战：信任、责任和公平。首先，当AI辅助写作成为常态，如何保证学术记录的可信度？我们建议推行强制性的AI使用声明制度。其次，当AI参与内容生成，如何界定学术不端（如剽窃、造假）的责任？现有的作者规范亟需更新，以明确人机协作中的权责边界。最后，面对学科间日益扩大的效率鸿沟，如何确保评价体系的公平性？在评估学者和机构时，必须考虑到这种由技术带来的结构性差异。

启示：LLM正在重塑的不仅是写作本身，更是整个学术产出的生态系统。未来的挑战不在于是否采纳AI，而在于如何建立一个责任明确、过程透明、机会公平的治理框架。

结论

本研究首次通过大规模、跨学科的实证分析，揭示了生成式AI正作为一种“选择性催化剂”，深刻地重塑着学术出版的格局。它通过加速研究周期、放大AI相关议题、加剧学科分化，对知识生产的效率、方向和结构产生了复杂而深远的影响。这些发现为我们理解和应对AI时代的学术生态演变提供了关键的实证基础，并呼吁学术界尽快构建新的规范与评价体系，以确保这个新兴的AI赋能的学术环境能够保持其公信力与公平性。

本文转自公众号 | 回归不归