一个物理学家眼中的 AI for Science

源济 · 发表于 2026-4-28 05:34 PM

一个物理学家眼中的 AI for Science

原创祁晓亮知识分子

2026年4月27日 20:44

4.28

知识分子

The Intellectual

图源：Unsplash / Andres Siimon

摘要：

本文认为，人工智能革命，尤其是大语言模型的兴起，其最重要的意义并不只是自动化，而在于复杂信息以及人类 know-how 的承载、复制与共享方式发生了根本变化。从这个角度看，AI for Science 之所以尤其重要，是因为它改变的不仅可能是科研效率，还可能是科学协作、科学发现、科研出版与科研评价的整体结构。本文勾勒了 AI 从科研工具逐步走向科研合作者的路径，并讨论 AI 可能如何根本性地重塑科研出版。文章同时指出，如果要让 AI 在原创性科学发现中发挥真正作用，持续学习和思想多样性是两个关键前提。

撰文｜祁晓亮（斯坦福大学Leinweber理论物理研究所）

● ● ●

01

背景：大语言模型带来了什么

基于深度神经网络的 AI 在过去十几年中发展迅速，但与此前的进展相比，大语言模型（LLM）带来的革命尤其深远。在现代物理学中，人们越来越认识到信息具有基础性地位，它甚至可能是时空和物质规律背后更深层的概念。我认为，这一轮新的 AI 革命，也可以从信息的角度来理解。

考察一个复杂系统时，关键在于其中最重要的信息是如何被控制、承载和处理的。换句话说，我们应该问：最复杂的信息处理是如何完成的，它依赖什么样的载体，而这种载体又如何改变整个系统整体的动力学。从这个角度看，当下的 AI 革命并不只是一次技术升级，而是地球上信息动力学历史中的一个新阶段。

信息动力学的三次重大转变

地球历史上信息动力学三次重大转变的示意图：生命、人类语言，以及 AI 革命。

在地球历史上，复杂信息的主要载体与处理者经历了几次重大转变。每一次转变改变的不只是信息传递的速度，也改变了适应、学习和群体演化的结构。

第一次重大转变是生命的出现。以 DNA 和 RNA 为信息载体，生命系统的特征和行为得以跨代存储、复制和修改。生物演化之所以可能，正是因为有用的信息不再随着单个个体的死亡而消失，而是能够在漫长时间尺度上被保存、积累和不断优化。在这个阶段，复杂信息的复制与处理嵌入在生命本身之中。

第二次重大转变是人类语言的出现。语言使经验、记忆和知识能够在人与人之间、代与代之间直接传递，而不必等待生物遗传。与遗传演化相比，语言与文化的演化速度快得多。人类社会得以通过交流、教育和书写不断积累思想、制度与技术。从这个意义上说，人类文明中最关键的信息动力学过程，从基于 DNA 的演化，转向了基于语言的文化演化。

第三次重大转变就是当下的 AI 革命。以人类语言为起点，AI 模型正越来越能够在统一框架中表示和处理多种信息，包括文本、图像、音频、视频和结构化数据。这意味着，在人类历史上第一次，最复杂的信息处理不再只是人脑的专属领域。此前的信息技术革命极大改善了信息的存储、传输与检索，但最深层的解释、综合与判断仍然依赖人类认知。机器可以执行被明确定义的程序，却无法广泛参与对复杂、开放式信息的灵活处理。

大语言模型标志着一种质变。虽然它们还没有达到人类水平的通用智能，但其能力覆盖面的广度，已经使它们在许多信息处理任务上可以与人类相比较。因此，这一轮革命的意义并不只是机器算得更快、搜得更高效，而是机器的信息处理复杂度跨过了一个重要门槛。这也正是为什么 AI 革命应当被理解为人类历史上前所未有的事件。如果说人类语言相对于生物演化加速了文明的演化，那么在人类与 AI 共生的时代，文明的演化速度可能还会进一步加快，并且发生在更短的时间尺度上。

大语言模型革命带来的根本变化

大语言模型革命带来的最根本变化，是人类 know-how 正开始变得可以被大规模复制和共享。在我看来，这一点比任何单一应用都更重要。在 AI 出现之前，人类已经能够通过书籍、论文、公式、软件和形式化指令来共享显性知识。然而，人类真正能力的一大部分并不以完全显性的形式存在，它更多表现为 know-how：由经验形成的判断、做事的直觉、解决问题的习惯、对语境的理解，以及面对真实情境中细微变化时的应对能力。

传统上，这类 know-how 只能通过密切的人际互动来传递。它需要学徒式训练、重复练习、观察、纠正，以及往往持续很长时间的合作。教材可以解释原理，却无法完整传达专家究竟是怎样工作的；论文可以呈现结果，却通常不会写出那些失败的尝试、中间的判断、实践中的技巧，以及获得结果所依赖的语境理解。也正因为如此，知识可以被广泛传播，而经验却很难被复制。这种差距一直限制着人类能力扩散的速度。

大语言模型正在从根本上改变这种状态。通过学习大规模的人类语言记录，并在真实任务中与用户直接互动，AI 系统能够吸收并重现那些此前只存在于人类实践中的推理、解释、决策与任务分解模式。它们不只是存储显性的知识表述，也能够具备可操作的专业能力：面对问题时如何切入、下一步该问什么、工作流应当怎样组织，以及如何把一般性原则适配到具体语境中。

这也是为什么 AI 会带来一种新的生产力。它最深层的贡献并不只是狭义上的自动化，而是对人类 know-how 的大规模复制与分发。那些过去依赖面对面传授的能力，现在至少有一部分可以被编码进 AI 系统并广泛共享。从这个意义上说，AI 扩展了专业经验的社会传播半径。它让那些过去局部的、脆弱的、难以迁移的实践经验，变得更容易获取、复用与组合。

我认为，这正是 AI 革命的核心。关键问题不只是机器能否完成任务，而是机器能否承载并传递那些过去只有通过高成本的人际教学才能传递的人类能力。一旦 know-how 变得可以规模化复制，教育、科研、生产和协作的组织方式都会随之改变。这是 AI 形成新生产力最根本的机制，也是它的影响远远超出一般技术进步的原因。

02

AI for Science

基于前面的观察，AI 革命会给各个领域都带来根本性变化。在它的诸多应用中，最重要的也许是它对创新活动本身的改变，因为这种改变最有可能创造长期且深远的价值。正因为如此，我们尤其需要认真讨论 AI 会如何影响科学与技术领域，因为这里的核心任务是拓展知识前沿并产生真正新的思想。在更早的技术阶段，新工具可以提高科研效率，但并不会直接改变创新过程本身。相比之下，大语言模型带来了这样一种可能性：AI 在科学发现中参与的角色，不再只是工具，也可能成为合作者。在这一节中，我将先讨论当前科学研究的主要挑战，再讨论 AI for Science 所带来的机会，最后讨论 AI 仍然面临的难题以及下一步的发展方向。

科学研究的痛点

科学研究主要痛点的示意图，包括理解前人工作的时间成本、隐性知识的流失、协作规模的限制，以及行政性负担。

为了理解 AI 会给科研带来什么，我们需要先回顾当前科学研究普遍面临的一些问题。不同学科的挑战当然并不完全相同，但其中有几类是高度共通的：

1. 时间成本：了解领域进展、学习他人的工作，需要耗费大量时间。

2. 隐性知识的流失：研究过程中积累的大量“中间”经验与数据并不会完整体现在论文中，导致后来者不得不从头摸索。

3. 协作规模受限：科研合作的规模受到人与人沟通成本的约束，因此大规模协作以及跨学科合作都很困难。

4. 行政性负担：写论文、审稿、写基金申请，以及在研究结束后向他人解释工作内容等非创造性任务，会消耗大量时间。

正如背景部分所讨论的，这些问题更深层的原因在于：显性知识可以被广泛共享，而人类经验与 know-how 却难以转移。在科学研究中，这种区别尤其重要。论文可以记录最终结果、形式化方法和经过选择的证据，但它通常无法完整保留一项工作真正是怎样做出来的。科研中很多关键要素都是没有明确记录的：如何选择一个值得做的方向、如何避免无效尝试、如何调试实验或代码、如何判断一个意外结果究竟是错误还是发现，以及当真实条件偏离论文中的理想假设时应如何调整方法。结果是，每一位新学生或新合作者，都必须花很多时间去重建那些实际上已经存在于共同体中、却没有被完整传递的实践理解。这也是为什么科研训练缓慢、跨学科合作困难、很多结果在实践中难以复现的重要原因之一。如果这一层科研 know-how 能够被更有效地捕捉和共享，那么科研协作的速度与结构都会发生根本变化。这正是 AI 革命打开的最重要可能性之一。

科学研究的智能体化

科学研究智能体化的示意图：从 AI 使用科研工具、自动化重复性工作，到参与科研协作、促进跨学科互动，以及推动智能体化出版。

大语言模型在科学研究中的应用已经开始展开，AI 智能体正在生物、数学、化学、理论物理和机器学习等领域辅助科研。虽然当前应用仍然处在探索阶段，但许多领域的研究者已经识别出越来越多有意义的使用场景[1][2][3][4][5][6][7]。我相信，AI 最终会给各学科的科学研究带来根本性的巨大变化。同时，这种变化并不会以一种事先设计完成的系统形式突然到来。它更可能是在一个开放共同体中被逐步探索出来的：在这个共同体里，人类研究者和 AI 系统学习如何协作，并一步步重塑科研流程。

我把这一过程称为科学研究的智能体化。这里的关键并不只是 AI 成为更好的工具，而是它在科研真实工作流中逐渐获得更强的自主性、连续性与在场性。在这一小节中将讨论这种变化的几个维度。大体上，我会从近期、具体的变化出发，逐步走向更长期、更结构性的变化。

AI 使用科研工具

AI 参与科学研究的第一步，是让 AI 能够使用研究者真正依赖的工具[2][8][9][10][11][12][13]。在理论研究中，这包括计算软件、模拟包、编程环境、数据库和算力资源；在实验研究中，这包括仪器控制软件、数据采集系统、参数调节界面以及过程监控系统。没有这样的接入能力，AI 就仍然被限制在聊天框里。它可以提出建议、给出解释，但还不能直接参与真实的科研过程。

一旦 AI 能够使用科研工具，它的角色就会发生质变。它可以从“告诉人类应该做什么”，转向“直接完成工作的一部分”。随着模型能力提升，这一能力一开始可能体现为完成简单、重复的任务，但它会逐步扩展到更长、更复杂的工作流，甚至包括对意外情况的响应。从这个意义上说，工具使用赋予了 AI 在科研世界中的“身体”。它使 AI 能够贯穿整个过程持续在场，而不是只在零散的咨询时刻出现。

这一步之所以重要，不仅因为它提高效率，也因为它对 AI 自身后续的发展至关重要。当 AI 被嵌入真实工作流之后，它就能接触到传统训练语料中没有的重要科研数据与实践反馈。这些内容包括失败的尝试、中间状态、仪器行为、流程中的决策，以及高度依赖语境的调整。对于构建真正能参与前沿研究、而不只是擅长课本式推理的系统而言，这类数据是关键性的。

重复性工作的自动化

当 AI 获得了必要的工具接入之后，接下来的优先事项并不是立刻追问它是否能够提出重大新思想。一个更实际、也更高产的第一步，是先让它接手科研中那些常规、重复的工作。这很像初学研究生的成长路径。人类研究者也是先通过受约束、可重复的任务来熟悉科研工作流，然后才逐步做出更独立的贡献。AI 也应当沿着类似路径发展。

这一阶段包括文献调研、前人工作的整理、标准流程的实现、理论或实验分析中可复现的部分、仪器调试、目标明确的测量、参数扫描、数据清洗，以及常规报告或总结的准备等等。这些任务常常非常耗时，但并不是原创性的主要来源。将它们自动化，可以立刻减轻研究者负担，让更多人类精力投入判断、解释和创造性思考。

同样重要的是，这一阶段也给了 AI 一个在完整科研过程中积累经验的机会。通过参与常规工作，AI 可以逐步学习科研项目实际上是怎样推进的、瓶颈在哪里，以及人类研究者偏好怎样协作。最有效的人机合作模式在不同学科之间很可能差异很大，这些模式大概率不是事先设计出来的，而是通过实践逐步发现出来的。随着 AI 能力增强，它所能承担任务的复杂度也就可以一步步提高。

从工具走向合作者

在前两个阶段的基础上，AI 可能最终跨过一个重要门槛：从工具走向合作者。这个门槛在不同学科中可以有不同定义，但一个很实际的标准是，它是否能在一个科研项目里做出与研究生相当的贡献。如果在一项具体科研工作中，一个 AI 系统的贡献真的可以与一位人类学生共同作者相比较，那么即使它相对人类仍然有明显短板，它也已经进入了科研的内部空间，而不再只是一个外部辅助工具[14][9][8][6][11]。

这个门槛之所以重要，是因为它标志着“谁在参与定义创新前沿”发生了变化。在此之前，AI 主要是在帮助人类执行或加速人类已经定义好的任务；而在此之后，AI 开始影响科学发现本身的方向、结构与内容。如今，AI 给出有价值建议、提出新假设、发现意外联系的案例已经开始出现，这类情况未来很可能会越来越常见。

由于 AI 能力提升得很快，一旦它到达“合作者”阶段，也可能意味着它在某些维度上超过人类并不会太遥远。因此，我们可以把“作者级别的科研贡献”看作 AI for Science 的一种新型图灵测试。这里的核心问题不再是 AI 能否模仿人类对话，而是它能否以接近被公认的人类贡献者的水平，参与可发表科学知识的生产。

新型跨学科合作

随着 AI 能力增强，它还有可能降低学科之间的壁垒。许多重要的科学机会都出现在学科交界处，但这类合作往往受到语言、方法、背景知识和研究文化差异的限制。AI 可以帮助跨学科翻译概念、总结陌生文献、连接工具与数据集，并降低原本阻碍深入合作的沟通成本。

这件事之所以重要，是因为跨学科工作往往最容易带来重大突破，但同时也是人类协调最困难的地方。一个生物学家、一个物理学家和一个机器学习研究者，也许各自掌握着某项新发现所需知识的一部分，但把这些部分真正拼在一起需要大量协调成本。AI 可以在这些领域之间充当一个积极的接口，让合作更容易发起，也更容易持续地产出成果[15][16]。AI 参与这类合作，还会进一步催生新的合作平台与合作模式，就像早年的万维网和 arXiv.org 深刻改变了科学交流与协作一样。

科研出版的智能体化

科学研究的智能体化，最终也将扩展到科研出版本身。今天，科研结果通常通过静态论文来呈现，而这种形式会把一个复杂的研究过程压缩成有限且高度标准化的表达。正如前文所说，这种格式非常适合存档显性知识，但并不适合传递科研 know-how 的完整深度。

当 AI 以合作者的身份深度参与科研之后，一个自然的结果就是新的出版形式：我们发表的可能不再只是论文，而是直接发布智能体本身。这样，一项科研成果就不再只由静态文档来代表，还可以由一个可交互的 AI 智能体来代表。这个智能体能够解释研究背景、所用方法、推理过程、中间判断以及相关工具接口；它还可以帮助复现工作中的部分内容、重新运行标准分析，甚至进一步扩展原有项目。举例来说，读者不再只是阅读论文的 methods 部分，而可以直接向这个科研智能体询问：为什么采用某个近似？考虑过哪些替代路线？如果修改某个假设，结论会怎样变化？现有论文还没有直接提出“把科研智能体本身作为发表对象”，但围绕端到端 AI 科研系统、AI 作者与审稿，以及出版界如何应对 AI 的相关工作，已经表明科学产出正逐步走向更强的智能体介导与交互形式[17][18][19][20][21]。

这样的智能体还可以针对不同受众自适应地调整解释方式。它可以给学生提供简洁的概念介绍，给专业研究者提供技术性更强的说明，也可以给试图在此基础上继续推进工作的研究者提供偏实现层面的指南。从这个意义上说，出版将不再像是存放一份静态记录，而更像是部署了一个通向科研成果本身的“活接口”。这会显著减少复杂工作在被压缩成传统论文形式时所损失的隐性知识。与此同时，出版也必须平衡两种要求：核心科学内容必须足够稳定，才能被引用、核查和批评；而智能体层则应当能够面向不同受众，以多种交互方式解释这些内容。因此，关键问题在于，如何找到稳定的档案记录与灵活的解释界面之间的合理组合。

智能体化出版还可能加速基于既有工作的后续研究。如果一位科学家想在前人的结果之上继续推进，对应的科研智能体可以帮助识别关键假设、复现计算、定位有用数据集，或建议可能的扩展方向。更有意思的是，它还打开了智能体与智能体之间合作的可能性。如果两篇不同工作的作者都认为新的发现可能出现在它们的交叉点上，他们就可以允许代表这些工作的智能体彼此交换想法、比较假设、探索兼容性，并生成可能的后续研究方向。人类研究者再去评估和发展其中最有前景的部分。这样一来，智能体化出版不仅会改善科学传播，也会创造新的科学探索机制。

在学术界，发表不仅是分享成果的方式，它也在评价与奖励中起核心作用。在很大程度上，学术成就至今仍主要通过论文影响力来衡量。因此，科研出版的智能体化也意味着评价体系本身可能需要发生根本变化。这将回应科研共同体中一个被讨论已久的问题。当前的学术出版体系已经延续了一个多世纪，存在许多众所周知的局限：同行评审高度依赖学者的无偿劳动，期刊往往同时向作者和读者收取不菲费用；与此同时，那些对共同体极有价值的工作，例如维护一个重要的开源科研软件库、建设数据集或开发共享实验平台，常常因为无法自然地装进标准论文格式而被低估。

如果出版变得更加智能体化，就可能产生新的方式来识别和评价这类贡献。虽然这种制度最终会以何种形式出现仍不确定，但更清楚的一点是，学术界的评价与奖励结构将发生深刻变化。因此，从今天开始探索更低成本、更高效率、也更开放的智能体化出版平台，本身就已经很有价值。正如科学史上许多此前的转变一样，这类平台的最终形态，很可能也是在研究共同体的集体实验中逐步涌现出来的。

AI for Science 面临的挑战

为什么 AI 科研的下一步关键在于实时学习与思想多样性：它们将使 AI 能够持续适应前沿研究，并支持更具原创性的科学发现。

上面讨论的机会非常值得重视，但不应将其误认为已经完全实现的能力。要让 AI 从令人鼓舞的演示实验阶段真正走向对科学研究的实质性改变，仍然有几个核心挑战需要解决：

1. 缺少科研一线数据：模型在课本式问题上表现出色，但在真实科研场景中仍会遇到困难，因为训练数据无法覆盖每一个垂直细分领域的细微语境。要让 AI 真正理解这些领域，就需要一线专家带着 AI 进入真实科研，从而让它接触专业数据并进行更有针对性的训练。

2. 缺少实时更新能力：科研中新的工具和概念不断出现，而这些内容无法仅通过离线训练被模型快速掌握。AI 需要具备持续学习的能力。目前，一些上下文工程协议，例如模型上下文协议（Model Context Protocol, MCP）[22] 和智能体技能协议（Agent Skills Protocol）[23]，正在朝这一方向推进，通过把 AI 连接到工具与知识来部分地满足这一需求。

3. 需要新的评估框架：当前的评估方法仍然大体建立在基准测试（benchmark）之上，而这种方式有两个重要局限。第一，现有基准测试往往侧重较广泛且相对主流的领域，因此对高度专业化的研究场景不够精确。第二，基准测试通常是问答式评估，不适合衡量一个智能体在长期科研合作中的实际表现。近期一些面向具体领域的评估工作，已经指向我们未来真正需要的那类更丰富的评估，包括长上下文科学推理任务、由专家构建的凝聚态理论问题、由专家打分的文献理解，以及端到端可验证的物理工作流等[24][25][26][11][27][28][29]。一旦 AI 开始以科研合作者的身份工作，我们可能需要像评价研究生一样评价它：不只是看它能否在孤立任务中给出正确答案，更要看它在真实项目中的长期表现、从反馈中学习的能力、对工作流的可靠贡献，以及它在具体语境中的判断是否真正有用。如何提供这种长周期、高分辨率的反馈，并把它有效纳入 AI 训练，答案仍然是未知的。

在这些挑战之中，我认为 AI 下一步最重要的发展方向，是具备实时学习，也就是在线学习的能力[30]。与人类相比，当前 AI 系统仍然需要过多数据和过长时间，才能通过训练获得新能力。相较之下，人类研究者往往只需少量例子、一次简短讨论，或有限的直接经验，就能学到很多东西。如果 AI 要更深地参与科学工作，它就必须更接近这种在线学习模式：不是只依赖缓慢的训练周期，而是在真实任务进行中持续吸收新的工具、概念、反馈和领域实践。

这项能力之所以重要，不只是因为它会让 AI 更强，也因为它是思想多样性的必要条件。创造性的科学工作并不只依赖能力本身，它同样依赖研究者之间在视角、兴趣与品味上的差异。以物理学为例，世界上有数以万计的研究者，他们对哪些问题更重要、哪些方法更有前景、哪些反常现象值得追踪，都有各自不同的直觉。当新的发现机会出现时，作出关键突破的人，往往不仅是能力更强的人，也常常是兴趣和学术品味碰巧在正确方向上的人。因此，一个科研共同体要维持持续的原创发现，就必须拥有足够的思想多样性。

当前的 AI 模型显然还缺乏这种多样性[31][32]。虽然我们可以通过提示词让它们表现出不同“人格”，但它们对同一个问题的判断往往仍然高度相似。如果没有持续且多样化学习的机制，AI 系统就会倾向于重复训练数据中已经占主导地位的模式，而这会使真正有创造性的工作变得困难。因此，在线学习不只是一个技术上的改进，它是 AI 能否成为科学发现中真正合作者的核心前提。一个有趣的开放问题是：要让 AI 获得有意义的多样性，是否需要全新的体系结构，还是只要把上下文学习（in-context learning）做得足够强就已经足够。

源济 · 发表于 2026-4-28 05:34 PM

03

总结

本文的核心论点是，AI 革命的根本意义并不只是自动化，也不只是信息检索速度的提高，而是信息动力学本身发生了更深层的变化。在更早的历史阶段，每一次重大转变都对应着新的复杂信息载体的出现：首先是生命中的 DNA 与 RNA，后来是人类文明中的语言。而当下的 AI 革命，则标志着又一次类似的转变。人类历史上第一次，复杂信息处理不再局限于人脑。更重要的是，大语言模型开始使人类 know-how，而不仅仅是显性知识，变得越来越可复制、可共享。这正是 AI 带来新生产力最深层的来源，也是它最终可能重塑人类文明结构的原因。

从这个角度看，AI for Science 之所以重要，并不只是因为科学是众多应用领域之一，而是因为科学创新方式的变化，对 AI 与科学本身都具有格外重要的意义。对科学而言，AI 的关键承诺在于：它可能降低 know-how 传递的成本、加速协作，并最终改变新思想是如何被生成、检验和传播的。对 AI 而言，科学又是最具挑战性的环境之一，因而能够推动AI作出最重要的进步。科学研究会把 AI 暴露在前沿问题、专门工具、真实反馈和开放式合作之中。从这个意义上说，AI for Science 不只是 AI 的一个应用方向，它也是发展更强 AI 的必由之路。

正如本文所论证的，AI for Science 的路线图是渐进的。它首先要求 AI 能够接入科研工具，从而从聊天界面走入科研的真实工作流。接着，它会经过常规与重复性工作的自动化阶段，在减轻人类研究者负担的同时积累实践经验。在此基础上，AI 最终可能跨过从工具到合作者的门槛，做出可与人类学生或共同作者相比的贡献。再往后，AI 可能帮助形成新的跨学科合作形式，并最终改变科学工作被发表和评价的方式。我把这种逐步加深的参与过程称为科学研究的智能体化。

这一过程最重要的后果之一，就是智能体化出版的可能性。如果 AI 真正成为科研中的合作者，那么科研出版从静态论文演化为可交互科研智能体，就是一个自然的发展方向。这样的智能体能够保留更多当前在传统出版中被丢失的推理过程、中间判断、方法细节和实践 know-how；它也能够让不同受众更容易理解科研结果，加速后续工作，甚至支持不同成果之间新的智能体对智能体探索。因此，智能体化出版不只是影响出版业本身。它还与科学传播机制、学术体系以及科研奖励结构的未来都紧密相连。

与此同时，本文也强调，AI for Science 的未来并不只取决于AI的能力本身。真正的科学创造力有一个根本要求，那就是思想多样性。在人类科研共同体中，学术成就不仅依赖知识和技能，也依赖视角、兴趣、品味与判断上的差异。这些差异之所以重要，是因为它们让共同体能够同时探索多个方向，并识别那些原本会被忽略的机会。当前 AI 系统仍然缺乏这种多样性。如果它们不能从不同语境和不同共同体中持续学习，就会倾向于重复训练数据中既有的主导模式。因此，在线学习以及保持思想多样性的机制，对于 AI 能否成为原创科学发现中真正合作者而言是一个核心问题。

总而言之，AI for Science 应当被理解为一个既关乎科学、也关乎文明形态的工程。它的目标并不只是让现有科研更快，而是建立一种新的范式，让人类研究者与 AI 智能体共同参与知识的生产、传递与评价。通往这一未来的道路将需要新的工具、新的评估框架、新的合作平台以及新的出版系统；它同样需要一个开放共同体，在真实工作中持续把人类经验教给 AI。如果这条道路能够成功，AI 最深远的影响，也许不只是改变我们知道什么，而是改变人类究竟如何创造新知识。

04

致谢

本文翻译自英文版[33]，总结了作者自 2023 年以来对 AI 革命的一些思考。相关想法的较早讨论可见作者此前的一篇文章[34]以及一些讲座[35][36]。本文较早的一个版本也曾发布在 https://ai4.science 论坛上[37]。作者感谢 Diane Greene、刘朝星、陆思锐、聂忱、许晓栋、颜丙海、严伯钧和尤亦庄围绕相关问题所进行的有益讨论。作者在润色本文时使用了大语言模型辅助（主要是通过 Codex 调用 GPT-5.4）。文中的插图由Gemini网站生成。

感谢 Diane Greene、刘朝星、陆思锐、聂忱、许晓栋、颜丙海、严伯钧、尤亦庄和Barbara Zhang围绕相关问题所进行的有益讨论。

参考文献：

[1] Sébastien Bubeck, Christian Coester, Ronen Eldan, et al. Early science acceleration experiments with GPT-5, 2025. URL https://arxiv.org/abs/2511.16072.

[2] Andres M. Bran, Sam Cox, Oliver Schilter, et al. Augmenting large language models with chemistry tools. Nature Machine Intelligence, 6(5):525–535, 2024. DOI: 10.1038/s42256-024-00832-8. URL https://doi.org/10.1038/s42256-024-00832-8.

[3] Zifeng Wang, Lang Cao, Benjamin Danek, et al. Accelerating clinical evidence synthesis with large language models. npj Digital Medicine, 8:509, 2025. DOI: 10.1038/s41746-025-01840-7. URL https://doi.org/10.1038/s41746-025-01840-7.

[4] Michael Y. Li, Emily B. Fox, and Noah D. Goodman. Automated statistical model discovery with language models, 2024. URL https://arxiv.org/abs/2402.17879.

[5] Alfredo Guevara, Alexandru Lupsasca, David Skinner, et al. Single-minus graviton tree amplitudes are nonzero, 2026. URL https://cdn.openai.com/pdf/graviton.pdf. OpenAI preprint PDF.

[6] Michael P. Brenner, Vincent Cohen-Addad, and David Woodruff. Solving an open problem in theoretical physics using AI-assisted discovery, 2026. URL https://arxiv.org/abs/2603.04735.

[7] Sirui Lu, Zhijing Jin, Terry Jingchen Zhang, et al. Can theoretical physics research benefit from language agents?, 2025. URL https://arxiv.org/abs/2506.06214.

[8] Samuel Schmidgall, Yusheng Su, Ze Wang, et al. Agent laboratory: Using LLM agents as research assistants. In Findings of the Association for Computational Linguistics: EMNLP 2025, 2025. URL https://aclanthology.org/2025.findings-emnlp.320/.

[9] Erzhuo Shao, Yifang Wang, Yifan Qian, et al. SciSciGPT: Advancing human-AI collaboration in the science of science. Nature Computational Science, 2025. DOI: 10.1038/s43588-025-00906-6. URL https://doi.org/10.1038/s43588-025-00906-6.

[10] Yi Zhou. From paper to program: A multi-stage LLM-assisted workflow for accelerating quantum many-body algorithm development, 2026. URL https://arxiv.org/abs/2604.04089.

[11] Ken Deng, Xiangfei Wang, Guijing Duan, et al. Towards verifiable and self-correcting AI physicists for quantum many-body simulations, 2026. URL https://arxiv.org/abs/2604.00149.

[12] Jiaxuan Liu, Tiannian Zhu, Caiyuan Ye, et al. VASPilot: MCP-facilitated multi-agent intelligence for autonomous VASP simulations, 2025. URL https://arxiv.org/abs/2508.07035.

[13] Tiannian Zhu, Zhong Fang, Quansheng Wu, and Hongming Weng. Materialsgalaxy: A platform fusing experimental and theoretical data in condensed matter physics. Chinese Physics B, 34(12):120702, 2025.

[14] Juraj Gottweis, Wei-Hung Weng, Alexander Daryin, Tao Tu, Anil Palepu, Petar Sirkovic, et al. Towards an AI co-scientist, 2025. URL https://arxiv.org/abs/2502.18864.

[15] Linfeng Zhang, Siheng Chen, Yuzhu Cai, et al. Bohrium + SciMaster: Building the infrastructure and ecosystem for agentic science at scale, 2025. URL https://arxiv.org/abs/2512.20469.

[16] Jingyi Chai, Shuo Tang, Rui Ye, Yuwen Du, Xinyu Zhu, Mengcheng Zhou, Yanfeng Wang, Yuzhi Zhang, Linfeng Zhang, Siheng Chen, et al. Scimaster: Towards general-purpose scientific ai agents, part i. x-master as foundation: Can we lead on humanity’s last exam? arXiv preprint arXiv:2507.05241, 2025.

[17] Chris Lu, Cong Lu, Robert Tjarko Lange, et al. The AI scientist: Towards fully automated open-ended scientific discovery, 2024. URL https://arxiv.org/abs/2408.06292.

[18] Federico Bianchi, Owen Queen, Nitya Thakkar, Eric Sun, James Zou, et al. Exploring the use of AI authors and reviewers at Agents4Science. Nature Biotechnology, 44:11–14, 2026. DOI: 10.1038/s41587-025-02963-8. URL https://doi.org/10.1038/s41587-025-02963-8.

[19] Riccardo Bertolo and Alessandro Antonelli. Generative AI in scientific publishing: Disruptive or destructive? Nature Reviews Urology, 21:1–2, 2024. DOI: 10.1038/s41585-023-00836-w. URL https://doi.org/10.1038/s41585-023-00836-w.

[20] Keigo Kusumegi, Xinyu Yang, Paul Ginsparg, et al. Scientific production in the era of large language models. Science, 390(6779):1240–1243, 2025. DOI: 10.1126/science.adw3000. URL https://doi.org/10.1126/science.adw3000.

[21] Weixin Liang, Yaohui Zhang, Zhengxuan Wu, et al. Quantifying large language model usage in scientific papers. Nature Human Behaviour, 9:2599–2609, 2025. DOI: 10.1038/s41562-025-02273-8. URL https://doi.org/10.1038/s41562-025-02273-8.

[22] Anthropic. Model context protocol, 2024. URL https://modelcontextprotocol.io/docs/getting-started/intro.

[23] Anthropic. Agent skills protocol, 2025. URL https://agentskills.io/home.

[24] Hao Cui, Zahra Shamsi, Gowoon Cheon, et al. CURIE: Evaluating LLMs on multitask scientific long context understanding and reasoning, 2025. URL https://arxiv.org/abs/2503.13517.

[25] Haining Pan, James V. Roggeveen, Erez Berg, et al. CMT-benchmark: A benchmark for condensed matter theory built by expert researchers, 2025. URL https://arxiv.org/abs/2510.05228.

[26] Haoyu Guo, Maria Tikhanovskaya, Paul Raccuglia, et al. Expert evaluation of LLM world models: A high-superconductivity case study, 2025. URL https://arxiv.org/abs/2511.03782.

[27] Yanzhen Wang, Yiyang Jiang, Diana Golovanova, Kamal Das, Hyeonhu Bae, Yufei Zhao, Huu-Thong Le, Abhinava Chatterjee, Yunzhe Liu, Chao-Xing Liu, et al. Qmbench: A research level benchmark for quantum materials research. arXiv preprint arXiv:2512.19753, 2025.

[28] Weida Wang, Dongchen Huang, Jiatong Li, Tengchao Yang, Ziyang Zheng, Di Zhang, Dong Han, Benteng Chen, Binzhao Luo, Zhiyu Liu, et al. Cmphysbench: A benchmark for evaluating large language models in condensed matter physics. arXiv preprint arXiv:2508.18124, 2025.

[29] Ken Deng, Xiangfei Wang, Guijing Duan, Chen Mo, Junkun Huang, Runqing Zhang, Ling Qian, Zhiguo Huang, Jize Han, and Di Luo. Towards verifiable and self-correcting ai physicists for quantum many-body simulations. arXiv preprint arXiv:2604.00149, 2026.

[30] Tongtong Wu, Linhao Luo, Yuan-Fang Li, et al. Continual learning for large language models: A survey, 2024. URL https://arxiv.org/abs/2402.01364.

[31] Dawei Wang, Difang Huang, Haipeng Shen, and Brian Uzzi. A large-scale comparison of divergent creativity in humans and large language models. Nature Human Behaviour, 2025. DOI: 10.1038/s41562-025-02331-1. URL https://doi.org/10.1038/s41562-025-02331-1.

[32] Qianyue Hao, Fengli Xu, Yong Li, James Evans, et al. Artificial intelligence tools expand scientists’ impact but contract science’s focus. Nature, 649:1237–1243, 2026. DOI: 10.1038/s41586-025-09922-y. URL https://doi.org/10.1038/s41586-025-09922-y.

[33] Xiao-Liang Qi. The agentification of scientific research: A physicist’s perspective, 2026. URL https://arxiv.org/abs/2604.14718.

[34] Xiao-Liang Qi. Time, information and artificial intelligence. Physics, 2024. DOI: 10.7693/wl20240601. URL https://wuli.iphy.ac.cn/cn/article/doi/10.7693/wl20240601. Chinese article; page title also gives the English title “Time, information and artificial intelligence”.

[35] Xiao-Liang Qi. Teaching and mentoring the ai scientists, April 2025. URL https://pirsa.org/25040066. PIRSA:25040066.

[36] Xiao-Liang Qi. Teaching and mentoring the ai scientists. YouTube video, October 2025. URL https://www.youtube.com/watch?v=vYkYT1aBlVo. Title inferred from the corresponding PIRSA lecture link supplied by the author.

[37] Xiao-Liang Qi. A brief perspective on the artificial intelligence revolution. ai4.science discussion forum post, January 2026. URL https://forum.ai4.science/t/a-br ... ence-revolution/65. Posted January 19, 2026.

		自动登录	找回密码
密码			注册

[驰骋职场] 一个物理学家眼中的 AI for Science

一个物理学家眼中的 AI for Science

浏览过的版块