“AI科学家”登场，科研自动化时代来了？

科研过程可以完全自动化吗？一个研究机器学习的国际团队正在勇闯“无人区”。

据《自然》网站近日报道，日本Sakana AI公司和加拿大、英国科学家携手，创建了一种基于大语言模型的“人工智能（AI）科学家”。从阅读文献到提出新假设，再到尝试各种解决方案并撰写论文，整个研究周期，“AI科学家”能一气呵成。

Sakana公司在其官网表示，这位科研“新星”是首个用于自动化科研和开放式发现的综合AI系统，标志着科学发现新时代的开始。尽管它展现出非凡的潜力，但目前并不完美，应警惕“AI科学家”被滥用的风险。

推进流程行云流水

AI技术不断进步，让科学家能借助一些模型来集思广益或编写代码。然而，这些模型仍然需要大量人工监督，或仅囿于执行特定任务。

那么，能否利用基础模型将整个科研过程自动化呢？包括加拿大不列颠哥伦比亚大学机器学习专家在内的团队，成功创建出首位“AI科学家”。

在想法生成阶段，该“AI科学家”基于一个起始模板，先进行“头脑风暴”，提出多个不同研究方向，并进行广泛搜索，以确保某些想法是新颖且有趣的；在实验迭代阶段，对于第一阶段提出的某个想法，“AI科学家”会先开展实验，然后生成图表可视化结果，并给每个图表添加注释；在论文写作阶段，它会模仿标准机器学习会议的风格，撰写出一份文字简练、内容丰富的论文，并自主查找相关论文进行引用；在自动化同行评审阶段，研究团队开发出一个自动化的“AI审稿人”，其评估生成论文的准确性堪与人类相媲美。评估结果和建议可用于改进该项目，实现持续的反馈循环，使“AI科学家”能够迭代改进其研究成果。

在最初的演示中，该“AI科学家”针对扩散模型、Transformer模型（一种用于处理语言数据的神经网络模型），以及AI“领悟”（grokking）等机器学习子领域进行了深入研究，总共生成了10篇论文，每篇论文的成本约15美元。

美国华盛顿大学计算社会科学家杰文·韦斯特表示，该“AI科学家”行云流水般完成了整个科研流程，令人印象深刻，有望加速科学发现的步伐。

功能远非尽善尽美

尽管这位“AI科学家”潜能巨大，但它远非尽善尽美。

Sakana AI公司指出，“AI科学家”目前还不具备视觉功能，因此无法修复论文中出现的图表问题。例如，它生成的图表有时无法读取，表格有时会超出页面范围，页面布局也并不美观。

此外，该“AI科学家”有时会出现想法正确但执行错误的情况，也会因比较不当而生成误导性的结果。在撰写论文和评估结论时，它还可能会犯严重错误。例如，它很难比较两个数字的大小，这是大语言模型的“通病”。为了部分解决这个问题，研究团队确保所有实验结果都可以重复，并存储了所有执行文件。

研究人员预计，未来多模态模型“加入战局”，将助该“AI科学家”一臂之力。

另外，该“AI科学家”只能开展机器学习领域的研究，且缺乏科研过程的关键部分：动手进行实验的能力。

艾伦人工智能研究所计算机科学家汤姆·霍普表示，目前该大语言模型“仍无法提出并制定新颖有用的科学方向”。劳伦斯伯克利国家实验室材料科学家赫布兰德·希德则认为，即使该系统在短期内无法完成更具创造性的工作，仍可将科研过程中一些重复性内容自动化。

Sakana AI也强调，此类系统能否提出真正的变革型想法仍未有定论。未来的“AI科学家”能否发明出像人工神经网络或信息论一样的概念也还是个未知数。

能力越强越需慎用

研究人员表示，为扩大该“AI科学家”的能力，让其能够研究更抽象的领域，如纯数学领域，可能需要调遣语言模型之外的其他技术。

例如，解决数学问题需要逻辑推理，而目前大多数AI模型都不擅长逻辑推理。鉴于此，谷歌深度思维公司开发出AlphaGeometr，将语言模型与符号引擎（使用符号和逻辑规则进行推理）相结合，构建出一种神经—符号混合系统。在今年的奥林匹克数学竞赛中，升级后的AlphaGeometry2在19秒内就解答出一道题，令人类选手望尘莫及。

研究人员坚信，目前的迭代只是个开始。“AI科学家”就像AI科研自动化领域的GPT-1。随着不断迭代，它将如目前的GPT-4一样，引发新的科研革命。

不过，与许多新技术一样，“AI科学家”也打开了“潘多拉魔盒”，甚至可能被滥用。

譬如，“AI 科学家”能自动创建论文并提交，这将显著增加审稿人的工作量，可能阻碍科学质量控制，并给学术进步带来压力。而且，“AI科学家”还可能被用来制造危险的病毒，给人类社会带来潜在危害。

(责编：王震、陈键)

相关推荐