发布时间:2024-11-09 18:11:20 来源: sp20241109
科研过程可以完全自动化吗?一个研究机器学习的国际团队正在勇闯“无人区”。
据《自然》网站近日报道,日本Sakana AI公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并撰写论文,整个研究周期,“AI科学家”能一气呵成。
Sakana公司在其官网表示,这位科研“新星”是首个用于自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。
推进流程行云流水
AI技术不断进步,让科学家能借助一些模型来集思广益或编写代码。然而,这些模型仍然需要大量人工监督,或仅囿于执行特定任务。
那么,能否利用基础模型将整个科研过程自动化呢?包括加拿大不列颠哥伦比亚大学机器学习专家在内的团队,成功创建出首位“AI科学家”。
在想法生成阶段,该“AI科学家”基于一个起始模板,先进行“头脑风暴”,提出多个不同研究方向,并进行广泛搜索,以确保某些想法是新颖且有趣的;在实验迭代阶段,对于第一阶段提出的某个想法,“AI科学家”会先开展实验,然后生成图表可视化结果,并给每个图表添加注释;在论文写作阶段,它会模仿标准机器学习会议的风格,撰写出一份文字简练、内容丰富的论文,并自主查找相关论文进行引用;在自动化同行评审阶段,研究团队开发出一个自动化的“AI审稿人”,其评估生成论文的准确性堪与人类相媲美。评估结果和建议可用于改进该项目,实现持续的反馈循环,使“AI科学家”能够迭代改进其研究成果。
在最初的演示中,该“AI科学家”针对扩散模型、Transformer模型(一种用于处理语言数据的神经网络模型),以及AI“领悟”(grokking)等机器学习子领域进行了深入研究,总共生成了10篇论文,每篇论文的成本约15美元。
美国华盛顿大学计算社会科学家杰文·韦斯特表示,该“AI科学家”行云流水般完成了整个科研流程,令人印象深刻,有望加速科学发现的步伐。
功能远非尽善尽美
尽管这位“AI科学家”潜能巨大,但它远非尽善尽美。
Sakana AI公司指出,“AI科学家”目前还不具备视觉功能,因此无法修复论文中出现的图表问题。例如,它生成的图表有时无法读取,表格有时会超出页面范围,页面布局也并不美观。
此外,该“AI科学家”有时会出现想法正确但执行错误的情况,也会因比较不当而生成误导性的结果。在撰写论文和评估结论时,它还可能会犯严重错误。例如,它很难比较两个数字的大小,这是大语言模型的“通病”。为了部分解决这个问题,研究团队确保所有实验结果都可以重复,并存储了所有执行文件。
研究人员预计,未来多模态模型“加入战局”,将助该“AI科学家”一臂之力。
另外,该“AI科学家”只能开展机器学习领域的研究,且缺乏科研过程的关键部分:动手进行实验的能力。
艾伦人工智能研究所计算机科学家汤姆·霍普表示,目前该大语言模型“仍无法提出并制定新颖有用的科学方向”。劳伦斯伯克利国家实验室材料科学家赫布兰德·希德则认为,即使该系统在短期内无法完成更具创造性的工作,仍可将科研过程中一些重复性内容自动化。
Sakana AI也强调,此类系统能否提出真正的变革型想法仍未有定论。未来的“AI科学家”能否发明出像人工神经网络或信息论一样的概念也还是个未知数。
能力越强越需慎用
研究人员表示,为扩大该“AI科学家”的能力,让其能够研究更抽象的领域,如纯数学领域,可能需要调遣语言模型之外的其他技术。
例如,解决数学问题需要逻辑推理,而目前大多数AI模型都不擅长逻辑推理。鉴于此,谷歌深度思维公司开发出AlphaGeometr,将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合,构建出一种神经—符号混合系统。在今年的奥林匹克数学竞赛中,升级后的AlphaGeometry2在19秒内就解答出一道题,令人类选手望尘莫及。
研究人员坚信,目前的迭代只是个开始。“AI科学家”就像AI科研自动化领域的GPT-1。随着不断迭代,它将如目前的GPT-4一样,引发新的科研革命。
不过,与许多新技术一样,“AI科学家”也打开了“潘多拉魔盒”,甚至可能被滥用。
譬如,“AI 科学家”能自动创建论文并提交,这将显著增加审稿人的工作量,可能阻碍科学质量控制,并给学术进步带来压力。而且,“AI科学家”还可能被用来制造危险的病毒,给人类社会带来潜在危害。
(责编:王震、陈键)