11月21日 消息:在疫情爆发最初的12个月里,有超过100,000篇关于新冠病毒论文发表,而这产生了大量新信息。
想要阅读和理解每一项研究是不可能的,而从理论上来说,Galactica可以做到。
Galactica 是由 Meta AI(前身为 Facebook 人工智能研究院)开发的AI语言大模型,旨在利用机器学习来“梳理科学信息”。自从上周在网上发布了一个演示版本以来,它引起了一些轰动,批评者认为它产生了伪科学,被夸大了,还没有准备好供公众使用。
该工具被定位为搜索引擎的一种进化,专门用于科学文献检索。Galactica 推出后,Meta AI 团队表示:它可以总结研究领域、解决数学问题并编写科学代码。
乍一看,这似乎是一种综合和传播科学知识的高效方式。现在,如果你想了解关于量子计算等领域的最新研究,您可能需要阅读 PubMed 或 arXiv 等科学文献库中的数百篇论文,但仍然只是触及皮毛。
或者,也许您可以用Galactica查询(例如,通过询问:什么是量子计算?),它可以过滤并以维基百科文章、文献综述或讲义的形式生成答案。
Meta AI 于11月15日发布了一个演示版本,以及一份描述该项目及其训练数据集的预印本。该论文称Galactica的训练集是“一个大型的人类科学知识语料库”,其中包括4800万篇论文、教科书、讲义、网站(如维基百科)等等。
不过Galactica一上线,用户就用各种强硬的科学问题质疑其功能。比如涉及幼儿园数学内容,它提供了错误百出的答案,错误地暗示一加二不等于3。
简单的说,原本Galactica应该帮助“梳理科学信息”,结果它反而散布了错误信息。
在发布后的48小时内,Meta AI 团队“暂停”了演示。人工智能背后的团队没有回应澄清导致暂停的原因的请求。