上线仅两天，AI大模型写论文网站光速下架不负责任的胡编乱造

11月27日眉梢欢投稿

　　机器之心报道
　　编辑：陈萍、小舟
　　Galactica：假装自己是个科学家。
　　几天前，MetaAI联合PaperswithCode发布了大型语言模型Galactica，该模型的一大特点就是解放你的双手，代笔帮你写论文，写的论文有多完整呢？摘要、介绍、公式、参考文献等统统都有。
　　就像下面这样，Galactica生成的文本看起来就是一篇论文的配置：
　　不止生成论文，Galactica也可以生成词条的百科查询、对所提问题作出知识性的回答，除了文本生成外，Galactica还可以执行涉及化学公式和蛋白质序列的多模态任务。例如在化学反应中，要求Galactica在化学方程LaTeX中预测反应的产物，模型仅根据反应物就能进行推理，结果如下：
　　为了方便用户体验这项研究，该团队还专门上线了试用版。如下图，几天前该界面还显示输入、生成等功能。
　　（之前版本）Galactica试用版地址：https：galactica。org
　　短短几天，它的界面变成这样，已经不能进行输入。
　　根据PaperswithCode说法，他们从社区收到一些反馈，已经暂停Galactica的Demo演示功能。前两天还在推特发文称赞的图灵奖得主YannLeCun，今天就很无奈的说了一句，再也不能从中获得快乐了，开心吗？
　　不过与极力推崇该研究的人相比，有网友提出一些反对意见，与其带来的好处相比，Galactica会带来更多负面后果，想想这对学生写论文会有什么影响。
　　与学生用它来写论文相比，下面这位网友发现的问题就更严重了。
　　我问了Galactica一些问题，它的回答都是错误或有偏见的，但听起来是正确和权威的。在一系列实验后，推特用户MichaelBlack表示：Galactica生成的文本合乎语法，让人感觉真实。其所生成的文章会变成真正的科学论文。这篇文章可能是正确的，但也可能是错误的或有偏见的，很难被发现，从而影响人们的思维方式。
　　它提供了听起来是权威的科学，但没有科学方法的基础。Galactica根据科学写作的统计特性产生伪科学，很难区分真假。这可能会开启一个深度科学造假的时代。这些被生成的论文将被其他人在真实的论文中引用。这将会是一团乱麻。我赞赏这个项目的初衷，但提醒大家还是要注意，这不是科学的加速器，甚至也不是科学写作的有用工具。这对科学来说是潜在的扭曲和危险。
　　MichaelBlack回答部分截图。链接：https：twitter。comMichaelJBlackstatus1593133722316189696
　　发现Galactica存在不严谨、生成伪科学文章等问题的不止MichaelBlack，其他网友也发现了该缺陷。下面我们来看看网友的其他评论。
　　引起争议
　　Galactica试用版上线后，很多学者却对此提出了疑义。
　　一位名叫DavidChapman的AI学者指出语言模型应该是整理合成语言的，而不是生成知识：
　　这确实是一个非常值得思考的问题，如果AI模型能生成知识，那么如何判断这些知识的正确与否呢？它们又会如何影响甚至误导人类呢？
　　DavidChapman用自己的一篇论文为例说明了这个问题的严重性。Galactica模型提取了论文中Alogicalfarce部分的关键术语，然后使用一些相关的维基百科文章，最后编辑合成出一篇错漏百出的文章。
　　由于Galactica模型的试用版已下架，我们无法查看这篇文章与论文原意的差距有多大。但可以想象，初学者如果阅读了Galactica模型合成的这篇文章，可能会被严重误导。
　　知名AI学者、Robust。AI创始人GaryMarcus也对Galactica模型表达了强烈的质疑：大型语言模型（LLM）混淆数学和科学知识有点可怕。高中生可能会喜欢它，并用它来愚弄他们的老师。这应该令我们感到担忧。
　　来自纽约大学计算机科学系的学者们也测试了Galactica模型的生成结果，发现Galactica答非所问：
　　图源：https：cs。nyu。edudavisepapersExperimentWithGalactica。html
　　首先，在这个实验中，Galactica模型的回答的确包含一些正确的信息，例如：引力探测器B（GPB）确实是NASA发射的科学探测卫星，用于检验广义相对论的正确性和参考系拖拽效应。LeonardSchiff确实是提出该实验的物理学家，FrancisEveritt是该项目的负责人（PI）。引力探测器A确实是对爱因斯坦理论的早期检验。
　　然而，纽约大学学者提出的问题是：与确定引力常数的实验相关的维基百科文章，而Galactica模型回答的是与检验广义相对论有关的实验的百科信息。这从根本上就出现了错误。
　　不仅如此，Galactica模型的回答中还有一些细节出现了事实性错误：Galactica回答中强调不要混淆GPB与引力探测器（GravityProbeB）的实验，但实际上GPB就是指引力探测器B的实验。回答中提到的LeonardSchiff于1937年在麻省理工学院获得博士学位。他曾多次在宾夕法尼亚大学和斯坦福大学任教，但从未在马里兰大学任教。而FrancisEveritt是在1959年于帝国理工学院获得博士学位的。引力探测器A（GravityProbeA在1966年并没有因为预算削减而被取消，也与陀螺仪（gyroscope）没有任何关系。实际上，引力探测器A于1976年发射，实验涉及微波激射器（maser）。
　　纽约大学的这项实验非常具体明确地说明了Galactica模型的生成结果存在严重的错误，并且该研究进行了多个不同问题的实验，每一次Galactica的回答都是错漏百出的。这说明Galactica生成错误信息的情况绝非偶然。
　　纽约大学实验报告：https：cs。nyu。edudavisepapersExperimentWithGalactica。html
　　面对Galactica的失败，有网友将其归因于深度学习的局限性：深度学习的本质是从数据中学习，这本来就不同于人类的智能，根本无法实现通用人工智能（AGI）。
　　关于深度学习未来的发展众说纷纭。但毫无疑问的是，Galactica这种错误地生成知识的语言模型是不可取的。
　　对此，你有什么看法，欢迎在评论区留言。
　　参考链接：
　　https：twitter。comGaryMarcusstatus1593264844412977158？s20tGw8PrAYtku99TaubsHyw
　　https：twitter。compaperswithcodestatus1593259033787600896
　　https：garymarcus。substack。compafewwordsaboutbullshit？utmsourcetwittersdpf
　　https：cs。nyu。edudavisepapersExperimentWithGalactica。html
　　https：twitter。comMeaningnessstatus1592750932869013504？cxtHHwWgICjlZyiy5osAAAA

投诉评论转载

凑齐5名新星！李春江组建夺冠班底，给赵睿也不换，媲美广厦三少最近几年CBA竞争越来越激烈，虽然辽粤争霸成为主旋律，但其他球队对于冠军的欲望从没有降低过，尤其是北京、上海、浙江几个地方球队，本身有丰富的人才储备和雄厚的财力，急切的想填补广……固态电池商业化加速，续航逾千公里的电动车将猛攻燃油车又一家车企宣布将搭载固态电池，并推出续航1000公里的纯电汽车产品。近日，上汽集团宣布，将和清陶（昆山）能源发展股份有限公司（下称清陶能源）签约，成立上汽清陶固态电池联合……一发工资就转移，会有什么影响？银行职员影响会很大一发工资就转移，会有什么影响？银行职员：影响会很大！前几年，有很多年轻人喜欢把钱转支付宝，存在余额宝里。有些人还设置了自动转入，也就是说工资到账没多久，就会转入余额宝。今……两个人是不是真的相爱，断交两天就知道了01。沟通是维系一段感情的重要环节，可以促进相互了解，了解对方的想法。虽然沟通对于一段感情来说很重要，但并不意味着一段感情不能没有联系。相反，偶尔的断交更能体现两个人关系……让刷码支付更安全！支付宝上线付款码隐私保护功能，怎样设置？老支付环境更安全！刚刚，支付宝上线了付款码隐私保护功能！只要打开这个功能，即可隐藏付款码，更好的保护隐私安全。快跟着周到君看看怎么操作吧第一步，打开支付宝付款码……艾罗能源将科创板IPO上会，实控人著名高校本科学历改成中专【文观察者网邹煦晨编辑张广凯】浙江医科大学曾经是省内最好的医学类高校，受并校影响在1999年成为985高校浙江大学的医学院。而杭州医学院则是双非高校，校友会2022年版排……上线仅两天，AI大模型写论文网站光速下架不负责任的胡编乱造机器之心报道编辑：陈萍、小舟Galactica：假装自己是个科学家。几天前，MetaAI联合PaperswithCode发布了大型语言模型Galactica，……次轮得分效率值和正负值莫兰特前途无限量字母哥强势本文数据来源标注在图表标题下方，图表和内容均为安安小小姐姐原创，并开启全网保护，转载引用请联系作者。NBA次轮已经进到第6场，其中热火以4：2成功晋级东部决赛，其余6支球……黄瓜酸奶去角质面膜原材料黄瓜80g，酸奶80ml。面膜分析角质堆积也会让肌肤干燥不堪，并且不易上妆。黄瓜不仅具有强韧的补水能力，还能清除脸上多余脏污；酸奶的乳酸特性，则可以发挥……敢动北京冬奥？中方24小时打出三记绝杀，英澳加一个都别想逃距离北京冬奥会开幕还有不到两个月的时间，就在北京积极准备冬奥会事宜的时候，西方有些国家抵制北京冬奥会的声音愈演愈烈。美国将自己全球独一无二的号召力，在北京冬奥会一事上体现得淋漓……毕业设计谁的大学没有一个万年历（基础款分享）本次分享的毕设是一个难度系数比较低的51单片机时钟万年历。如果你是零基础的话，是非常适合入手的。如果作为毕设的话，部分院校应该比较难通过，但是在此基础上可以添加更多的功能，让作……华为P50Pro评测没有5G还敢卖旗舰价？它的表现到底值不值2021年智能手机市场格局再度洗牌，曾经的老大华为受客观环境影响市场份额一跌再跌，vivo异军突起登顶国内市场第一，在大家为新王登基欢呼时，华为并没有放弃智能手机业务。尽……

<<<<<<－>>>>>>

腾讯研究成果登Nature子刊scBERT攻克单细胞测序数据 Bally2022秋冬系列女士Ahres手袋手机畅销榜更新华为无缘榜单，苹果仅排第二，小米独揽第一第三倪萍太有品味了！大衣叠穿奶奶衫巧用丝巾打底，看似朴素却很高级科学家发现发现野火烟气与臭氧消耗之间的化学联系联想的启动资金是130万，为什么很多人看到的却是20万元？2023年3月，红米手机仅推荐三款，销量都很高骁龙8旗舰之战，谁才是真正的赢家？RedmiK60是否能够力延庆区受表彰代表把北京冬奥精神带回我的工作中拆解10家上市股份行三季报浦发民生渤海净利负增长人前大明星，人后撒谎精，这5位明星，你们对自己说的话不害臊吗神舟十四首次跨舱舱外作业，架的太空天桥做啥用？揭秘

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找