关系经济人类预测化学自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

对手来了!亚马逊生成式AI比GPT3。5更好

8月24日 艮山观投稿
  作者NIVASHJEEVANANDAM译者禾木木
  出品CSDN(ID:CSDNnews)
  技术圈很久都没有这么热闹了,要问大家当下都在热聊什么,非ChatGPT莫属了,一举成为StableDiffusion之外的AI新宠。
  网友也特别乐于调戏它,还生成出了不少奇怪的神回复。
  OpenAI在两个多月前向公众推出了ChatGPT,立即将AI驱动的聊天机器人推到了主流讨论中心,人们都在讨论它如何改变商业、教育等领域。
  近日,在ScienceQA基准测试中,研究人员表明:亚马逊的新语言模型比GPT3。5高出16个百分点(75。17),甚至超过了许多人类。
  注:ScienceQA基准测试是一组带有注释答案的大型多模态科学问题集。它有超过21,000道多模态选择题(MCQs)。
  技术的进步使大型语言模型(LLMs)能够很好地完成复杂推理的任务。这是通过思维链(CoT)的提示来实现的,思维链是发展中间步骤的意义,以显示如何做某事的过程。
  但目前大多数关于CoT的工作只关注语言模式,研究人员经常使用多模态CoT范式来寻找多模态CoT推理。而多模态更依赖于视觉和语言等多种输入。
  它是如何工作?
  多模态CoT将多个步骤的问题分解为中间推理过程,即使输入来自语言和视觉等不同模态,从而都能得出最终答案。
  进行多模态CoT最常见的方法之一是在要求LLM做CoT之前,将来自多种模态的信息合并为单一的模态。
  但这种方法有一些问题,其中之一是将数据从一种格式转移到另一种格式时,会丢失很多信息。通过结合语言和视觉的不同方面,微调小型语言模型也可以在多模态中进行CoT推理。
  然而,这种方法的主要问题是,这些语言模型有产生幻觉的推理模式的倾向,大大影响了答案推理。
  亚马逊的研究人员提出了MultimodalCoT,它将视觉特征结合在一个单独的训练框架中,以减少这些错误的影响。该框架将推理过程分为两部分:寻找原因和找出答案。该模型通过将视觉纳入两个阶段,提出了更有说服力的论点。此外,它还有助于对答案得出更准确的结论。这是第一个研究CoT推理工作方式不同的同类作品。在ScienceQA基准测试中,亚马逊研究人员提供的这项技术展示了最先进的性能,比GPT3。5精度高出16个百分点,超过了人类的表现。
  它的表现如何?
  多模态答案CoT的推理和推理生成阶段都使用相同的模型架构,但在输入和输出上有所不同。例如,在视觉语言模型的基本原理生成阶段,模型从视觉和语言领域获得数据。然后,一旦做出了基本原理,就会将其添加到答案推理步骤中的初始语言输入中,以便为下一阶段的语言输入。
  简单地说,该语言的文本被放入Transformer编码器中以形成文本表示。然后,将这些文本和视觉表示放在一起,并输入Transformer解码器。
  评价
  为了了解他们的方法如何运作,研究人员对ScienceQA进行了许多测试。得出结论,他们的方法在基准测试上比之前最先进的GPT3。5模型高出16。
  简而言之,亚马逊的研究人员通过提出一个将视觉和语言表示与运行MultimodalCoT相结合的两阶段框架,研究并解决了激发多模态CoT推理的问题。
  因此,该模型提供了实际的理由来帮助找出最终的答案。
  结论
  亚马逊的研究人员在他们的研究中证明,使用视觉特征有助于开发更有效的推理,这有助于更准确的答案推理。
  使用多模态CoT,他们证明了1B模型在ScienceQA基准测试中的表现比GPT3。5要高出16。他们的错误分析表明,在未来的研究中,有可能利用更有效的视觉特征,注入常识性信息,并应用过滤过程来改善CoT推理。
  目前,行业巨头们已经逐渐在研究建立一个聊天机器人发展的标准,亚马逊现在也加入了这场竞争中。无论是国内外,这场竞争无疑将引领聊天机器人最佳解决方案和产品的发展方向,让我们拭目以待未来会有哪些精彩的事情。
  参考链接:
  https:www。moneycontrol。comnewstechnologychatgptcompetitorsamazonjumpsintofraywithgenerativeaibetterthangpt3510063651。htmlamp
投诉 评论 转载

古时候太后讨厌华妃吗为什么华妃一走太后便点檀香去说到古时候的华妃小编相信很多人都是知道的,华妃是中国古代非常著名的一位皇帝。在当时的朝廷上还是有很大的地位的,看过甄嬛传的小伙伴应该都知道,当时的华妃非常坏,简直是深恶痛绝,不……洞里造句用洞里造句大全六十一、常常感到困惑,象石头卡在凹洞里,进退两难!六十二、用一秒的距离换一刻的清醒,把爱的证据藏进黑洞里,你一句不爱你说得多么流利,我委屈却只可以无声的抗议。戴佩妮……为什么晚上在酒店睡觉时最好将厕所灯打开?很多人在外出差或者是旅游的时候都会住酒店,而对于酒店的卫生,环境,价格也有一定的要求,但是为什么晚上在酒店睡觉时,很多人都将厕所灯打开?为什么晚上要将厕所灯打开?0……对手来了!亚马逊生成式AI比GPT3。5更好作者NIVASHJEEVANANDAM译者禾木木出品CSDN(ID:CSDNnews)技术圈很久都没有这么热闹了,要问大家当下都在热聊什么,非ChatGPT莫属了,……远离喧嚣!盘点北京8个童话小镇,带你走入宫崎骏的童话世界春天的北京,繁花似锦,但除了看花和名胜古迹之外当然也有远离喧嚣的童话小镇那里没有拥挤的人群没有耸立的高楼只有如诗如画的房子和异域风情带上这份……简便造句用简便造句大全91,强力粘胶,超强引诱,简便易行,安全卫生,为理想的捕蝇用具。92,通用型阳光板广泛用于各种建筑和装潢需求,可双面抗紫外线,安装简便。93,该测量仪结构简单,操作……雪是一位高超的艺术大师,它能让大地在一夜之间绘成一片白茫茫,好似置身于童话世界!到了冬天一直都期盼着可以看见一场大雪,也许是因为雪是白色的吧!在微暗的暮色中,一片片从天而……如何促进低碳经济发展我国低碳经济发展起步较晚,总体水平与发达国家相比仍有相当的差距,那么如何促进低碳经济发展呢?下面带您了解一下。我国促进低碳经济发展的办法1。要以立法先行,法律体系有……妈妈的荷花头像上新啦大家对妈妈辈的头像一定都不陌生,包括一些带着花朵的表情,一发出来年纪感就爆棚。最近有一个江苏省淮安市盱眙县拍到了一组绿色的荷花,据介绍,这种绿色的荷花叫做金陵凝萃,是荷花……活成期待的样子听着别人的故事留着自己眼泪。从什么时候开始,每天的挣扎和治愈成了日常。你过得还好吗?有没有活成自己想要的样子。每个人都有痛苦的时候,有烦恼的时候,有快乐也有挣扎,所有的坏……头晕眼花,手脚发麻?那是因为血虚惹的祸你是否因为工作繁多而造成饮食不规律或者劳倦过度?有没有受过外伤而造成失血过多或是久病不愈所致,而导致面色发白或萎靡发黄,头晕眼花,时常感到心慌,睡觉的时候经常做梦,手脚或有发麻……星座女怎样让帅哥臣服于自己男女平等的时代,男生追求女生很平常,同样女生追求男生也很普遍。女生追求帅哥更是一个焦点。如何追帅哥,怎么样才能追到手更是个棘手的问题。十二星座的女孩追求帅哥所用的方法策略也不尽……
没有美颜和滤镜古代女人如何使自己变美男生懒散凌乱的发型带点乱更时尚帅气雾霾天行车安全距离化学品造句用化学品造句大全面对组织变革应该是什么角色iPhone的印度制造时代即将开始了吗?天天喝电热水壶烧的水,会给身体带来影响吗?建议了解一下古代四大美男复原图竟然这么帅影像媲美小单反,3款目前拍照好的手机,出行旅游必备分享创建动态IP池的做法到底吃什么减肥产品不反弹为什么丈夫总是记不住我的生日
安全合同早泄衡量标准到底是怎样的小米平板5Pro是2K屏吗屏幕分辩率是多少冰毒的成分是什么宝宝学走路的方法和安全措施夏之韵经验之谈如何才能快速提升女人爱爱时的性高潮《请尊重一个姑娘的努力》读书笔记关于对家装设计费的一些看法老年代步车应该禁行吗?老年代步车有哪些安全隐患?老爸彪车记六年级作文500字

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州