谷歌发布新一代大模型Gemini 2.0,备战智能体时代
创始人
2024-12-13 06:21:05

来源:经济观察报

陈奇杰 任晓宁/文12月12日,谷歌推出大模型Gemini 2.0 ,谷歌CEO桑达尔·皮查伊(Sundar Pichai)称,这是谷歌为新智能体时代构建的下一代模型,也是谷歌迄今为止最强的大模型。

Gemini 2.0 Flash是谷歌此次发布的Gemini 2.0系列模型中的第一个模型。相比上一代模型Gemini 1.5 Flash,Gemini 2.0 Flash除了支持图片、视频和音频等多模态输入,还支持多模态输出,例如其可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。Gemini 2.0 Flash还可以原生调用谷歌搜索、代码执行以及第三方用户定义的函数等工具。

皮查伊表示,如果说Gemini 1.0的作用是整合和理解信息,那么Gemini 2.0能够做到让信息更加有用。

基于Gemini 2.0模型,谷歌能够构建新的AI智能体,从而离构建通用助手的愿景更进一步。智能体(Agent)是指能够感知环境并采取行动以实现特定目标的代理体,也被视为大模型落地的“最后一公里”。

过去一年里,谷歌持续开发了更多智能体模型。在发布Gemini 2.0的同时,谷歌也介绍了多个智能体。例如,Project Astra是通过多模态理解现实世界的智能体,它可以在多种语言和混合语言之间进行对话,能够理解不同口音和生僻单词,并以接近人类对话的延迟来理解语言。Project Astra最多可以记住长达10分钟的会话内容,并且可以回忆起过去与它进行的多轮对话,以便为用户提供更好的个性化服务。Project Astra还能使用谷歌搜索、谷歌地图等工具。 Project Astra被应用于谷歌的AI助手Gemini app以及智能眼镜等其他设备及产品中。

除此之外,谷歌还开发了可以帮助用户完成复杂任务的智能体、面向开发者的智能体,以及面向游戏和其他领域的智能体。

在Gemini 2.0发布当天,新加坡科研局资深科研工程师黄佳就体验了该模型,并将其与OpenAI最新发布的o1模型进行对比。他的测试方式是提供一系列参考文档,给出复杂逻辑,让大模型进行自主编程,并提供详细文案解释。

黄佳表示,在一般情况下,ChatGPT o1的逻辑推理还是更强。具体而言,两个模型都体现出了很强的分析推理能力,但ChatGPT o1可以接受的文档输入长度较长,Gemini 2.0会截断部分太长的参考文档;此外,ChatGPT o1给出的代码,质量较高,缺陷(bug)较少,ChatGPT o1的代码解释更详尽,更接近黄佳想要的写作风格,Gemini 2.0的解释文案较为简略。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

OpenAI已收购AI声音克隆... 来源:环球市场播报 两年前,OpenAI的技术团队发布博文,详述公司已借助顶尖人工智能技术研发出人...
海光信息:为“能源电力行业第一... 5月15日,由中国电力企业联合会大数据与人工智能分会举办的“能源电力行业第一届人工智能创新研发交流活...
浙江中达精密部件申请自润滑滑动... 国家知识产权局信息显示,浙江中达精密部件股份有限公司申请一项名为“一种自润滑滑动轴承”的专利,公开号...
“AI+”,这样赋能制造全流程 来源:滚动播报 (来源:新华日报) (视觉中国供图) □ 本报记者 付奇 李嘉豪 “‘AI+制造’将...
石化机械获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示石化机械(000852)新获得一项实用新型专利授权,专利名为“...
29个智能气象站启动业务试运行 本报北京5月15日电 (记者李红梅)记者从中国气象局获悉:北京密云等29个智能气象站已于近日启动业务...
违法违规收集使用个人信息!41... 1、未公开个人信息收集使用规则。涉及20款移动应用如下: 《享充充电》(微信小程序)、《小牛充充充电...
微信鸿蒙版App获8.0.17... IT之家 5 月 16 日消息,微信鸿蒙版 App 已在华为应用市场发布 8.0.17.38(839...
2026年国内高端小程序开发公... 2026年,小程序开发已彻底进入两极分化时代。一边是AI工具让“做个能跑的小程序”变得像写文档一样简...
网传“三大运营商即将免月租”,... 据央视新闻,最近,大家在各大社交平台都可能刷到过这样一条消息——三大运营商即将全面推出免月租、按量计...