大模型专题:提升大模型知识密度,做高效的终端智能
创始人
2024-11-05 20:41:11

今天分享的是:大模型专题:提升大模型知识密度,做高效的终端智能

报告共计:35页

《提升大模型知识密度,做高效的终端智能》由面壁智能CEO&联合创始人李大海在AiCon全球人工智能开发与应用大会上发表。报告介绍了面壁智能在大模型领域的发展成果和技术探索。面壁智能自2019年成立以来发布了多款大模型,包括2024年2月发布的旗舰级端侧模型MiniCPM - 2B超越GPT - 3.5,4月发布MiniCPM 2.0版本等。其发展见证了大模型规模法则,即在大数据和大算力支持下,模型越大智能水平越强,但也探讨了大模型是否只是追求越大越好以及可持续发展之路的问题。报告提出大模型高效的第一性原理是参与计算的知识密度 = 模型能力 / 模型参数,随着数据、算力、算法协同发展,模型知识密度持续增强,如过去四年平均每8个月翻一倍。面壁智能通过构建模型风洞,在小模型上寻找最优数据和超参配置并外推至大模型,摆脱“炼丹”窘境,例如MiniCPM系列以小博大,超越诸多明星模型。该系列包括多种型号,如MiniCPM - 2.4B具有极致以小博大和高效低成本的特点,MiniCPM - V多模态模型在长文本与MoE模型、实时视频和多图联合理解等方面表现出色。同时,报告还提到了端侧算力因芯片制程增强,与模型制程带来的知识密度增强交汇,揭示端侧智能潜力,且面壁智能在解决中文领域多模态数据挑战等方面也有成果,还强调了端侧市场势能强劲,智能终端年出货量巨大,亟待激活端侧算力。

以下为报告节选内容

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

依托“大计算”核心主业 打造“... 来源:人民邮电报 2026年政府工作报告提出,实施超大规模智算集群、算电协同等新基建工程,加强...
哥伦比亚RETIE认证:电气装... 想要将电气装置、太阳能组件、配电设备等顺利出口到哥伦比亚,RETIE认证是产品合法清关和销售的“强制...
一个全是 AI 幻觉的网站,却... 当我们在维基百科搜索一个词条时,你期待的是真相,至少在AI时代,总得有一个地方能(大概率)给我点真东...
史上最大IPO,谁最躺赢? 今年科技IPO的热闹程度是空前的。 Cerebras刚刚在5月14日率先登场,发行价185美元,首日...
原创 华... 昨天我写文章提醒大家618要来了,评论区部分网友觉得还早,事实证明阿维对这种事情还是很有经验的,从昨...
校企联动|体育赋能影像,AI点... 5月14日下午,南京传媒学院摄影学院与杭州致禾文化传播有限公司战略合作协议签约仪式在南京传媒学院摄影...
达成意向订单超120亿元!龙华... 为抢抓2026年APEC中国年重大战略机遇,深圳市龙华区以“政企协同、‘五外联动’、全链出海”新模式...
空X上市&长鑫业绩爆炸 来源:市场资讯 (来源:塔子哥的随笔) 周末消息不少,这里简单几个: 长鑫刚刚公布了一季报,利润33...
史上最大IPO来袭!Space... 5月16日,SpaceX向股东发出内部邮件,宣布普通股“一拆五”的拆股方案已获批并生效,所有C类普通...
刚刚!日韩股市,直线跳水!霍尔... 日韩市场风云突变。 5月15日早间,日韩股市集体跳水、翻绿,截至北京时间8:40,韩国KOSPI指数...