华泰证券:DeepSeek有望加速模型训练与CUDA解耦
创始人
2025-02-21 13:21:30

2月21日消息,华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限,针对国产算力的优化或将有持续进展,值得重视。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

鹏辉能源全场景电池方案亮相CI... 上证报中国证券网讯(李子健 记者 周亮)在5月13日开幕的第十八届深圳国际电池技术交流会/展览会(C...
我国科学家提出人工细胞不对称分... 来源:市场资讯 (来源:海外网) 来源:央视新闻客户端 记者从中国科学院化学研究所获悉,近期该所乔燕...
新一批“科技副总”上岗!聚焦电... 5月14日,“科创天府·智汇蓉城”成都市“科技副总”选聘(电子信息与人工智能领域)专场活动举行。在蓉...
10大护肝排毒食物!轮流换着吃... 肝脏是人体重要的代谢与解毒器官,承担着分解毒素、合成营养、调节免疫等多重任务。一旦肝火偏旺或功能下降...
原创 A... A股“股王”出事了。 就在刚刚,源杰科技甩出一份公告,字少,事大—— 公司副总经理陈文君,因涉嫌刑事...
美股异动丨思科盘前大涨超19%... 全球最大网络设备制造商思科(CSCO.US)盘前大涨超19%,报121.47美元,开盘势将再创历史新...
今日金价拐点显现,下周行情或将... 5月14日的黄金市场走出了明显的拐点形态,多空双方力量在此消彼长中达到了短暂的平衡,这种蓄势待发的状...
收盘丨沪指跌1.52%,猪肉、... 5月14日,四大股指集体收跌,沪指跌1.52%,深证成指跌2.14%,创业板指跌2.16%,科创综指...
世纪互联盘中狂飙逾30%!宁德... 5月13日,世纪互联(VNET.US)宣布引入新的战略投资者,PJ Millennium I Lim...
国有大行首个要关停的信用卡AP... 来源:图虫 5月13日,中国银行信用卡公众号发布信息称,为进一步整合服务资源,优化线上金融服务体验,...