AIPress.com.cn报道
1月29日消息,平头哥在官网更新了其新一代AI训推一体芯片“真武810E”的产品信息。该芯片面向大模型训练与推理场景,采用自研并行计算架构与片间互联技术,并已在阿里云实现规模化部署。
在硬件层面,真武810E采用HBM2e高带宽内存,单卡内存容量最高可达 96GB,并通过PCIe5.0x16与主机系统连接。芯片配备7个独立的ICN(Inter-Chip-Network)片间互联端口,片间互联带宽最高可达700GB/s,用于支持多卡协同计算和大规模集群部署。
平头哥方面介绍,ICN为其自研片间互联技术,具备高带宽、低延迟特性,主要用于大模型训练与推理中的多卡通信需求。结合自研互联加速库,真武810E可支持多卡组合运行,在集群规模扩大时保持较高的线性加速效率。
在软件层面,真武810E配套平头哥自研AI软件栈,提供统一的编程接口和完整工具链,覆盖编译、运行与调优等环节。该软件栈兼容主流 AI 编程环境和框架,支持在不修改应用代码的情况下完成迁移部署,同时为用户提供源代码级编译能力,支持自主扩展和二次开发。
官方信息显示,真武810E已在阿里云环境中完成多个万卡规模集群部署,并用于对外提供算力服务,系统运行稳定性已通过实际业务验证。
在应用层面,真武810E主要面向自动驾驶、AI训练、AI推理及多模态模型等场景。官方介绍,在自动驾驶领域,该芯片支持从数据生成、模型训练到云端仿真的全流程计算需求,兼容超过50个常见自动驾驶模型,具备较强的模型泛化能力,可在无需特殊适配的情况下完成部署。
在AI训练场景中,真武810E针对大模型参数规模扩大和多模态融合需求,通过自研片间互联与软件栈协同,缓解大规模训练中的通信瓶颈,支持主流模型、框架、算子库和操作系统,并提供多种开源加速库与编译工具。
在推理方面,真武810E原生支持主流推理引擎,同时提供自研推理框架与算子库,支持多种模型结构和量化方式。结合大容量内存与弹性算力配置,可用于构建面向不同业务需求的推理平台。
在多模态应用中,真武810E结合AI算力与硬件级视频编解码能力,已在文生视频、图文生视频及图文生成等场景中完成测试验证,并支持包括通义万相在内的多模态模型应用。
目前,真武810E已通过阿里云向智能驾驶、互联网及消费电子等行业客户提供 AI 训练与推理算力服务。
1月22日,有消息称平头哥将拆分独立上市。