今天分享的是:2025年机器语言大模型赋能软件自主可控与安全可信报告
报告共计:28页
《2025年机器语言大模型赋能软件自主可控与安全可信报告》指出,软件作为网络空间的基石,当前软件生态面临自主可控和安全可信两大难题。关键软件长期被国外主导,闭源软件供应链风险高,存在断供、安全及知识产权风险;同时,软件漏洞问题层出不穷,恶意代码急剧增长,安全隐患大。在软件开发与安全方面,分析和理解闭源软件是关键问题,面临二进制信息缺失和人在回路的挑战,难以恢复缺失信息,也难以对代码功能、安全和性能进行有效分析。针对这些问题,报告提出利用大语言模型的智能化解决方案。现有大语言模型难以分析二进制程序,而该方案基于Transformer架构,通过预训练、微调等方式,利用海量数据和多种关键技术优化模型。关键技术包括融合领域知识的模型优化,融入代码领域知识;基于对比学习的语义理解,使相似二进制代码embedding接近;基于多模态学习的语义理解,将语义空间与人类意图对齐。由此构建的机器语言大模型MLM,具备多平台、多场景、多能力的特点,语义理解超越人类专家水平,能高效辅助逆向分析,反汇编核心功能超越传统工具。在实际应用中,MLM可用于软件供应链分析、软件逆向分析、漏洞挖掘、软件版权保护等多个方面,能助力信创国产化、老旧软件升级迁移,解决采购痛点和破解取证难题,开创了软件分析新范式,为实现软件自主可控、安全可信提供了有力支持 。
以下为报告节选内容