在本周于汉堡举行的ISC大会上,NVIDIA推出了多款新软件,旨在加速科学领域的AI应用,涵盖化学、材料发现乃至暗物质探索等方向。
NVIDIA DAQIRI库、全新NVIDIA ALCHEMI NIM微服务,以及即将推出的NVIDIA cuPhoton参考代码,将原本需要在CPU上耗费数小时乃至数天才能完成的工作,转变为可实时运行的GPU加速计算流程。这些工具均隶属于NVIDIA CUDA-X工具与库集合,能够大幅提升AI与高性能计算等多个应用领域的性能表现。
性能提升幅度显著,实际影响深远。各学科科学家正借助AI与加速计算,以前所未有的速度从仪器和观测项目中获取数据与洞察。
cuPhoton:加速天文数据处理
cuPhoton运行在NVIDIA GB200 NVL72系统上,可对FITS文件(天文台与望远镜通用的天文数据格式)进行加载、读取、处理与分析。在早期访问测试中,cuPhoton将鲁宾天文台时空遗产巡天项目(LSST)所采集FITS图像的加载与读取速度提升了14,900倍;借助32块NVIDIA Grace Blackwell超级芯片,信号处理与分析速度最高提升8,400倍。
这意味着,科学家能够更快地从LSST相机获取洞察。LSST相机是迄今建造的最大数字相机,可拍摄数十亿个遥远星系及附近光线微弱天体的图像。
cuPhoton是一款面向科学家的参考代码,可从望远镜、X射线及激光实验所采集的多维数据中提取有效信息,支持加载、处理、分析和可视化PB级数据。普林斯顿大学与NVIDIA合作开发了cuPhoton,并将联合哈佛大学,将其用于处理与分析来自天文台和暗能量巡天项目的海量数据。
DAQIRI:实时流式处理探测器数据
NVIDIA DAQIRI(即"集成实时仪器数据采集")是一款高性能网络库,可将快速探测器和传感器产生的数据实时传输至NVIDIA软件。传统系统受限于固定硬件,当仪器产生数据的速度超过存储速度时往往会丢失数据,而DAQIRI能够实时处理数据流,有效避免这一问题。
由欧洲核子研究中心(CERN)、芝加哥大学和伦敦大学学院的科学家在CERN openlab框架下联合开发的A-GHOST项目,正是借助DAQIRI对ATLAS实验记录的碰撞数据进行实时AI分析。由于存储限制,ATLAS通常会丢弃超过99%的数据,而A-GHOST能够分析这些原本被丢弃的数据,从中捕捉可能被忽视的潜在信号。
ALCHEMI:加速化学与材料发现
NVIDIA ALCHEMI是一套面向特定领域的微服务集合及工具包,专为加速化学与材料发现而设计,应用场景涵盖电池材料、催化剂、OLED显示屏、美妆产品等多个领域。
今年3月,NVIDIA已发布两款ALCHEMI NIM微服务,分别用于批量几何结构弛豫(BGR)和批量分子动力学(BMD)。这两款AI加速工具支持研究人员同时模拟数百万种分子与材料:BGR用于寻找最稳定的结构,BMD用于模拟材料随时间变化的运动行为。
此外,ALCHEMI预计还将推出面向广泛使用的维也纳从头算模拟软件包(VASP)的微服务,助力研究人员以更高的GPU吞吐量运行材料模拟。通过利用NVIDIA多进程服务在单块GPU上运行多个VASP计算任务,该微服务可将几何优化速度提升3倍。
开发者与研究人员还可使用ALCHEMI工具包,加速训练机器学习原子间势等AI代理模型,并轻松构建定制化的高性能原子模拟工作流。
Lila Sciences的实践成果
加速效果叠加显著:ALCHEMI针对TensorNet的专用计算内核为Lila Sciences带来了6倍的训练与推理加速,内存占用降低3倍,使原本需要数周完成的模拟在数天内即可完成。
这一方案不再局限于每次运行单个实验,而是在GPU内存中同时评估多种材料,可广泛应用于以下场景:
材料发现——大规模筛选新型稳定材料组合
能源——发现可用于化学品和燃料生产的高活性、地球丰量催化剂
电磁学——理解并预测复杂磁学行为
此外,Lila Sciences还充分利用NVIDIA完整技术栈加速科学发现,涵盖NVIDIA Megatron-LM和NVIDIA Nemotron(用于模型训练)、NVIDIA BioNeMo(用于分子生成)、NVIDIA Triton和NIM微服务(用于推理服务),以及NVIDIA Omniverse库(用于数字孪生)。
"这项工作展示了如何利用强大的计算技术栈,以任何单个科学家都无法独立实现的规模加速科学发现。"Lila Sciences联合创始人兼首席技术官Andy Beam表示。
软件获取方式
NVIDIA ALCHEMI工具包和Toolkit-Ops可从GitHub和PyPI下载;ALCHEMI NIM微服务可从NVIDIA NGC目录下载;VASP对应的ALCHEMI NIM微服务预计将于今年夏季晚些时候发布。DAQIRI现已在GitHub上线,cuPhoton预计今年夏季发布。
Q&A
Q1:NVIDIA cuPhoton能处理哪类科学数据?速度能提升多少?
A:cuPhoton是专为多维科学数据设计的参考代码,支持处理来自望远镜、X射线及激光实验的FITS格式数据。在鲁宾天文台LSST项目的早期测试中,cuPhoton将FITS图像的加载与读取速度提升了14,900倍,借助32块Grace Blackwell超级芯片,信号处理与分析速度最高可提升8,400倍,能够支持PB级数据的加载、处理、分析与可视化。
Q2:NVIDIA DAQIRI解决了科学实验中的什么问题?
A:DAQIRI解决的是传统数据采集系统因硬件限制导致数据丢失的问题。在粒子物理等高能实验场景中,仪器产生数据的速度往往超过存储能力,导致大量数据被丢弃。以CERN的A-GHOST项目为例,ATLAS实验通常因存储限制丢弃超过99%的碰撞数据,DAQIRI通过实时流式处理让AI能够分析这些原本会被舍弃的数据,从中发现潜在的重要物理信号。
Q3:ALCHEMI NIM微服务在材料科学研究中有哪些实际应用效果?
下一篇:没有了