简介
在现代生物制药生产中,过程分析技术(PAT)的应用已经成为确保产品质量和工艺效率的关键因素。数据自动化、可视化和智能数据实用程序是 PAT 工具的重要组成部分。这些技术不仅能够生成大量有用的数据,还能通过系统化和自动化的平台,实现数据的存储、分析和可视化,从而帮助发现关键的见解。本文将深入探讨 PAT 工具中数据自动化和智能数据实用程序的各种基础设施,并讨论它们在生物制药领域的应用。
数据自动化与存储
随着分析仪器的进步,如中红外过程光谱仪能够以每 10 秒的频率生成光谱数据,数据自动化的需求变得愈发重要。自动化的数据管道能够将数据从过程仪器(如色谱仪或光谱仪器)输送到预处理和分析的平台。定制的数据管道 IT 基础设施虽然灵活,但商用平台如 Optimal Industrial Automation 的 SynTQ®、西门子的 SIPAT®、赛多利斯的 BioPAT SIMCA® 和 Camo 的 Unscrambler Process Pulse II® 提供了更为成熟的解决方案。这些平台不仅能够自动传输数据,还能够对数据进行预处理、MVDA 分析和可视化。
例如,Unscrambler Process Pulse II® 提供了一个强大的化学计量平台,支持多种 MVDA 分析选项,而 SynTQ® 则具有用户友好的界面,并支持广泛的分析仪器。此外,集中式数据存储库是 PAT 数据完整性的关键要素。在数据传输、处理、分析和可视化之后,数据需要被结构化和存储,以便于提取用于数据驱动的建模。基于云的数据湖,如亚马逊网络服务和 Microsoft Azure 是一些常见的解决方案。
数据工程和数据基础设施
数据工程涉及将数据从各种源头自动化地收集、处理和存储,以确保数据的完整性和可用性。这些数据管道不仅仅是简单的传输工具,而是复杂的系统,确保数据从采集到存储的全过程无缝衔接。数据工程的目标是创建一个强大的基础设施,能够处理大量数据,并提供实时分析和可视化。
数据可视化和高级数据分析
数据可视化和高级数据分析是从大数据中提取有价值见解的重要工具。通过数据可视化,用户可以直观地理解复杂的数据模式和趋势。而高级数据分析,如机器学习和多变量数据分析(MVDA),可以深入挖掘数据中的潜在规律和关联。
例如,Optimal Industrial Automation 的 SynTQ® 和西门子的 SIPAT® 平台提供了强大的数据可视化工具,能够将复杂的数据转换为易于理解的图表和图形。这些平台还支持高级数据分析,能够自动检测异常和趋势,帮助用户及时做出决策。
智能数据实用程序
智能数据实用程序包括机理、数据驱动和混合建模方法。机理模型基于对过程的深刻理解,提供高可解释性的模型,但需要大量的先验知识。数据驱动模型,如机器学习模型,通过找到数学函数和参数来最小化模型预测与观测值之间的偏差。混合模型结合了机理模型和数据驱动模型的优点,在生物过程建模中具有广阔的应用前景。
例如,使用机理微分方程描述过程,结合机器学习模型来拟合速率常数的混合模型,可以减轻纯机理或数据驱动模型的一些缺点。Pinto 等人(2019)的研究证明了混合模型在微生物喂养分批过程中的实用性,使用自举聚合混合建模策略大大减少了预测误差。
模型生命周期管理
模型生命周期管理(MLM)是基于模型的 PAT 技术的重要组成部分。MLM 包括模型的持续和系统评估,以满足预先定义的监管和质量期望标准。由于细胞培养变异性、配方变化、原材料变异性和工艺漂移,数据和机理驱动的模型往往会随着时间的推移而显示出性能下降。因此,模型维护必须成为 MLM 控制策略的一部分。适当的模型诊断可以常规识别模型的性能,并在发现偏差后实施模型修正。
实时过程监控和预测
实时过程监控是 PAT 工具的核心功能之一。通过将分析与实时过程监控相集成,可以生成大量有用的数据,并实时发现关键的工艺参数变化。Bayrak 等人(2018)报告了用于预测哺乳动物细胞培养中产物浓度的实时机器学习工具,通过提前预测质量属性,更好地控制了过程。最近,Tulsyan 等人(2019)报道了一种即时机器学习框架,用于自动校准、评估和维护在线监测细胞培养过程的通用拉曼模型。
这种实时生成用于在线监测的拉曼模型的方法是一种独特的替代方案,可以替代基于历史训练数据集创建模型的传统方法。当产品的历史数据有限时,机器学习方法也被用于过程验证。例如,K 均值聚类和分层聚类方法已经被证明在识别历史药物批次的相似性方面非常有效。
数据驱动的高级分析和过程设计空间分析
数据驱动的高级分析和过程设计空间分析在现代生物制药生产中起着关键作用。通过对数据的深入分析,可以发现过程参数与关键质量属性(CQA)之间的关系,从而优化工艺设计和控制策略。例如,Kornecki 和 Strube(2019)的研究展示了数据驱动高级分析在过程建模中的应用,而 Bhatia 等人(2016)则讨论了过程设计空间分析的策略。
总结
数据自动化、可视化和智能数据实用程序是现代生物制药生产中不可或缺的部分。通过构建强大的数据基础设施和应用先进的数据分析技术,企业可以实现高效的过程监控和优化。无论是机理模型、数据驱动模型还是混合模型,选择适合的建模方法和维护策略都是确保工艺质量和效率的关键。未来,随着技术的不断进步,数据自动化和智能数据实用程序将在生物制药领域发挥越来越重要的作用。