金融界2024年2月20日消息,据国家知识产权局公告,长安汽车金融有限公司申请一项名为“一种样本数据生成方法、装置、设备及可读存储介质“,公开号CN117574263A,申请日期为2023年11月。
专利摘要显示,本发明公开了一种样本数据生成方法、装置、设备及可读存储介质,应用于汽车金融领域,包括:获取待生成类的历史样本数据并进行类型处理,得到处理后数据;基于处理后数据构建各个特征变量的单变量分布采样器;单变量采样器包括各个特征变量对应的概率分布函数、累积分布函数和分位点函数;根据各个特征变量的单变量分布采样器和Copula(连接)函数构建多变量分布采样器;调用多变量分布采样器生成待生成类的样本数据。本方法通过Copula函数构建真实数据的多变量分布采样器,通过学习发现相似数据的邻域使得生成的数据尽可能的贴近真实数据,生成的数据能够更好的平衡过度拟合数据和随机噪音数据这两种极端情况,有效提升数据的质量。
来源:金融界
上一篇:加强人工智能伦理治理