文 / 华创证券有限责任公司总裁助理、信用交易部总经理 刘硕
华创证券有限责任公司信用交易部 卢阳 徐佳 程骋
化解防范重点领域风险,是当前金融工作的关键任务,对增强资本市场内在稳定性,维护市场平稳运行至关重要。融资融券作为资本市场一项基础交易制度,肩负着活跃市场交易、提高定价效率的职能,深入研究融资融券业务的运行特征与风险管理,对稳健推进重点领域风险防范,进一步发挥融资融券的积极作用,具有重大意义。本文通过探索构建融资融券客户智能风险画像,利用XGBoost模型评估两融客户违约风险,并对风险客户聚类分析,填补融资融券客户维度风险研究的不足,对行业融资融券风险管理体系优化具有积极的理论价值与指导作用。
证券公司融资融券风险管理现状
融资融券业务自2011年3月启动交易至今,已平稳运行十余年,期间行业已经形成较为完善的融资融券风险管理体系。当前,证券公司一般通过建立“前—中—后”端风险控制体系,实现涵盖业务全链条的风险管理框架(见表1)。
表1 融资融券风险控制体系
融资融券“前—中—后”端风险控制体系的关键环节在于中端,证券公司通过调整可充抵保证金证券折算率、融资融券保证金比例及账户集中度等标准参数,影响客户融资融券交易的杠杆水平、集中度等,从而管控信用账户整体的违约风险。目前,证券公司一般通过搭建证券分类评估模型,对所有证券进行风险评级,并根据风险等级设定差异化的折算率、保证金比例或集中度,实现风险管理。
然而,客户维度风险的评估仅停留于前端准入环节,中端风控对客户维度的风险考量几近空白,无法准确反应客户交易过程中的动态行为特征和风险变化。截至2024年2月,A股市场融资融券业务个人投资者数量逾680万户,机构投资者数量近6万户,在市场投资主体日益多样化和投资者风险特征逐渐复杂化的背景下,亟需搭建融资融券客户风险评估框架,探索融资融券客户风险画像的构建路径并验证其效用,以补充现有风险研究中存在的空白。
融资融券客户智能风险画像构建
当前证券行业融资融券客户画像多停留于数据描述统计阶段,客户标签的抽象与定义依赖于专家分级打分,存在滞后、无法推广的缺陷。本文在传统画像构建路径的基础上,引入大数据机器学习模型,对融资融券客户违约风险进行预测,新增预测类标签,构建了时效性强、适用性广的智能风险画像。具体构建路径为融资融券客户指标体系构建、模型选择与训练评估、聚类分析三个部分。
1.融资融券客户指标体系构建。融资融券客户数据指标围绕基础属性和交易行为两大维度展开(见表2)。基础属性数据来自于客户开户征信环节,覆盖客户年龄、学历、从事投资交易的年限等静态背景信息;客户交易行为数据来自于券商交易柜台,数据聚焦客户动态行为特征,包括客户的投资偏好、盈利能力和风险管理能力。
表2 融资融券客户数据指标
2.模型的选择、训练与评估。(1)模型选择。XGBoost作为基于梯度提升树的集成学习算法,相比常用的逻辑回归,在处理非线性关系和复杂交互效应时表现更好,预测精度和泛化能力更强。本文应用XGBoost模型于融资融券信用风险客户违约预测。
(2)模型训练。模型训练的核心流程包括特征筛选、交叉验证、超参数优化,为保证模型性能,进行以下技术处理。
特征筛选:通过XGBoost内置的特征重要性函数筛选特征。此外,由于个人和机构客户背景信息特征的维度不同,采取根据客户类型分别训练模型以及训练唯一模型的方式,综合比较后确定训练策略。
交叉验证:鉴于两融业务数据的时序性,采用时序交叉验证方法,将数据按时间跨度分为多个部分,依此作为验证集,其余部分作为训练集,保留时序相关性。
超参数优化:最优超参数组合有助于提升模型性能。贝叶斯超参数优化,相比传统的网格搜索和随机搜索,所需训练次数更少,可有效节省计算资源和时间。在交叉验证的每一折中搜索最优超参数,选择验证集表现最佳的超参数组合。
此外,提高违约样本权重以降低误判成本,并采用早停法避免过拟合。
(3)模型评估。在模型评估阶段,通过准确率、召回率等指标检验模型表现。在融资融券业务中,将违约客户误判为非违约客户会带来较高成本。因此,在保证整体性能的同时,更注重召回率表现。
此外,可运用SHAP(Shapley Additive Explanation)方法分析各特征对模型预测的贡献,揭示其对违约风险的影响,以指导业务理解。SHAP方法源于合作博弈论,在机器学习中,SHAP值衡量每个特征对模型输出的影响,从而解析模型预测的具体过程。
3.风险客户聚类分析。选取关键特征,以无监督聚类算法对高风险客户进行聚类分析,分群画像。目前常用的无监督聚类算法中,K-means应用最为广泛,具有计算速度快、可扩展性强等优势。K-means算法需预设聚类簇数,常用以下四个指标评估最佳聚类数目:畸变程度、轮廓系数、戴维斯-博尔丁指标、卡林斯基-哈拉巴斯指标。本文采用K-means方法对客户聚类,并在确定聚类结果后,邀请业务专家结合各组特征值定义客群,进行整体画像。
融资融券客户智能风险画像实践
上文详细阐述了融资融券客户智能风险画像的理论路径,本章将以XX证券公司客户数据为基础,验证模型对于融资融券客户违约风险预测的有效性,并构建融资融券高风险客户画像。
1.融资融券客户数据收集。数据脱敏后,收集XX证券公司融资融券客户背景、交易、持仓三大维度数据,数据观测区间为2020年1月至2022年12月,最终获得时间序列数据共490万余条。
2.模型训练与评估。实证表明,经训练优化的XGBoost模型在融资融券客户信用风险评估上取得了理想效果,可以较为准确地预测客户未来违约情况。根据融资融券客户数据指标体系,训练优化XGBoost算法模型,包括根据特征重要性筛选指标、五折时序交叉验证、贝叶斯超参数优化等。训练结果表明模型泛化能力较好(见表3),在包含个人与机构客户的数据集上的表现良好,且关键的召回率指标表现理想。
表3 信用评估模型性能表现
从特征影响方向上看,对预测违约有正向影响的为区间最大回撤、收益率波动率、开仓杠杆比例、其他负债比例、持仓集中度、持仓周期和追涨因子;对预测违约有负向影响的为区间总收益率和夏普比率;对预测结果未表现显著影响的特征为证券资产综合折算率(详见图与表4)。
图 全局SHAP值蜂群图
表4 客户特征对预测结果方向影响
3.聚类分析。基于特征重要性分析,选取对违约预测重要的特征,使用K-means算法聚类并检查畸变系数等指标选定最佳数目,最终将高风险客户划分为四类,分别为重仓交易型、弱风控低收益型、综合较弱型与高负债激进型,具体内容详见表5。
表5 高风险客户画像
4.成果及应用。通过建立融资融券客户数据指标体系,构建与训练模型以实现对融资融券客户的违约风险预测,挖掘客户风险属性的重点特征,运用聚类算法对高风险客户聚类,构建融资融券客户智能风险画像,实现了较为准确地预测融资融券客户未来违约风险,并全面地归纳高风险客户构成及其特征,为证券公司基于客户维度风险调整风控策略提供依据。以上研究成果在融资融券业务风险管理中可实现多方面应用提升。
(1)构建预警系统,提高风险监控与预警能力。客户风险画像可作为风险预警系统的核心组成部分。通过实时监控客户的风险特征变化,系统可及时向风控团队提示可能的违约风险与客户风险等级变化,以便风控人员预先采取措施。
(2)优化标准参数管理,协同提升风控效力。当前,证券公司风险标准参数管理工具未考虑客户维度风险,在管理高风险客群时,风控效力或不及预期。针对不同风险客群,可应用客户风险画像及时捕捉客户风险特征差异带来的信用风险,设定差异化的可充抵保证金证券折算率、标的证券保证金比例及账户集中度,更加精细化、科学合理开展事中管理,持续提升信用账户整体质量。
(3)提供风控策略优化建议。通过深入理解不同客户的风险特征,证券公司可向客户推送针对性的风险教育内容。此外,对于系统识别的高风险客户,公司可采取更为主动的客户关系管理策略,为客户提供个性化的风险管理建议,制定更为稳健的投资策略,从源头上降低违约风险。
未来展望
随着金融科技蓬勃发展,加速科技手段与金融服务融合,以金融科技提升风控效能越来越重要。在上述研究与实践的基础上,本文对行业提出如下建议。
一是引入金融科技手段打造客户智能画像。基于大数据的机器学习与深度学习等技术已在各个领域中得到广泛应用,并取得了良好的效果。未来应深入探索融资融券业务与金融科技手段的结合,进一步探索机器学习、深度学习以及大模型在客户风险行为分析、特征挖掘及客户违约预测方面的应用,打造更加智能的客户画像系统,助力提升融资融券风控精细化水平。
二是将客户维度因子纳入融资融券风险管理体系。将客户的差异化特征纳入融资融券风险管理体系,能精确捕捉客户在交易中的风险情况,进一步加强风险管理的针对性和有效性。行业内各券商可以根据自身两融客户的基本情况搭建多维度指标体系,形成客户风险画像管理,并将画像结果运用于风控的各个环节,特别是两融的参数管理节点中,切实提升融资融券风险管理的科学化与精细化水平。
(此文刊发于《金融电子化》2024年5月下半月刊)