风控模型文档怎么写?
金融离不开风控,对于数据驱动的风控模型,在模型开发完成后,还需要撰写模型文档。
一份规范、完整、详尽的模型文档,是数据驱动评分卡建模的画龙点晴之笔。
模型文档的作用有三个,一是需要用于风控模型的评审工作(有些银行还聘请第三方团队根据模型文档做复盘),二是便于模型的部署实施人员理解风控模型,从而保障模型部署实施的准确性;三是便于未来新岗位/新团队在模型迭代优化的工作中,迅速把握和理解原风控模型的细节。
模型文档通常至少包括5个部分,分别是:模型背景、模型设计、数据准备、变量筛选、最终模型。
模型背景。主要就是介绍风控模型针对的风控场景,以及主要的风控目标。这段虽然简单,似乎有点“虚”,但其实非常关键,不同的场景、不同的目标,会带来风控模型的根本性差异。否则,几个月后,时过境迁,再回顾时可能连模型开发人员自己都搞不清楚当时在数据处理和变量筛选上的处理逻辑了。
模型设计。主要是两块,一是样本,包括训练样本、验证样本和时间外验证样本。另一是坏客户定义。表现期内定义坏客户是逾期15天、30天还是2个月以上,既影响坏客户样本,也影响灰色客户样本(灰客户需要在样本中剔除)。
数据准备。包括4个方面的工作:数据提取、历史趋势聚合、缺失值与极值处理、WOE编码。具体来说,一是需要说明数据提取的内容,包括了哪些大类数据,比如用户信息、征信数据、APP使用信息等。二是介绍对哪些数据进行了趋势聚合,比如哪些数据进行了均值、最大值或最小值处理,哪些数据有递增或递减的趋势,哪些数据中有多个月为0或非0。三是缺失值和极值是如何处理的,比如哪些变量因缺失值过多而删除,哪些极值或缺失值进行了处理(例如处理为0)。四是对所有变量进行WOE处理,形成WOE变量。
变量筛选。主要是详细地记录变量筛选的方法和筛选后的变量名。比如,使用IV值进行了初筛(通常将IV值低于0.02的变量删除),然后将通过IV初筛的变量进行逐步回归分析,再通过一致性、显著性、相关性、稳定性、可解释性等维度予以筛选(调优),这些明细步骤都需要予以准确记录。
最终模型。包括3个内容,一是最终模型有哪些入模变量、变量参数等信息;二是模型表现,在开发、测试和时间外验证样本的KS值表现等;三是模型分制转换,即通过算法将概率分转化为信用分。
为了让模型文档的正文更简洁,一些详细内容应当列在附件中展示。在数据准备部分,附件中需要列示聚合函数详单、缺失值和极值处理明细;在变量筛选部分,附件中需要列示IV值、变量筛选结果及模型调优记录等;在最终模型部分,还需要列示最终模型及KS报告。
以上就是关于“风控模型文档怎么写”的全部内容,相信大家已经有了全面认识;更多票据相关资讯及知识,欢迎关注fx358票据学院。
免责声明:来源于风控民工。版权归原作者所有;转载此文章并不代表本平台赞同其观点和对其真实性负责。若文章有任何不妥之处请留言指正或联系删除。