前言
2013年《征信业管理条款》出台并实施, 2015年初,央行下发通知,令芝麻信用、腾讯征信、前海征信、鹏元征信、中诚信征、考拉征信、中智诚征信、华道征信8家企业做好关于开展个人征信业务的准备工作,中国征信行业开始呈现市场化,2016年企业征信备案在存量既定的情况下审批节奏有所放慢。2017年颁布的《网络安全法》明确在非个人主动意愿或明确授权的情况下,数据获取方式上第三方强授权的方式将变成非法行为,网络信息安全进一步规范。2018年央行发布了《关于百行征信有限公司(筹)相关情况的公示》,百行征信由中国互联网金融协会持股36%,芝麻信用管理有限公司、腾讯征信有限公司等8家个人征信牌照试点机构各持股8%。自此,中国征信行业大格局形成。同时,由于社会大众信用需求、信用意识不断增强,中国征信行业潜力待释放。
金准人工智能专家发现与建议:目前国内征信市场尚处在起步阶段,对比与国外征信市场,可以推测,国内征信未来市场容量相对较大,且由于中国金融业的快速发展,倒逼信用体系逐步完善,由金准数据推测,中国征信行业规模远大于美国市场。同时数据本身天然的垄断性,尤其是在颁布《网络安全法》后,导致具有生态背景的征信公司更具有优势:获得低成本、高价值的生态数据、能够对征信效果快速评估等。由此,金准人工智能专家预测,较低的市场开发度、社会信用潜在需求度及数据先天垄断的特性,中国征信市场有着较大的成长空间。
一、征信概述
1.征信的定义
征信机构从多种渠道主动采集被征信对象信息数据,利用相关技术将数据进行集中汇总,生成并储存为征信对象信用档案,个人或商业机构出于风险评估的需求,在得到被征信对象授权的前提下,征信企业利用模型算法,对被征信对象的信用状况、信用资质进行评估,并将评估报告及结果出售给个人或企业,以便帮助其了解被征信对象真实信用状况。
2.征信的价值
主要帮助企业及个人解决市场交换、商品贸易、投资借款等活动中,交易双方信用信息不对等的现象,解决被征信方信用资质评估的问题。征信的具体作用主要应用在金融领域,帮助金融机构识别被征信对象的信用状况,如判别其偿债能力、还款意愿,同时为被征信对象提供信用状况改善建议,另一方面,征信也在进入新的领域、产生新的业务形态。
3.征信的分类
按征信对象可分为企业征信和个人征信,按征信用途可分为公共征信、非公共征信和准公共征信。
4.征信的行业产业链
征信产业链主要由数据源、数据处理、产品服务和应用场景组成,其中数据处理和产品服务是征信公司的核心竞争力。由于数据具有垄断性,数据的获取成本也是征信公司的核心问题。
5.征信产业链的关键点分析
5.1有针对性的采集被征信对象数据
征信机构按照计划开展数据采集,数据一般为公开信息、征信机构内部信用档案、数据合作商、被征信对象主动提交信息等,但由于关系到企业、个人信息安全,因此在数据采集时要根据监管要求,对敏感机密信息进行脱敏处理,保证信息不外泄。
在确定信息采集类型、渠道之后,征信机构必须要对数据进行检验,数据检查是保证征信产品真实性的关键。首先,征信机构通过比较不同渠道获得的数据,来验证数据的真实性,同时对独有数据,可以通过常识判断、二次调查等方式验证数据信息。其次,对于被征信对象不完整、有残缺的数据,征信机构需要查找缺失数据。然后对于资本市场、企业征信来说,还需要将征信的数据反馈给被征信人,弥补、修正征集信息过程中出现的数据遗漏、数据错误。最终将收集到的数据存档,形成被征信对象的信用数据档案。
需要注意的是,信用主体的信息呈现碎片化、分散化的特点,其中信息全面性、准确性成为信用资质评估的基础支撑,能否获取有效信息、能否征集多渠道信息、能否将分散信息归总集中于被征信对象个体,对信用服务方而言是一个发展考验,毕竟在相对混乱的源数据领域,真实、全面、及时、隐私性原则或会因企业发展阶段的特殊或利益关系而发生冲突。
5.2利用固有的分析模型,对征集到的数据进行分析
对征集到的原始数据进行分析处理,形成有价值、满足客户需求的征信产品。在信用数据处理中,通常采用的分析方法有:关联分析法、分类分析法、神经网络分析、逻辑回归分析等。根据企业征信需求,选择预先设计好的征信评估模型,选取关联项目指标,根据征信目的配以不同数据指标及不同权重,将企业、个人等被征信对象的信息数据输入模型当中,最终形成综合信用评分。
金准人工智能专家认为,近些年随着人工智能的快速发展和机器自我学习的不断提高,目前征信领域广泛的应用大数据技术,使得数据分析结果更加有效,信用评分更加贴近真实,同时,具有强大算力和模型经验的公司脱颖而出,更具有核心竞争力。
5.3信用产品应用,效果反馈
信用产品的交付后的效果反馈是征信活动的终点。征信应用领域较广;政府公司债券发行、消费品赊账、信用贷款、招聘资质调查、保险病例评估、金融投资等;具体征信服务有:主体信用评级、债项信用评级、主权及地方政府评级、公司治理评级、信用报告、信用评分等。在客户类别上主要包括:政府、制造商、零售商、银行保险金融机构、个人等。金准人工智能专家认为,商业化应用并不是征信流程的终点,征信机构要从商业机构获得反馈,以便对评估模型、方法、数据类型、数据渠道进行调整,保证征信评估的准确、客观性、随着信息化技术的快速发展,这一行为特征更加明显。
二、美国征信体系
1.世界征信体系模式种类
目前各国广泛应用的有三种征信体系,分别是以美国、英国为代表的市场主导型;法国、德国代表的政府主导型和日本主导的会员制型。由于中国征信体系刚开始建立,目前的现状是综合了市场主导和政府主导型。由于中国的大型互联网企业进入征信行业较早,拥有较独立且有价值数据,在建模和大数据分析上代表了中国顶尖的技术,且建立完善的征信体系需要有强大的财力人力资源支撑,预计未来中国依旧会是政府主导型为主,以互联网大数据公司及8家个人征信代表的市场机构起到补充作用。
2.美国征信建设体系框架
从19世纪30年代开始建立至今一百多年来,美国的消费信用体系随着市场经济发展、信用交易规模的扩大、科学技术特别是信息网络技术的出现,逐步形成了以标准普尔、穆迪、惠誉为核心的三大资本市场信用评估机构,以邓白氏为代表的普通企业征信机构,以益博瑞、艾可菲、环联为主的个人征信机构,此外还有基于这七大机构开展相关征信业务的区域或专业性征信机构。
美国的消费信贷业务十分发达,对于征信需求强烈,因此采用了征信市场化的方式,由私人征信机构通过完全竞争来提供更优质的服务。美国征信市场先后经历了快速发展期、法律完善期、并购整合期、成熟拓展期4个阶段,从巅峰时期的2000余家机构逐渐演变成了现在的巨头垄断的市场结构。
美国征信行业完全市场化,经历了几百年的发展,从之前分散杂乱的完全竞争市场,逐步形成目前多寡头甚至是单寡头的垄断的市场格局。在发展过程中,除了市场旺盛的需求、征信机构不断推出创新服务外,更重要的是监管体系在维护用户权利与推动市场发展中所起到的作用。
3.美国人个征信发展历程
在个人征信市场,有Experian、Equifax、TransUnion三大个人征信巨头掌握了约65%的美国本土个人征信市场份额。美国个人征信的监管体系分为行政监管、司法监管和行业自律。美国联邦贸易委员会(FTC)负责监管个人征信公司、信用报告业协会、消费者信用提供者和使用者;美国联邦储备系统负责监管银行机构;联邦或州法院根据相关法案对银行机构实施司法监管。而政府并不直接参与征信服务业的竞争,通过颁布立法和监管来控制征信业的发展。
美国个人征信主要经过了5个阶段。在整合规范期后主要迎来了两次快速发展的浪潮,一次是技术驱动的行业垄断期,一次是以海外市场需求驱动的成熟期。
美国监管体系呈现“双头多级”的特点。双头即政府监管作为主要监管机构,制定征信行业标准规则、保护个人及企业信用权力,个人征信市场监管机构:目前美国监管主要负责机构为联邦贸易委员会及其6大下属部门,联邦储备委员会、财政部货币监理会、联邦存款保险公司、国家信用联盟、储蓄监管办公室、消费者金融保护局。企业及资本市场则是没有明确相关监管主体,而是根据业务类型开展监管,如个人征信市场:消费者数据产业协会、美国国际信用收账协会、全国信用管理局。
目前美国已出台以《公平信用法》为核心的17部监管法律,从被征信对象信息安全,到信用信息使用途径等,都做了较为详细的规定。对触犯征信监管法规的行为,如信息泄露等情况,监管机构据此给予征信企业高达数百万美元的重罚。
4.美国三大个人征信巨头概况
美国人征信市场,Experian、Equifax、TransUnion三大个人征信巨头掌握了约超过一半的美国本土个人征信市场份额。三家公司在侧重点、盈利模式和优势各有不同,其中Experian擅长数据处理征信评估,Equifax可以对无信用消费者进行信用评估,TransUnion的核心竞争力在于专业征信技术的研发和创新。
通过对比美国三大个人征信机构2013-2016年营收数据,可知三大机构整体营收较为稳定,其中Equifax和TransUnion保持稳定增长,这也符合美国个人征信市场已发展至成熟期,市场总规模趋于饱和。三家个人征信机构2013-2016年的主要增长动力来源于美国本土的信息服务营收上升和海外市场的拓展。
截至2017年,Experian的市值最高,为169亿美元,三家营业利润率都在25%左右,未来五年的PEG都大于1,三者在未来5年仍然能够保持良好的成长性。
其中以Experian为例,Experian的业务主要分为四个方面:信息服务、决策分析服务、市场营销服务和个人消费者服务。其中信用服务营收额大于另外三种服务营收额的总和。个人消费服务和市场营销服务由于Experian在C端的服务正在转型,英国、巴西和美国的的消费者可以免费获得信用评分等产品,近三年呈现下降趋势。
除三大个人征信机构外,美国还有数十家垂直领域的专业个人征信机构。专业的征信机构围绕着消费者场景而设,与三大个人征信机构服务于信贷等相关机构,主要采集银行信贷的历史信用,解决信贷风险问题不同,专业的征信机构服务于垂直领域的机构。这些专业征信机构之间,以及和传统的征信机构也有业务往来,并互相竞争,但是不同类型的征信机构之间的主要关系是互相补充,进行征信信息的合作与共享。此外,有一些专业征信机构本身就是由传统征信衍生出来的子公司。
5.美国征信市场新形势
征信机构最基本的作用就是将分散在不同授信机构、碎片化的信息加工融合成为具有完整视图效果的全局信息,帮助商业机构更加有效的进行决策。大数据技术有助于对更加分散、碎片化、底层的数据加工处理为更加完整的全局信息,更加有效地减少信息不对成。
大数据为征信活动提供了一个全新的视角,基于海量的、多样的、交叉互补的数据,征信机构可以获得信用主体及时、全方位的信息。大数据征信的数据来源更为广泛,除信贷数据以外,信用卡还款、网购、社交、转账、理财、水电煤缴费、社保、身份信息、租房信息等都成为大数据征信的数据原料。
在大数据背景下,征信数据规模更大,更新加快,类型复杂,需要有区别于传统工具的新技术方法来完成数据的处理和任务分析。费埃哲公司研究表明,将社交媒体和电商网站拥有的在线数据、移动运营的手机使用数据与传统数据结合用于风险建模,提高了模型对于客户的区分度,在降低拒贷率的同时,提高了风险预测能力。
同时,在大数据的背景下,在原有的三巨头鼎立的局面之外,出现了许多新的竞争者,这些新兴的风险和信用信息公司普遍依靠强大的数据背景或出色的建模和大数据分析能力,服务更专业、领域更垂直,直接对原有三大个人征信机构相关市场份额造成威胁,同时也给整个行业带来了创新和活力。
三、中国征信市场
1.中国征信市场宏观环境分析
2003年,十届全国人大一次会议审议通过“政府工作报告”,首次提出“加快建立社会信用体系”,2004年,人民银行成立银行信贷征信服务中心,2006年,央行企业信用信息基础数据库实现全国联网查询,2009年央行发布信用评级和数据交换行业标准,2013年征信业管理条例正式实施,2015年初,下发通知,要求8家机构做好个人征信的准备工作,2018年央行发布了《关于百行征信有限公司(筹)相关情况的公示》,百行征信由中国互联网金融协会持股36%,芝麻信用管理有限公司、腾讯征信有限公司等8家个人征信牌照试点机构各持股8%。
目前中国征信体系是以央行征信中心为主,由银行、小贷公司等金融机构、类信贷企业提供信用数据,央行征信中心对数据统一处理,具有信息安全度高等特点,但是政府主导的公共征信体系具有更新频率较低、人群覆盖面不足、数据维度较为狭窄、商业场景应用单一等弊端,因此监管层批准征信市场化。至今已有135家在央行就企业征信业务完成备案,并开展相关业务。
与企业征信快速市场发展相比,监管层对个人征信相对谨慎。2015年初,央行下发《关于做好个人征信业务准备工作的通知》,要求芝麻信用、腾讯征信等八家机构着手个人征信业务准备工作。征信市场化大幕已经开启,但由于数据孤岛现象严重、信用市场尚在培育、监管法律仍在完善等原因,目前个人征信市场化尚未有相关进展。
2.中国个人征信机构的发展
从1999年上海资信开展个人征信试点以来,我国个人征信发展不足20年。2013年,《征信业管理条例》正式实施,我国征信业步入有法可依的轨道。同年,《征信机构管理办法》颁布。直到2014年,才发布《征信机构信息安全规范》、《金融信用信息基础数据库用户管理规范》等征信标准。2018年1月,中国互金协会携8家批筹个人征信机构欲成立“信联(百行征信)”,央行公示受理了百行征信有限公司(筹)的个人征信业务申请。
纵观美国的个人征信行业发展历史,不难发现,我国目前与美国上世纪80年代左右发展情况较类似,处于法律完善时期。参考美国的发展路径,我国的个人征信行业离成熟的市场还有很大的发展空间。
从我国个人征信行业的发展历史,不难看出我国的个人征信体系是以政府为主导。在个人征信产业链中,数据处理等核心环节主要是央行征信中心、上海资信、八家试点的个人征信机构及新成立“信联”提供。除此之外,一些大数据公司还会利用技术优势,提供反欺诈、黑名单等产品和服务。
八家试点机构基本都是通用评分+信用报告+反欺诈平台+其他增值服务,但也各有专攻:
1、中诚信征信有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司侧重于金融领域。中诚信征信有限公司的主要合作方,是地方性中小金融机构和电商平台企业,深圳前海征信中心股份有限公司是平安集团成立的,目标客户主要是小额贷款公司、网贷平台等,鹏元征信本身就是金融领域颇具知名度与美誉度的征信服务公司。
2、腾讯征信有限公司、芝麻信用管理有限公司、拉卡拉信用管理有限公司侧重于生活场景领域。腾讯每天和海量用户打交道,企业自然能够提供自己领域内的用户数据。至于芝麻信用,阿里巴巴电商系天猫淘宝聚划算等购物的累计额度、购物品类、退换货记录、甚至阿里旺旺的聊天记录都是芝麻信用的重要的评分标准。拉卡拉信用的考拉信用的通过公共部门、多行业合作企业的数据共享,结合信用卡还款、转账、公共缴费、电商和金融业务数据。
3、中智诚征信有限公司和北京华道征信有限公司目前以反欺诈平台见长。中智诚征信有限公司正在尝试建立一个反欺诈云平台,通过多维身份认证、“黑名单”匹配等手段,将诈骗者精准地揪出来。北京华道征信有限公司主要是面对P2P行业的同业征信平台,通过反欺诈联盟的形式构建行业信用信息共享服务平台,对黑名单和负面信息共享,给金融机构和企业提供反欺诈服务以降低风险
综上,金准人工智能专家认为,没有任何机构是可以在某个领域制霸的,各家到时候可能会进行更多攻城拔寨的竞争,随着市场的推进,市场也会进行进一步的筛选。
征信机构的所有业务都是围绕数据展开,大数据技术的发展大大提升了数据的多元性和可获性,而数据存储与处理技术的进步为行业的降本增效提供基础。
下面以芝麻信用为例,截至2017年底,芝麻信用拥有3.6亿实名用户,征信数据覆盖上百种场景数据,日数量达到PB(1PB=1024TB)级。数据来源于蚂蚁金服内部和外部的金融数据、用户自主提交的基本信息、35种电商数据和公共机构、合作机构提供的公共信息。这些数据通过云计算自动评估用户画像和评分,最终以芝麻分的形式表达。
芝麻分是根据个人用户信息进行加工、整理、计算后得出的信用评分,其分值范围为350到950,分数越高代表信用水平越好,可应用场景越丰富。目前芝麻分已在多种场景中实现应用。
3.中国个人征信市场规模
信贷规模直接决定了征信市场的大小。自2015年以来,我国消费信贷余额保持高速增长,增速超过20%。截止2017年底,消费信贷余额规模达到36万亿元,同比增长25%。消费信贷的快速增长,为个人征信带来市场基础,也对个人征信机构的信用评估业务提供市场空间。近年来,我国的互联网金融呈现爆发式增长,但征信并不能满足互联网金融行业发展的需要。
2011-2017年中国消费信贷余额(万亿元)及增长率(%)
截止2017年11月底,央行征信中心收录自然人信息9.5亿人,有贷款记录的约4.8亿人,央行个人征信的覆盖率50%左右。而美国在2014年,这一比率就高达92%。
央行征信中心人群覆盖情况
在国内,信用多用于金融信贷领域,而在美国,信用深入居民生活,成为一种资产。融360《维度》调查报告就显示,超过10%的用户不关心自己的个人征信,近30%的用户不了解自己在央行的个人征信情况,40%的用户不知道央行的不良征信记录如何消除,我国居民个人信用意识薄弱现象突出。
2016年中国实际个人征信市场规模为134.2亿,2020年有望达到341.5亿元,潜在天花板高达4000亿元。未来成长需要实现加速征信人口的覆盖、提升个人金融业务的活跃度以及丰富征信的应用场景。
征信在共享产品+共享服务等领域有巨大的发展潜力,罗兰贝格统计数据显示,2018年中国共享经济规模将达到达到2300亿美元(约合人民币14400亿元),占全球比重提升至44%。到2018年,中国共享经济占中国GDP的比例也从0.59%跃升至1.67%。而作为产业链上的重要一环,围绕共享经济商业生态,征信也将展现其巨大的商业价值,在共享产品+共享服务等领域有巨大的发展潜力。
4.百行征信的建立
央行准予“百行征信”经营个人征信业务的行政许可显示,“百行征信”注册资本10亿元,主要股东中国互联网金融协会持股36%,其余8家机构分别持股8%,许可日期截止到2021年1月31日。
结合公开信息推测,监管意图将“百行征信”打造成独立、具有公信力、富有创新活力的“中国特色”个人征信市场化机构。
一方面,监管将摆正市场异化的希望寄托于“百行征信”。我们预计,在规范性文件对隐私保护范围、服务对象种类尚无更加细致的指引时,“百行征信”可以通过其实践树立示范效应,从而厘清个人征信市场的边界,包括但不限于:第一,个人征信机构和信息使用者应当是相互独立的法律主体。第二,采集的个人信息范围应当仅限于《征信业管理条例》规定的狭义个人信用信息。第三,个人征信机构的征信产品使用场景要明确在个人借贷服务。
另一方面,监管希望“百行征信”能够在监管框架下“负责任的创新”。在遵守监管规则的前提下,“百行征信”可以联合其他社会机构,共同拓展、打造个人征信市场的健康生态。例如,如何运用科技手段和各机构的权责分配解决我国互联网多头借贷、数据孤岛林立、过度扩大借款人范围等问题。
行业普遍认为,“百行征信”属于《征信业管理条例》规定的“个人征信机构”,区别于国家设立的金融信用信息基础数据库。这主要包含两层含义。
第一层,“百行征信”是第一家获得行政许可的市场化个人征信机构,而非个人征信市场的基础设施。其服务对象主要有从事互联网借贷业务的非银机构、从事个人借贷业务的传统金融机构、金融监管与公检法等机关、信息主体、未来其他个人征信机构以及相关的个人征信服务机构等。
第二层,“百行征信”与其股东按照《公司法》、《公司章程》规定分配各自权利义务。互联网金融协会可以利用有效的公司治理机制实现一定的行业自治意志。从各家机构的持股比例分析,互联网金融协会联合其他四家公司就可以超过三分之二多数;互联网金融协会联合其他两家公司就可以达到简单多数。
相比于苦等3年未能独立拿牌的8家个人征信业务准备机构,百行几乎是衔着个人征信牌照“出生”的。人行征信管理局局长万存知5月进一步表示,要剥离8家机构的个人征信业务,并入百行,8家机构只能做征信以外的数据服务。
有些机构已经在进行调整。例如,外媒称芝麻信用分将不能用于金融服务,目前从支付宝App上可以看出,芝麻信用已经在大范围减少在金融场景的应用范围(只剩花呗和天猫开新车)。
与网联一样,百行征信似乎给中小互金平台带来的机会更大。这些机构自身数据不多,风控能力不强,百行征信给了中小平台一个风控工具。不过百行征信的出现对于行业格局影响肯定不是决定性的,小平台虽然多了一些有效数据,但风控能力没法获得实质性提升,而且在同样关键的获客、资金成本等方面,小平台依然落后。头部平台获得了其他机构共享的数据,优势依然明显。金融行业本身不是形成寡头垄断的行业。百行征信的出现,或会使互金更有传统金融的格局特征,即多家平台位于头部,而不是互联网领域的“7-2-1格局”。
百行征信的出现,将会对于市场上的大数据风控服务商形成一定冲击,很多大数据风控服务商其实是卖数据的公司,供互金机构查询各种维度的数据。百行征信出现后,查数据的需求预计会在一定程度上减弱。各种与借贷弱相关的数据对判断信用的作用有大有小,如果互金机构有了借款记录、逾期次数等重要信息,对各种维度的大数据需求就小了。大数据风控厂商未来可能更加依赖风控模型和工具,提供信用评分、贷前贷后管理系统等产品,这方面的需求依然会存在。
总结与展望
数据是征信行业的基础,我国80%的数据都掌握在政府手里,政府的数据开放度很低。而批筹的八家个人征信机构虽然都有大量的平台数据,但都希望形成自己的闭环,客观上分割了市场的信息链。而且每家的信息覆盖范围受到限制,信息不广、不全带来产品的有效性不足,也不利于“信息共享”,个人征信并未走出数据孤岛的“囚徒困境”。
通过以上分析,金准人工智能专家认为我国个人征信行业存在以下发展趋势。
信息保护成监管核心,或将审慎批设个人征信牌照。征信业的本质是信息共享,如果没有有效的信息保护,就不会有充分的信息共享。在人民银行看来,个人信息保护构成个人征信监管的核心内容,对于个人征信机构要提高门槛,审慎从严批设市场化个人征信机构。
信联有望建立统一的个人征信标准。目前,各家征信机构的模型多是基于自身平台的金融交易、电商交易、社交或生活数据,是非结构化数据。信联会按照相关规定,建立个人信息保护制度,制定业务制度、工作流程、操作规范和数据标准。填补非银金融领域的征信空白。
非持牌机构利用数据优势,切入征信产品或应用等环节。传统信贷数据牢牢掌握在传统征信机构手中,央行征信中心作为全国最大、最权威、最官方的征信机构,提供的是社会化、标准化、全局化的产品。新晋参与主体着手非传统信贷数据的搜集和引用,通过与互联网化的生活数据直接对接,将多元数据引入行业,利用自身的技术能力和对行业的深度理解,提供定制化、专业化的产品和服务。同时金准人工智能专家认为,市场化的征信机构未来和政府部门相互补充信用数据,形成更加完整的个人信用名片,以服务金融机构、服务类企业和个人。