2014年第12期 总第191期 征 信 CREDIT REFERENCE No.12 2014 Serial NO.191 大数据时代征信业发展的机遇与挑战 胡晓帆 (中国人民银行淮北市中心支行,安徽淮北235000) 摘要:大数据技术在行业思维模式、信用信息采集规则与内容、征信产品及服务等方面对征信业发展提供了机 遇,也在隐私安全、信息技术等方面带来了挑战,因此应树立科学合理的大数据使用理念,建立完备的隐私保护体 系,扩充大数据总量,积极推动大数据技术变革,从而促进征信业在大数据时代健康发展。 关键词:大数据;征信业;信用信息采集;数据挖掘 中图分类号:F832.4 文献标志码:B 文章编号:1674—747X(2014)12-0045—04 根据维基百科的定义,数据(Data)是载荷或记 学、客观、全面地看待大数据思想和技术,充分把握 大数据所带来的发展机遇,勇敢迎接大数据引发的 挑战。 一录信息的按一定规则排列组合的物理符号,可以是 数字、文字、图像,也可以是计算机代码;大数据是指 无法在一定时间内用传统数据库软件工具对其内容 进行抓取、管理和处理的数据集合…。在20世纪 90年代后期,大数据的概念首先在气象学、物理学 等科学研究领域被提出来,一些新的分布式计算技 、大数据时代征信业发展的机遇 大数据的思想、技术主要通过对征信业的思维 模式、业务流程、产品和服务方式等方面产生影响, 术随即出现。随着互联网和电子商务的快速发展, 尤其是以社交网络、智能手机的普及所推动的移动 互联网时代的到来,数据量飞速增加。全球在2010 年正式进入ZB时代,预计到2020年,全球将总共拥 进而对征信业的发展提供了新的机遇。 (一)对征信业思维模式的影响 传统征信业的思维模式是通过搜集客户的信用 信息进行分析处理,依托所收集的信息进行严谨的 有35ZB的数据量 J。2011年,麦肯锡的全球研究 因果推导,进而评判出客户的信用状况。而大数据 的思维模式是把全部数据收集存储,进行加工分析, 它关注的是信息数据间松散的相关关系,尤其可以 揭示在以前数据量较少情况下无法发现的相关关 系,即关注客户行为之间的相关性,进而对客户的行 院发布了题为《海量数据,创新、竞争和提高生成率 的下一个新领域》的研究报告,其中分析了大数据相 关的经济活动和业务价值链,为大数据的商业化应 用指明了方向。大数据的发展历程充分表明,大数 据的运用将深入人类社会经济生活的各个领域,将 对社会经济发展产生革命性影响。随着社会经济的 飞速发展,征信业所收集、存储、处理的信息数据量 呈现爆炸式的增长,其必然也会进人大数据时代。 在大数据时代,大数据思想和技术以其自身的优势 必将对征信业提供新的发展机遇,对征信业原有的 运作规则、思维、方法等也将带来一系列挑战。为了 推动征信业在大数据时代的持续健康发展,需要科 为进行预测,而不是探索什么原因导致客户目前的 行为。大数据的思维模式有助于征信机构有效捕捉 以前忽略的细节信息和小概率事件,并更好地预测 被分析对象总体的发展趋势。 (二)对征信市场的影响 随着《征信业管理条例》的颁布实施,征信市场 竞争将更有序、规范和市场化,掌握大量客户数据的 互联网企业将借助数据优势进入征信市场。比如第 收稿日期:2014—10—19 作者简介:胡晓帆(1978一),男,安徽灵璧人,经济师,主要研究方向为征信主体权益保护、数据处理与数据挖掘。 ・45・ 【问题探讨】 三方支付的电商金融,之所以能够依赖电商平台开 展内部的商户信贷业务,并通过频繁的资产交易做 大规模,最本质的优势在于电商用户的交易数据和 频率,信贷不良率控制在很低的水平,明显优于银行 的小微信贷业务。如阿里金融,通过数据化的平台 开展征信操作,将商户的信贷风险控制在较低的程 度。其他电商,如苏宁、腾讯、京东等,不管是自己开 展小贷业务,还是和银行合作开发信贷产品,所利用 的均是电商平台上的客户数据。 (三)对征信机构信息数据采集途径和内容的 影响 征信机构传统上采集征信信息的手段因机构性 质不同而有差异。公共征信机构以德国、法国为代 表,其通常由中央银行经营管理,并行使监管职能, 其获取征信信息通常采取强制要求它们所监管的金 融机构(如商业银行、财务公司、信用卡公司等)定 期报送商业借款人与消费者借款人的信息,此外不 仅收集延期还款或拖欠等负面信息,也收集信贷的 正面信息 j。私营征信机构是指产权私有、市场化 运作的征信机构,包括由商会、银行协会经营的征信 机构,一般独立于政府和大型金融机构之外,私营征 信机构不能强制银行或其他机构向其报送信息,通 常以协议或合同的方式规范信息采集,其数据来源 主要包括:提供信息服务的金融机构(包括租赁公 司、信用卡发卡机构)信贷信息,政府掌握并对公众 开放的公共记录(如破产、欠税和法院判决信息 等),零售商、批发商之间的信用交易及给予消费者 的消费信贷记录,有关消费者社会经济行为的数据 等 j。而在大数据时代,更多是通过分布在人们生 活工作各个环节中的含有内建芯片、传感器、RFID (无线射频芯片)等具有电子神经的感知设备产品 进行信息数据收集。这些产品与后端的计算机联接 之后,可以全天候动态收集人们学习、工作、生活的 各类信息数据,所收集的信息内容大幅扩展。同时, 所收集的数据类型将更加丰富,包括文本数据、数学 数据、统计数据、金融数据、图像数据、声音数据、地 理空间数据、时序数据、机器数据等多种数据。 (四)对征信产品的影响 传统的征信产品主要包括信用报告、信用评分、 信用评级和信用风险管理类产品等 J。在大数据时 代,大数据思维模式有助于推动征信业务拓展,大数 ・46・ 胡晓帆大数据时代征信业发展的机遇与挑战 据技术不仅将有效提升征信产品的质量,而且还将 推动征信产品的创新,使产品设计更加注重客户体 验,产品服务范围扩展到更广阔的社会生活领域。 比如根据对客户的生活工作习惯等数据进行分析, 预测客户的潜在需求,并有针对性地推销相应的征 信产品或为客户量身订做相应的征信产品。在对传 统征信产品的改进方面,以信用报告为例,大数据时 代的信用报告可以结合客户的生活习惯、性格特点、 财务状况、兴趣爱好等信息数据综合评判个人信用 状况。与此同时,征信产品的形式也将更加多样化, 可以是上报的报表、提交的报告、可视化的图表、详 细的可视化分析或者简单的微博信息、视频信息等。 (五)对征信服务方式的影响 大数据时代,征信机构的服务方式也将更加人 性化,更加注重服务的即时、高效。以营销服务为 例,依托大数据技术,征信机构通过收集的详实数据 勾勒出用户的“全貌”,从多方面对客户进行更加精 确的筛选归类,从而提供差异化服务,提高营销服务 的针对性和有效性,甚至实现一对一营销。在客户 维护领域,它可以帮助征信机构更便捷、及时地收集 与分析客户对征信产品和服务效果的诉求,及时对 客户提出的问题和建议进行反馈,提升客户忠诚度。 同时,通过大数据技术研究客户使用服务的有关数 据以及与征信机构所流失客户的有关数据进行分 析,有助于预测发现可能流失的客户,从而改进客户 维护策略,保证客户群体的稳定。 (六)对征信机构技术运用的影响 传统的征信技术主要包括数据采集技术、数据 处理技术、模型评分技术和数据报告技术等。在大 数据时代,大数据技术将会贯穿征信业务的整个流 程,为提供更丰富的征信产品以及更全面的征信服 务,征信机构需要构建能够快速处理和加载海量数 据的大数据平台,充分运用大数据的存储、处理、查 询、分析和可视化等技术 J。基于上述需要,大数据 时代必将促进大数据技术在征信机构的发展及其在 征信业的应用。 二、大数据时代征信业发展面临的挑战 (一)大数据技术对隐私安全的影响 大数据时代,无处不在的信息数据收集给个人 和单位隐私安全带来了巨大的挑战。比如由于大数 【问题探讨】 据技术可以全方位收集个人与单位的信息数据,一 些隐私信息极有可能被全盘收录。允许在特定场合 公开的信息数据如果被用于其他用途的分析和应 用,则极有可能会侵犯个人和单位的隐私 J,而大数 据分析注重于对数据多次运用以及不同类型数据交 叉运用的特性,使这种隐私泄露的风险大大增加。 不仅如此,目前的法律对许多数据的所有权和使用 权没有明确的界定,也没有考虑其中涉及的隐私安 全问题。当前,各类征信机构数据存储能力、信息安 全保护的水平参差不齐,一些信息安全防护能力不 足的征信机构很容易造成客户隐私信息的泄露。征 信机构作为信用经济活动的重要参与者更应当以信 为本,如果不能有效保护隐私安全将极大地动摇征 信业的根基。 (二)过分依赖大数据分析思想的弊端 大数据时代对大数据的分析应当是理性、科学 的,但不能过度依赖大数据分析,甚至盲从大数据分 析预测的结果。必须注意的是:大数据分析强调的 是利用所有数据,从发现一般性规律到关注更多在 传统的征信调查分析下被忽略的细节信息,分析信 息数据之间的关联性并进行预测,这导致大数据分 析对于信息数据之间因果关系分析的忽视,致使其 分析结果存在着一些不严谨之处,因此孤立地进行 大数据分析所得到的结果有可能是片面的,甚至是 错误的。现阶段,大数据的技术水平并不能实现对 数据质量的保证,而且所能获取的数据量可能无法 达到特定分析对量的要求,这都会影响分析质量 。 不仅如此,过度依赖大数据分析极易扼杀没有数据 支持的创新。 (三)大数据技术还有待进一步发展 目前大数据技术的发展处于起步阶段,还存在 许多不完善的地方,包括硬件技术、标准化、网络服 务、存储能力、算法技术等方面。以技术标准化为 例,目前大数据技术标准尚不完善,大数据平台和工 具层出不穷、标准各异,增加了大数据的应用难度, 并且缺乏标准也使得技术的发展缺乏持续性,使得 一些技术昙花一现 ]。计算机算法方面,传统的数 据挖掘技术面向小样本的数据,需要多次扫描数据, 速度较慢,容错性低,不支持并行处理,算法性能随 着数据量的增长过早饱和;而大数据时代,所有的数 据处理不能使用传统的硬件和算法,需要效率高到 胡晓帆大数据时代征信业发展的机遇与挑战 能够处理超大规模的数据,能够支持在多 多核/ 多GPU上的并行计算,同时需要高容错度_1。。,这对 计算机算法提出了更高的要求。大数据时代,海量 数据的来源、标准、形式的不同,增加了数据采集、编 码与整合的困难,这对技术工作提出了新要求。 三、大数据时代推动征信业发展的建议 (一)树立科学合理的大数据使用理念 首先,需要明确传统的征信调查分析思想和大 数据分析思想各自的优势,即传统的征信调查分析 思想注重对信息数据因果关系的推导,延展了问题 分析的深度,而大数据分析思想通过对信息数据相 关性的把握拓展了问题分析的宽度,两种方式不是 相互否定的关系,应形成合理的互补,使征信分析更 加客观公正。其次,在分析过程中,大数据分析预测 的结果仅起参考作用,不能替代征信从业者的最终 决策。大数据分析并不是弱化征信从业者对于征信 调查活动的亲身参与,而是需要从业者具备更强的 综合分析问题的能力,将大数据分析结果与实际调 查相结合,做出独立、科学的决策分析。 (二)建立完备的隐私保护体系 1.建立并完善大数据运用的制度体系,加强对 隐私的保护 通过建立完善大数据运用制度体系,对数据的 所有权和使用权归属进行明确规定,明确受保护隐 私的种类和相应的保护措施,对于侵犯隐私安全的 行为进行严厉的惩处。大数据运用的制度体系既要 确保数据收集处理过程中的隐私不被泄露,不被用 于当事人不同意或者不合理的其他用途,也要为依 法合理地收集处理大数据提供支持。大数据保护立 法应该更着重于数据使用者为其行为承担责任,而 不是将重心放在收集数据之初取得个人同意上。同 时,立法应当强化征信监管机关的检查监督权,使其 对征信机构运用大数据的行为实施更强有力的 监管。 2.提升隐私保护的技术手段 目前有许多隐私保护技术,包括匿名(指用户使 用资源和服务时,不公开他的身份)、使用假名(指 用户不公开他的身份,使用假名来使用资源和服 务)、不可见(指用户使用资源和服务时,没有其他 人能看到资源和服务正在被使用)、完全的去个性化 .47. 【问题探讨】 (指数据被匿名后处理,以至于数据主题不再能被认 出)、实用的去个性化(指个人数据被修改,以至于 关于个人的或物理环境的信息不再被识别,或者只 能通过不成比例的时间、成本和劳力代价才能被识 别,或者只被能识别的人所识别)、增强隐私保护身 份管理、受限的访问控制、信息隐藏方法等。大数据 立法应当强制征信机构使用一定种类的隐私保护技 术,并由征信监管机构定期监督检查隐私保护技术 的运用情况¨ 。 (三)扩充大数据总量 为了完全步人大数据时代,需要进一步扩充数 据总量,丰富数据内容,实现海量数据更顺畅的流 通。为此,一方面需要加强政府信息公开,另一方面 需要构建私人、企业和机构间可以实现数据自由交 易的数据市场 。 1.推动政府信息数据公开 政府是大规模原始数据信息的采集者,各级政 府管理部门可以依法强制要求所辖领域的单位和个 人报备各类信息数据,因此,政府掌握了大量的数 据,政府信息数据的公开将促进数据量的迅猛增长, 促进人类社会步人更高层次的大数据时代。近年 来,一种称为LOD(Linked Open Data)的构想在世界 范围内受到广泛推崇,它是指将国家及地方政府等 公职机构所拥有的统计数据、地理信息数据、生命科 学等科学数据开放出来(Open Data),并相互连接 (Link),以为社会整体带来巨大价值为目的进行共 享_l 。目前许多国家和地区都在积极推进政府信 息公开,与这一构想相互吻合。目前美国建立了一 个向公民提供国情、环境、经济状况等联邦政府机关 所拥有的各种数据的网站Data.gov,普通公民和组 织都可以下载这些公开的数据,并自由地进行加工、 分析l14 3。Data.gov自建立以来数据量迅猛增长,从 2009年的47个数据集发展到2012年7月三周年 时,数据集已达45万个左右,涵盖了172个机 构¨ 。许多其他国家、地区和国际组织也纷纷加入 数据开放的行列中或制定了推动数据开放的措施。 2.建立完善的数据交易市场 目前,许多单位甚至个人在自己的从业范围内 掌握着大量的数据且彼此之间数据交流较少。在大 数据时代,许多数据的价值需要经过与其他数据共 ・48・ 胡晓帆大数据时代征信业发展的机遇与挑战 同整合才能体现出来,单位和个人仅在自己封闭的 数据库内开展的数据分析工作所得出的结果往往会 有偏误。因此,应尽快统一数据共享标准,提高数据 的规范化程度和整合力度,加强数据部门的交流与 合作,促进数据开放工作的稳步推进,甚至可以在保 护国家安全的前提下,促进国际间的数据交流_】 。 应推动各类数据可以自由交易的数据市场的建立, 并相应构建收费模式、数据格式管理、信息安全防护 等规章制度,实现各种数据的顺畅流通,最大化发挥 大数据价值。 (四)积极推动大数据技术变革 大数据的技术变革是一项系统庞大的工程,需 要国家和包括征信机构在内各类企业、科研教育机 构等共同参与。首先,国家应当将发展大数据技术 上升到国家战略的高度,制定系统科学的发展规划, 加强对大数据技术研发的投入,建立国家级大数据 标准化组织,吸纳科研机构、企业等单位共同参与, 研制大数据管理、测试、技术工具等的标准化体系。 其次,包括征信机构在内的各类企业在参与国家大 数据研究活动的同时,结合自身业务开展实际,研究 符合自身业务特色的大数据技术,与国家层面的大 数据技术研究互相补充,形成多层次的大数据产业 系统,实现大数据技术研发和产业创新多元化。同 时,科研教育机构建立完善大数据方面的学科体系, 加强学术理论研究,促进大数据人才的培养,推动与 国外科研教育机构的学术交流与合作。 参考文献: [1][6][7][9][11]赵刚.大数据技术与应用实践指南 [M].北京:电子工业出版社,2013:1,59,263,268, 266—267. [2][3][4][5]戴根有.征信理论与实务[M].北京:中国金 融出版社,2009:2,17—18,20,162—175. [8][美]维克托・迈尔一舍恩伯格.大数据时代[M】.盛杨燕, 周涛,译.浙江:浙江人民出版社,2012. [10]陈一昕.大数据的思维革命及算法挑战[J].信息通信 技术,20l3(6):7. [12][13][14][15][日]城田真琴.大数据的冲击[M]. 周自恒,译.北京:人民邮电出版社,2013:178,179, 182—183. [16]吴晶妹.未来中国征信:三大数据体系[J].征信,2013 (1):4—12. (责任编辑:王银枝)