实用理财技巧

关联词:大数据、数据挖掘、量化投资、个人信息保护、数据服务商

替代数据是相对于于传统数据而言,可以为金融分析提供新的洞察力和新的视角,作为传统数据的补充,在传统数据缺失的情况下,替代数据可以作为决策分析的支持。

替代数据可以理解为大数据在具体应用场景中的一种说法。例如在金融信贷领域,消费者相关的非传统大数据就被称之为替代数据。随着大数据处理技术和人工智能分析的兴起,替代数据成为金融科技的一个热点内容,在消费金融的信用评估和投资分析中有着重要的应用。

替代数据也被称为另类数据,即非传统数据,目前没有统一明确的定义,泛指区别于传统金融数据的有价值的信息。传统金融数据是指通过常规渠道获得的数据,例如股票、债券等的交易数据、上市公司年报和财务数据、银行用户的借贷数据等。

许多信用信息服务机构开始探索评估信用能力的新方法。传统数据包括信用卡、车贷、房贷、消费贷等数据,区别于传统信贷的数据可以称为替代数据(Alternative data),是指银行和征信机构所收集传统信贷偿还数据之外的数据,包括电话费、公共事业账单和地址变化记录等内容。一些替代传统信贷风险管理的解决方案正在不断涌现,例如利用手机预付费信息、心理测试数据、社交媒体活动信息和电商行为数据进行信用风险评估等。这些数据的引入为风险评估注入了新的活力,为美国大型银行开辟了新的消费者客户群体。

由于中国消费者有着丰富的经济数据可以作为替代数据,未来也是中国征信业和金融科技的发展机会。下表为传统数据库和替代数据平台的比较:[xxxi]

表9.3 传统数据和替代数据比较

数据平台 注册消费者(亿)活跃消费者(亿)
央行征信中心(传统9.85.3
中国移动8.876.50
中国联通2.841.75
中国电信2.501.82
微信109.63
支付宝5.20约3.64
京东4>1

替代数据也常被投资机构所应用。这些数据集通常由投资公司中的对冲基金经理和其他机构投资专家使用。[ ]替代数据集是由公司外部资源发布的有关特定公司的信息,可以提供及时,独特的投资机会见解。替代数据集通常被归类为大数据这意味着它们可能非常庞大和复杂,并且通常无法通过传统上用于存储或处理数据的软件(例如Microsoft Excel)进行处理。可以从各种来源(例如,金融交易,传感器,移动设备,卫星,公共记录和互联网)编译备用数据集。由于替代数据集是公司运营的产物,因此与传统数据源相比,这些数据集通常较不易访问且结构化。替代数据也称为“排放数据”。产生替代数据的公司通常会忽略数据对机构投资者的价值。在过去十年中,许多数据服务商,聚合商和其他中介机构开始专门为投资者和分析师提供替代数据。在2020年,全球的投资者争先恐后地评估冠状病毒爆发对中国的影响正在转向一系列不寻常的数据点来衡量对世界第二大经济体,从送餐应用到污染的空气飘过香港。[xxxiii]

示例:基于电信数据的信用评分模型[xxxiv]

过去10年中,移动终端发展到无处不在。超过90%的人有移动电话,在发展中国家,蜂窝电话数据使用者多于发达国家。随着移动电话成为新兴市场中必要的交流模式,可收集和分析的数据变得越来越丰富和可描述。通话信息记录数据库提供了一系列包括通话对象、频度时长和支付信息等特征内容的详细信息。研究发现,通过简单的特征(如通话的间隔时间、账户服务的持续性、余额询问频率和通话时长等)可以构建相对有预测能力的模型。一些风险服务提供商已经开发了针对缺失传统征信记录的消费者的风险控制模型(即基于电信数据的信用评分),根据这些模型显示预付费用户的付费情况,通话、上网行为等信息能够在一定程度上预测贷款人的还款意愿及还款能力。针对消费者几个月的手机数据便能提供足够的样本量进行风险建模。例如统计显示,发起呼叫的数量(不是接收呼叫的数量)较多以及通话时长较长这两个维度与信用度是正相关的;相反,在一些模型中,如果工作时段接听较多的电话或者通话的朋友圈相对较小,则可能是低信用客户。因此,基于预付费手机相关数据的风险控制建模,可以极大地帮助一些缺乏征信数据的发展中国家的市场实现普惠金融的健康成长。国内的电信运营商也在尝试开发相关的信用评分。基于电信的信用评分的应用过程中需要注意个人信息保护。

图9.2 利用电信数据作为替代数据进行信用评分示例

资料来源:Ciginifi,https://www.cignifi.com/

[xxxi] 刘新海. 个人征信发展需要市场化驱动[J]. 中国改革,2019, 05:60-66.
[xxxii] 廖理:另类数据正在崛起,促进金融模式创新, http://www.pbcsf.tsinghua.edu.cn/portal/article/index/id/4134.html
[xxxiii] Philip Georgiadis, Robin Wigglesworth, Hudson Lockett. Investors hunt for alternative data to track coronavirus shock[N]. Financial Times,2020-02-19.
[xxxiv] 刘新海. 征信大数据[M]. 北京:中信出版社. 2016.

分享

此网页的文章仅供参考,其内容可能存在一定的滞后性,并有一定的风险和不确定性,这可能导致实际和未来结果与该内容有所不同。Visa不对您使用该信息(包括任何错误、疏忽、不准确或不及时的信息)、任何假设或您通过使用这些信息得出的任何结论负责。Visa不做任何明示或默示担保,并明确放弃适销性和适合特定用途的担保、任何不侵犯第三方知识产权的担保、任何信息将符合客户要求的担保、任何信息为最新信息并且没有错误的担保。在相关法律允许范围内,Visa不对客户或任何第三方的损失(包括但不限于任何特殊的、继发的、偶发或惩罚性损失)负责。