61阅读

用户画像数据建模-什么是用户画像?金融行业大数据用户画像实践

发布时间:2017-11-05 所属栏目:交互

一 : 什么是用户画像?金融行业大数据用户画像实践

1

金融消费者逐渐年轻化,80、90后成为客户主力,他们的消费意识和金融意识正在增强。金融服务正在从以产品为中心,转向以消费者为中心。所有金融行业面对的最大挑战是消费者的消费行为和消费需求的转变,金融企业迫切需要为产品寻找目标客户和为客户定制产品。

一、用户画像背后的原因

1、金融消费行为的改变,企业无法接触到客户

80后、90后总计共有3.4亿人口,并日益成为金融企业主要的消费者,但是他们的金融消费习惯正在改变,他们不愿意到金融网点办理业务,不喜欢被动接受金融产品和服务。年轻人将主要的时间都消费在移动互联网,消费在智能手机上。平均每个人,每天使用智能手机的时间超过了3小时,年轻人可能会超过4个小时。浏览手机已经成为工作和睡觉之后的,人类第三大生活习惯,移动APP也成为所有金融企业的客户入口、服务入口、消费入口、数据入口。

金融企业越来越难面对面接触到年轻人,无法像过去一样,从对话中了解年轻人的想法,了解年轻人金融产品的需求。

2、消费者需求出现分化,需要寻找目标客户

客户群体正在出现分化,市场上很少有一种产品和一种金融服务可以满足所有用户的需求。金融产品也需要进行细化,为不同客户提供不同产品。

金融企业面对的客户群体基数很大,有的客户高风险偏好高,希望高风险高收益;有的客户风险偏好低,希望稳健收益;有的客户金融理财意识低,只需服务较好即可;有的客户完全没有主意,你说是啥就是啥;有的客户注重体验,有的客户注重实惠,有的客户注重品牌,有的客户注重风险等等。不同年龄,不同收入,不同职业,不同资产的客户对金融产品的需求都不尽相同。金融企业需要为不同的客户定制产品,满足不同客户的需要。对于金融企业,理财和消费是主要的业务需求。

客户消费习惯的改变,企业无法接触到客户,无法了解客户需求;

客户需求的分化,企业需要细分客户,为目标客户开发设计产品。

金融企业需要借助于户画像,来了解客户,找到目标客户,触达客户。

2

1

二、用户画像的目的

用户画像是在解客户需求和消费能力,以及客户信用额度的基础上,寻找潜在产品的目标客户,并利用画像信息为客户开发产品。

提到用户画像,很多厂商都会提到360度用户画像,其实经常360度客户画像是一个广告宣传用语,根本不存数据可以全面描述客户,透彻了解客户。人是非常复杂的动物,信息纬度非常复杂,仅仅依靠外部信息来刻画客户内心需要根本不可能。

用户画像一词具有很重的场景因素,不同企业对于用户画像有着不同对理解和需求。举个例子,金融行业和汽车行业对于用户画像需求的信息完全不一样,信息纬度也不同,对画像结果要求也不同。每个行业都有一套适合自己行业的用户画像方法,但是其核心都是为客户服务,为业务场景服务。

用户画像本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。另外一个方面就是,金融企业利用统计的信息,开发出适合目标客户的产品。

从商业角度出发的用户画像对企业具有很大的价值,用户画像目的有两个。

一个是业务场景出发,寻找目标客户。另外一个就是,参考用户画像的信息,为用户设计产品或开展营销活动。

3

三、用户画像工作坚持的原则

市场上用户画像的方法很多,许多企业也提供用户画像服务,将用户画像提升到很有逼格一件事。金融企业是最早开始用户画像的行业,由于拥有丰富的数据,金融企业在进行用户画像时,对众多纬度的数据无从下手,总是认为用户画像数据纬度越多越好,画像数据越丰富越好,某些输入的数据还设定了权重甚至建立了模型,搞的用户画像是一个巨大而负责的工程。但是费力很大力气进行了画像之后,却发现只剩下了用户画像,和业务相聚甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说是得不偿失,无法向领导交代。

事实上,用户画像涉及数据的纬度需要业务场景结合,既要简单干练又要和业务强相关,既要筛选便捷又要方便进一步操作。用户画像需要坚持三个原则,分别是人口属性和信用信息为主,强相关信息为主,定性数据为主。下面就分别展开进行解释和分析。

1、信用信息和人口属性为主

描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。任何企业进行用户画像的目的是寻找目标客户,其必须是具有潜在消费能力的用户。信用信息可以直接证明客户的消费能力,是用户画像中最重要和基础的信息。一句戏言,所有的信息都是信用信息就是这个道理。其包含消费者工作、收入、学历、财产等信息。

定位完目标客户之后,金融企业需要触达客户,人口属性信息就是起到触达客户的作用,人口属性信息包含姓名、性别,电话号码,邮件地址,家庭住址等信息。这些信息可以帮助金融企业联系客户,将产品和服务推销给客户。

2、采用强相关信息,忽略弱相关信息

我们需要介绍一下强相关信息和弱相关信息。强相关信息就是同场景需求直接相关的信息,其可以是因果信息,也可以是相关程度很高的信息。

如果定义采用0到1作为相关系数取值范围的化,0.6以上的相关系数就应该定义为强相关信息。例如在其他条件相同的前提下,35岁左右人的平均工资高于平均年龄为30岁的人,计算机专业毕业的学生平均工资高于哲学专业学生,从事金融行业工作的平均工资高于从事纺织行业的平均工资,上海的平均工资超过海南省平均工资。从这些信息可以看出来人的年龄、学历、职业、地点对收入的影响较大,同收入高低是强相关关系。简单的将,对信用信息影响较大的信息就是强相关信息,反之则是弱相关信息。

用户其他的信息,例如用户的身高、体重、姓名、星座等信息,很难从概率上分析出其对消费能力的影响,这些弱相关信息,这些信息就不应该放到用户画像中进行分析,对用户的信用消费能力影响很小,不具有较大的商业价值。

用户画像和用户分析时,需要考虑强相关信息,不要考虑弱相关信息,这是用户画像的一个原则。

3、将定量的信息归类为定性的信息

用户画像的目的是为产品筛选出目标客户,定量的信息不利于对客户进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选人群。

例如可以将年龄段对客户进行划分,18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。可以参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。参考资产信息也可以将客户定义为高、中、低级别。定性信息的类别和方式方法,金融可以从自身业务出发,没有固定的模式。

将金融企业各类定量信息,集中在一起,对定性信息进行分类,并进行定性化,有利与对用户进行筛选,快速定位目标客户,是用户画像的另外一个原则。

4

什么是用户画像?金融行业大数据用户画像实践

四、用户画像的方法介绍,不要太复杂

金融企业需要结合业务需求进行用户画像,从实用角度出发,我们可以将用户画像信息分成五类信息。分别是人口属性,信用属性,消费特征,兴趣爱好,社交属性。它们基本覆盖了业务需求所需要的强相关信息,结合外部场景数据将会产生巨大的商业价值。我们先了解下用户画像的五大类信息的作用,以及涉及的强相关信息。特别复杂的用户画像纬度例如八个纬度,十个纬度信息都不利于商业应用,不建议金融企业进行采用,其他具有价值的信息,基本上都可以归纳到这五个纬度。金融企业达到其商业需求,从这五个纬度信息进行应用就可以了,不需要过于复杂用户画像这个工作,同时商业意义也不太大。

1、人口属性:

用于描述一个人基本特征的信息,主要作用是帮助金融企业知道客户是谁,如何触达用户。姓名,性别,年龄,电话号码,邮箱,家庭住址都属于人口属性信息。

2、信用属性:

用于描述用户收入潜力和收入情况,支付能力。帮助企业了解客户资产情况和信用情况,有利于定位目标客户。客户职业、收入、资产、负债、学历、信用评分等都属于信用信息。

3、消费特征:

用于描述客户主要消费习惯和消费偏好,用于寻找高频和高价值客户。帮助企业依据客户消费特点推荐相关金融产品和服务,转化率将非常高。为了便于筛选客户,可以参考客户的消费记录将客户直接定性为某些消费特征人群,例如差旅人群,境外游人群,旅游人群,餐饮用户,汽车用户,母婴用户,理财人群等。

4、兴趣爱好:

用于描述客户具有哪方面的兴趣爱好,在这些兴趣方面可能消费偏好比较高。帮助企业了解客户兴趣和消费倾向,定向进行活动营销。兴趣爱好的信息可能会和消费特征中部分信息有重复,区别在于数据来源不同。消费特征来源于已有的消费记录,但是购买的物品和服务不一定是自己享用,但是兴趣爱好代表本人的真实兴趣。例如户外运动爱好者,旅游爱好者,电影爱好者,科技发烧友,健身爱好者,奢侈品爱好者等。兴趣爱好的信息可能来源于社交信息和客户位置信息。

5、社交信息:

用于描述用户在社交媒体的评论,这些信息往往代表用户内心的想法和需求,具有实时性高,转化率高的特点。例如客户询问上海哪里好玩?澳大利亚墨尔本的交通?房屋贷款哪家优惠多?那个理财产品好?这些社交信息都是代表客户多需求,如果企业可以及时了解到,将会有助于产品推广。

什么是用户画像?金融行业大数据用户画像实践

这些用户画像信息归类基本覆盖了业务需求和产品开发所需要的信息,需要对这些信息进行进行整理和处理。根据业务场景,将定量的数据转化为定性的数据,并将强相关数据进行整理。

五、金融企业用户画像的基本步骤如下

参考金融企业的数据类型和业务需求,可以将金融企业用户画像工作进行细化。基本上从数据集中到数据处理,从强相关数据到定性分类数据,从引入外部数据到依据业务场景进行筛选目标用户。

1)画像相关数据的整理和集中

金融企业内部的信息分布在不同的系统中,一般情况下,人口属性信息主要集中在客户关系管理系统,信用信息主要集中在交易系统和产品系统之中,也集中在客户关系管理系统中,消费特征主要集中在渠道和产品系统中。

兴趣爱好和社交信息需要从外部引入,例如客户的行为轨迹可以代表其兴趣爱好和品牌爱好,移动设备到位置信息可以提供较为准确的兴趣爱好信息。社交信息,可以借助于金融行业自身的文本挖掘能力进行采集和分析,也是可以借助于厂商的技术能力在社交网站上直接获得。社交信息往往是实时信息,商业价值较高,转化率也较高,是大数据预测方面的主要信息来源。例如用用户在社交网站上提出罗马哪里好玩的问题,就代表用户未来可能有出国旅游的需求;如果客户在对比两款汽车的优良,客户购买汽车的可能性就较大。金融企业可以及时介入,为客户提供金融服务。

客户画像数据主要分为五类,人口属性、信用信息、消费特征、兴趣爱好、社交信息。这些数据都分布在不同的信息系统,金融企业都上线了数据仓库(DW),所有画像相关的强相关信息都可以从数据仓库里面整理和集中,并且依据画像商业需求,利用跑批作业,加工数据,生成用户画像的原始数据。

数据仓库成为用户画像数据的主要处理工具,依据业务场景和画像需求将原始数据进行分类、筛选、归纳、加工等,生成用户画像需要的原始数据。

用户画像的纬度信息不是越多越好,只需要找到可五大类画像信息强相关信息,同业务场景强相关信息,同产品和目标客户强相关信息即可。根本不存在360度的用户画像信息,也不存在丰富的信息可以完全了解客户,另外数据的实效性也要重点考虑。

2)找到同业务场景强相关数据

依据用户画像的原则,所有画像信息应该是5大分类的强相关信息。强相关信息是指同业务场景强相关信息,可以帮助金融行业定位目标客户,了解客户潜在需求,开发需求产品。

只有强相关信息才能帮助金融企业有效结合业务需求,创造商业价值。例如姓名、手机号、家庭地址就是能够触达客户的强人口属性信息,收入、学历、职业、资产就是客户信用信息的强相关信息。差旅人群、境外游人群、汽车用户、旅游人群、母婴人群就是消费特征的强相关信息。摄影爱好者、游戏爱好者、健身爱好者、电影人群、户外爱好者就是客户兴趣爱好的强相关信息。社交媒体上发表的旅游需求,旅游攻略,理财咨询,汽车需求,房产需求等信息代表了用户的内心需求,是社交信息场景应用的强相关信息。

金融企业内部信息较多,在用户画像阶段不需要对所有信息都采用,只需要采用同业务场景和目标客户强相关的信息即可,这样有助于提高产品转化率,降低ROI,有利于简单找到业务应用场景,在数据变现过程中也容易实现。

千万不要将用户画像工作搞的过于复杂,同业务场景关系不大,这样就让很多金融企业特别是领导失去用户画像的兴趣,看不到用户画像的商业,不愿意在大数据领域投资。为企业带来商业价值才是用户画像工作的主要动力和主要目的。

3)对数据进行分类和标签化(定量to定性)

金融企业集中了所有信息之后,依据业务需求,对信息进行加工整理,需要对定量的信息进行定性,方便信息分类和筛选。这部分工作建议在数据仓库进行,不建议在大数据管理平台(DMP)里进行加工。

定性信息进行定量分类是用户画像的一个重要工作环节,具有较高的业务场景要求,考验用户画像商业需求的转化。其主要目的是帮助企业将复杂数据简单化,将交易数据定性进行归类,并且融入商业分析的要求,对数据进行商业加工。例如可以将客户按照年龄区间分为学生,青年,中青年,中年,中老年,老年等人生阶段。源于各人生阶段的金融服务需求不同,在寻找目标客户时,可以通过人生阶段进行目标客户定位。企业可以利用客户的收入、学历、资产等情况将客户分为低、中、高端客户,并依据其金融服务需求,提供不同的金融服务。可以参考其金融消费记录和资产信息,以及交易产品,购买的产品,将客户消费特征进行定性描述,区分出电商客户,理财客户,保险客户,稳健投资客户,激进投资客户,餐饮客户,旅游客户,高端客户,公务员客户等。利用外部的数据可以将定性客户的兴趣爱好,例如户外爱好者,奢侈品爱好者,科技产品发烧友,摄影爱好者,高端汽车需求者等信息。

将定量信息归纳为定性信息,并依据业务需求进行标签化,有助于金融企业找到目标客户,并且了解客户的潜在需求,为金融行业的产品找到目标客户,进行精准营销,降低营销成本,提高产品转化率。另外金融企业还可以依据客户的消费特征、兴趣爱好、社交信息及时为客户推荐产品,设计产品,优化产品流程。提高产品销售的活跃率,帮助金融企业更好地为客户设计产品。

4)依据业务需求引入外部数据

利用数据进行画像目的主要时为业务场景提供数据支持,包括寻找到产品的目标客户和触达客户。金融企业自身的数据不足以了解客户的消费特征、兴趣爱好、社交信息。

金融企业可以引入外部信息来丰富客户画像信息,例如引入银联和电商的信息来丰富消费特征信息,引入移动大数据的位置信息来丰富客户的兴趣爱好信息,引入外部厂商的数据来丰富社交信息等。

外部信息的纬度较多,内容也很丰富,但是如何引入外部信息是一项具有挑战的工作。外部信息在引入时需要考虑几个问题,分别是外部数据的覆盖里,如何和内部数据打通,和内部信息的匹配率,以及信息的相关程度,还有数据的鲜活度,这些都是引入外部信息的主要考虑纬度。外部数据鱼龙混杂,数据的合规性也是金融企业在引入外部数据时的一个重要考虑,敏感的信息例如手机号、家庭住址、身份证号在引入或匹配时都应该注意隐私问题,基本的原则是不进行数据交换,可以进行数据匹配和验证。

外部数据不会集中在某一家,需要金融企业花费大量时间进行寻找。外部数据和内部数据的打通是个很复杂的问题,手机号/设备号/身份证号的MD5数值匹配是一种好的方法,不涉及隐私数据的交换,可以进行唯一匹配。依据行业内部的经验,没有一家企业外部数据可以满足企业要求,外部数据的引入需要多方面数据。一般情况下,数据覆盖率达到70%以上,就是一个非常高的覆盖率。覆盖率达到20%以上就可以进行商业应用了。

金融行业外部数据源较好合作方有银联、芝麻信用、运营商、中航信、腾云天下、腾讯、微博、前海征信,各大电商平台等。市场上数据提供商已经很多,并且数据质量都不错,需要金融行业一家一家去挖掘,或者委托一个厂商代理引入也可以。独立第三方帮助金融行业引入外部数据可以降低数据交易成本,同时也可以降低数据合规风险,是一个不错得尝试。另外各大城市和区域的大数据交易平台,也是一个较好的外部数据引入方式。

5)按照业务需求进行筛选客户(DMP的作用)

用户画像主要目的是让金融企业挖掘已有的数据价值,利用数据画像技术寻找到目标客户和客户到潜在需求,进行产品推销和设计改良产品。

用户画像从业务场景出发,实现数据商业变现重要方式。用户画像是数据思维运营过程中到一个重要闭环,帮助金融企业利用数据进行精细化运营和市场营销,以及产品设计。用户画像就是一切以数据商业化运营为中心,以商业场景为中,帮助金融企业深度分析客户,找到目标客户。

DMP(大数据管理平台)在整个用户画像过程中起到了一个数据变现的作用。从技术角度来讲,DMP将画像数据进行标签化,利用机器学习算法来找到相似人群,同业务场景深度结合,筛选出具有价值的数据和客户,定位目标客户,触达客户,对营销效果进行记录和反馈。大数据管理平台DMP过去主要应用在广告行业,在金融行业应用不多,未来会成为数据商业应用的主要平台。

DMP可以帮助信用卡公司筛选出未来一个月可能进行分期付款的客户,电子产品重度购买客户,筛选出金融理财客户,筛选出高端客户(在本行资产很少,但是在他行资产很多),筛选出保障险种,寿险,教育险,车险等客户,筛选出稳健投资人,激进投资人,财富管理等方面等客户,并且可以触达这些客户,提高产品转化率,利用数据进行价值变现。DMP还可以了解客户的消费习惯、兴趣爱好、以及近期需求,为客户定制金融产品和服务,进行跨界营销。利用客户的消费偏好,提高产品转化率,提高用户黏度。

DMP还作为引入外部数据的平台,将外部具有价值的数据引入到金融企业内部,补充用户画像数据,创建不同业务应用场景和商业需求,特别是移动大数据、电商数据、社交数据的应用,可以帮助金融企业来进行数据价值变现,让用户画像离商业应用更加近一些,体现用户画像的商业价值。

用户画像的关键不是360度分析客户,而是为企业带来商业价值,离开了商业价值谈用户画像就是耍流氓。金融企业用户画像项目出发点一定要从业务需求出发,从强相关数据出发,从业务场景应用出发。用户画像的本质就是深度分析客户,掌握具有价值数据,找到目标客户,按照客户需求来定制产品,利用数据实现价值变现。

什么是用户画像?金融行业大数据用户画像实践

什么是用户画像?金融行业大数据用户画像实践

五、金融行业用户画像实践

1)银行用户画像实践介绍

银行具有丰富的交易数据、个人属性数据、消费数据、信用数据和客户数据,用户画像的需求较大。但是缺少社交信息和兴趣爱好信息。

到银行网点来办业务的人年纪偏大,未来消费者主要在网上进行业务办理。银行接触不到客户,无法了解客户需求,缺少触达客户的手段。分析客户、了解客户、找到目标客户、为客户设计其需要的产品,成了银行进行用户画像的主要目的。银行的主要业务需求集中在消费金融、财富管理、融资服务,用户画像要从这几个角度出发,寻找目标客户。

银行的客户数据很丰富,数据类型和总量较多,系统也很多。可以严格遵循用户画像的五大步骤。先利用数据仓库进行数据集中,筛选出强相关信息,对定量信息定性化,生成DMP需要的数据。利用DMP进行基础标签和应用定制,结合业务场景需求,进行目标客户筛选或对用户进行深度分析。同时利用DMP引入外部数据,完善数据场景设计,提高目标客户精准度。找到触达客户的方式,对客户进行营销,并对营销效果进行反馈,衡量数据产品的商业价值。利用反馈数据来修正营销活动和提高ROI。形成市场营销的闭环,实现数据商业价值变现的闭环。另外DMP还可以深度分析客户,依据客户的消费特征、兴趣爱好、社交需求、信用信息来开发设计产品,为金融企业的产品开发提供数据支撑,并为产品销售方式提供场景数据。

简单介绍一些DMP可以做到的数据场景变现。

A:寻找分期客户

利用银联数据+自身数据+信用卡数据,发现信用卡消费超过其月收入的用户,推荐其进行消费分期。

B:寻找高端资产客户

利用银联数据+移动位置数据(别墅/高档小区)+物业费代扣数据+银行自身数据+汽车型号数据,发现在银行资产较少,在其他行资产较多的用户,为其提供高端资产管理服务

C:需找理财客户

利用自身数据(交易+工资)+移动端理财客户端/电商活跃数据。发现客户将工资/资产转到外部,但是电商消费不活跃客户,其互联网理财可能性较大,可以为其提供理财服务,将资金留在本行。

D:寻找境外游客户

利用自身卡消费数据+移动设备位置信息+社交好境外强相关数据(攻略,航线,景点,费用),寻找境外游客户为其提供金融服务。

E:寻找贷款客户:

利用自身数据(人口属性+信用信息)+移动设备位置信息+社交购房/消费强相关信息,寻找即将购车/购房的目标客户,为其提供金融服务(抵押贷款/消费贷款)。

什么是用户画像?金融行业大数据用户画像实践

2)保险行业用户画像实践

保险行业的产品是一个长周期产品,保险客户再次购买保险产品的转化率很高,经营好老客户是保险公司一项重要任务。保险公司内部的交易系统不多,交易方式不是很复杂,数据主要集中在产品系统和交易系统之中,客户关系管理系统中也包含丰富了信息,但是数据集中在很多保险公司还没有完成,数据仓库建设可能需要在用户画像建设前完成。

保险公司主要数据有人口属性信息,信用信息,产品销售信息,客户家人信息。缺少兴趣爱好、消费特征、社交信息等信息。保险产品主要有寿险,车险,保障,财产险,意外险,养老险,旅游险。

保险行业DMP用户画像的业务场景都是围绕保险产品进行的,简单的应用场景可以是。

A:依据自身数据(个人属性)+外部养车App活跃情况,为保险公司找到车险客户

B:依据自身数据(个人属性)+移动设备位置信息—户外运动人群,为保险企业找到商旅人群,推销意外险和保障险。

C:依据自身数据(家人数据)+人生阶段信息,为用户推荐理财保险,寿险,保障保险,养老险,教育险

D:依据自身数据+外部数据,为高端人士提供财产险和寿险

什么是用户画像?金融行业大数据用户画像实践

3)证券行业用户画像

2015年4月13日,一码通实施之后,证券行业面临了互联网证券平台的强力竞争,依据TalkingData发布的金融App排行榜,移动互联网证券App,排名前5位的证券类App,只有一家传统券商华泰证券。排名第一的互联网券商同化顺覆装机量是排名第一传统券商的6倍,前三名的互联券商总体覆盖用户接近6000万用户。用户总数还在不断增加。传统证券行业现在面临的主要挑战是用户交易账户的争夺,证券行业如何增加新用户?如何留住用户?如何提高证券行业用户的活跃?如何提高单个客户的收入?是证券行业主要的业务需求。

证券行业拥有的数据类型有个人属性信息例如用户名称,手机号码,家庭地址,邮件地址等。证券公司还拥有交易用户的资产和交易纪录,同时还拥有用户收益数据,利用这些数据和外部数据,证券公司可以利用数据建立业务场景,筛选目标客户,为用户提供适合的产品,同时提高单个客户收入。

证券公司可以利用用户画像数据来进行产品设计,下面举几个例子,看看用户画像和用户分析来帮助证券公司创造商业价值。

什么是用户画像?金融行业大数据用户画像实践

六、外部数据介绍

金融企业内部数据主要集中在个人属性,信用属性和消费特征上,缺少社交属性和兴趣偏好等信息,这些信息可以通过第三方获得。

社交数据就是客户在社交媒体上发表的言论和行为,可以是评论,文章,图片,甚至可以是表情符号,音频和视频。社交数据可以依靠第三方平台,在社交网站上利用爬虫技术进行获得(Spider)。社交数据的打通是一个挑战,如果能够客户的授权最好,金融企业就可以将社交数据纳入到用户画像之中。社交数据具有实时和反映内心需要的特点,富国银行已经将社交数据作为分析客户需求的一个重要数据纬度。例如如果某一个客户在社交媒体上发表了一个问题,罗马有哪些好玩的地方,金融企业就会推测客户可能近期会有出境游的计划,就会向客户推销一些旅游相关产品。

社交媒体数据正在成为金融企业积极争取获得的数据,除了利用网络爬虫技术到微博上进行数据采集之外,金融企业自身网站上到文本数据采集和呼叫中心(callcenter)纪录的信息都可以进行文本挖掘。通过客户编号,进行打通,将其补充到客户画像之中。社交数据需要通过数据挖掘将其定义为结构化数据,并且同业务场景、客户需求向结合,清晰进行分类。例如将母婴论坛发言活跃的用户定义为潜在教育需求客户,将学生论坛活跃的客户定义为学区房需要客户,将境外自助游论坛上活跃的客户定义为境外旅游客户,将雪球上活跃的客户定义为理财客户等。金融企业完全可以从社交数据中挖掘出客户近期的消费需求,及时进行市场营销和定制产品。

兴趣爱好数据可以借助于移动大数据位置信息获得,客户手机设备的位置轨迹信息可以揭示客户喜欢何种品牌,喜欢吃辣还是吃火锅,客户喜欢旅游还是喜欢宅在家里,客户喜欢看电影还是喜欢运动。客户喜欢中档品牌还是高档品牌,客户喜欢喝茶还是喝咖啡。移动手机上App的安装情况和活动频次一样可以揭示客户的兴趣和爱好。同时移动大数据进行加工之后还可以告诉金融企业,客户近期的需求是买车还是买房。

外部数据引入过程中,金融企业面临的巨大挑战是外部数据的覆盖率,如何打通内外部数据,外部数据同内部客户的匹配率,外部数据同业务的相关度,外部数据的活跃程度等。用户画像平台(DMP)可以通过技术手段将外部数据引入到金融企业内部,建立标准的标签体系,提供灵活的用户画像方式,按照业务场景进行筛选客户。

七、移动大数据的商业价值

移动互联网时代,移动大数据具有较高的商业价值。如果一个用户不喜欢一个App,其不会装在手机上。客户经常使用的App可以推测用户的兴趣爱好和消费偏好。另外移动设备的位置信息可以帮助金融企业了解客户行为轨迹、兴趣爱好、品牌偏好和消费需求。

1)移动App提供一切服务,App可以反映用户喜好

智能手机上安装的App正在代替PC互联网为所有客户提供服务,清晨起床可以看看墨迹天气,了解一下今天的天气情况。出门时可以通过嘀嘀打车来预定出租车,安排出行。或者通过百度地图来了解路况信息,决定进行从哪条路到公司。快到中午时,可以通过饿了吗或者百度外卖预定午餐,如果想出去吃饭可以利用大众点评订餐和买单。中午可以利用携程App预定家庭旅行机票和酒店,还可以将通过App看看理财产品。如果需要看电影,可以通过格瓦拉来预定要电影票,如果需要看医生,可以通过微医网预约医生。晚上可以通过淘宝来购物,通过学习宝来监督子女教育等。可以看出移动App已经可以满足人们大部分生活需要,提供了人们的衣食住行、教育、医疗、旅游、金融等服务。移动App包围了人们的日常生活,成为人们消费的主要场所。

智能手机上App使用的频率,可以代表用户的喜好。例如喜欢理财的客户,其智能手机上一定会安装理财App,并经常使用;母婴人群也会安装和母婴相关的App,频繁使用;商旅人群使用商旅App的频率一定会高于其他移动用户。80后、90后的消费行为将会以移动互联网为主,App的安装和活跃数据更加能够反应出年轻人的消费偏好。

2)智能设备的位置信息,商业价值广大

智能手机设备的位置信息代表了消费者的位置轨迹,这个轨迹可以推测出消费者的消费偏好和习惯。在美国,移动设备位置信息的商业化较为成熟,GPS数据正在帮助很多企业进行数据变现,提高社会运营效率。在中国,移动大数据的商业应用刚刚开始,在房地产业、零售行业、金融行业、市场分析等领域取得了一些效果。移动大数据中的位置信息代表了用户轨迹,商业应用较早。2014年,美国移动设备位置信息的市场规模接近1000亿美金。但中国移动设备位置信息的商业应用才刚刚开始。目前主要的应用在互联网金融的反欺诈领域。

线上的欺诈行为具有较高的隐蔽性,很难识别和侦测。P2P贷款用户很大一部分来源于线上,因此恶意欺诈事件发生在线上的风险远远大于线下。中国的很多数据处于封闭状态,P2P公司在客户真实信息验证方面面临较大的挑战。

移动大数据可以验证P2P客户的居住地点,例如某个客户在利用手机申请贷款时,填写自己居住地是上海。但是P2P企业依据其提供的手机设备信息,发现其过去三个月从来没有居住在上海,这个人提交的信息可能是假信息,发生恶意欺诈的风险较高。移动设备的位置信息可以辨识出设备持有人的居住地点,帮助P2P公司验证贷款申请人的居住地。

借款用户的工作单位是用户还款能力的强相关信息,具有高薪工作的用户,其贷款信用违约率较低。这些客户成为很多贷款平台积极争取的客户,也是恶意欺诈团伙主要假冒的客户。

某个用户在申请贷款时,如果声明自己是工作在上海陆家嘴金融企业的高薪人士,其贷款审批会很快并且额度也会较高。但是P2P公司利用移动大数据,发现这个用户在过去的三个月里面,从来没有出现在陆家嘴,大多数时间在城乡结合处活动,那么这个用户恶意欺诈的可能性就较大。

移动大数据可以帮助P2P公司在一定程度上来验证贷款用户真实工作地点,降低犯罪分子利用高薪工作进行恶意欺诈的风险。

P2P企业可以利用移动设备的位置信息,了解过去3个月用户的行为轨迹。如果某个用户经常在半夜2点出现在酒吧等危险区域,并且经常有飙车行为,这个客户定义成高风险客户的概率就较高。移动App的使用习惯和某些高风险App也可以帮助P2P企业识别出用户的高风险行为。如果用户经常在半夜2点频繁使用App,其成为高风险客户的概率就较大。

移动大数据在预防互联网恶意欺诈和高风险客户识别方面,已经有了成熟的应用场景。前海征信、宜信、聚信立、闪银已经开始利用TalkingData的数据,预防互联网恶意欺诈和识别高风险客户,并取得了较好的效果。移动大数据应用场景正在被逐步挖掘出来,未来移动大数商业应用将更加广阔。

用户画像是大数据商业应用的重要领域,其实并没有多么复杂,只要掌握用户画像的原则和方法,以及实施步骤。结合金融企业的业务场景,用户画像可以帮助金融企业创造商业价值,实现大数据直接变现。

二 : 构建用户画像的目的很简单:了解你 是为了更好的服务你

  有过一次网购经历后,下次登陆该网站,会弹出各种同类型替代商品或者互补商品的推荐;成为某品牌的注册会员,特殊的日子(会员日、生日)经常会收到品牌商发来的通知(祝福)短信或者邮件。

  这一切都是精准化营销的常见套路。

  在互联网大数据时代,得用户者得天下。以庞大的用户数据为依托,构建出一整套完善的用户画像,借助其标签化、信息化、可视化的属性,是企业实现个性化推荐、精准营销强有力的前提基础。

  可见,深入了解用户画像的含义,掌握用户画像的搭建方法,显得尤其重要。

  >>>>用户画像是真实用户的虚拟模型

  关于“用户画像是什么”的问题,最早给出明确定义的是交互设计之父Alan Cooper,他认为:Persona(用户画像)是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。

  敲黑板,划重点:真实、数据、虚拟。

  

 

  如果把真实的用户和虚拟的模型比作隔江相望的两个平行点,数据就是搭建在大江之上,连接起彼此的桥梁。

  企业利用寻找到的目标用户群,挖掘每一个用户的人口属性、行为属性、社交网络、心理特征、兴趣爱好等数据,经过不断叠加、更新,抽象出完整的信息标签,组合并搭建出一个立体的用户虚拟模型,即用户画像。

  给用户“打标签”是用户画像最核心的部分。所谓“标签”,就是浓缩精炼的、带有特定含义的一系列词语,用于描述真实的用户自身带有的属性特征,方便企业做数据的统计分析。

  出于不同的受众群体、不同的企业、不同的目的,给用户打的标签往往各有侧重点,应该具体问题具体看待。

  但是,有些标签适用于所有情况,应该加以理解和掌握。我把常见的标签分成两大类别:相对静止的用户标签以及变化中的用户标签。

  相对应的,由静态标签搭建形成的画像就是2D用户画像;由静态标签+动态标签构建出来的即是3D用户画像。

  1、静态的用户信息标签以及2D用户画像

  人口属性标签是用户最基础的信息要素,通常自成标签,不需要企业过多建模,它构成用户画像的基本框架。

  人口属性包括人的自然属性和社会属性特征:姓名、性别、年龄、身高、体重、职业、地域、受教育程度、婚姻、星座、血型......。自然属性具有先天性,一经形成将一直保持着稳定不变的状态,比如性别、地域、血型;社会属性则是后天形成的,处于相对稳定的状态,比如职业、婚姻。

  心理现象包括心理和个性两大类别,同样具有先天性和后天性。对于企业来说,研究用户的心理现象,特别是需求、动机、价值观三大方面,可以窥探用户注册、使用、购买产品的深层动机;了解用户对产品的功能、服务需求是什么;认清目标用户带有怎样的价值观标签,是一类什么样的群体。

  具体的心理现象属性标签包括但不限于:

  

 

  来源:“心理现象”百度百科

  因为人口属性和心理现象都带有先天的性质,整体处于稳定状态,共同组成用户画像最表面以及最内里的信息素,由此形成稳定的2D用户画像。

  

 

  2D用户画像

  2、动态的用户信息标签以及3D用户画像

  网站行为属性,这里我们主要讨论的是用户在网站内外进行的一系列操作行为。常见的行为包括:搜索、浏览、注册、评论、点赞、收藏、打分、加入购物车、购买、使用优惠券......。

  在不同的时间,不同的场景,这些行为不断发生着变化,它们都属于动态的信息。企业通过捕捉用户的行为数据(浏览次数、是否进行深度评论),可以对用户进行深浅度归类,区分活跃/不活跃用户。

  社交网络行为,是指发生在虚拟的社交软件平台(微博、微信、论坛、社群、贴吧、twitter、Instagram)上面一系列用户行为,包括基本的访问行为(搜索、注册、登陆等)、社交行为(邀请/添加/取关好友、加入群、新建群等)、信息发布行为(添加、发布、删除、留言、分享、收藏等)。

  给用户打上不同的行为标签,可以获取到大量的网络行为数据、网站行为数据、用户内容偏好数据、用户交易数据。这些数据进一步填充了用户信息,与静态的标签一起构成完整的立体用户画像,就是所说的3D用户画像。

  

 

  3D用户画像

  >>>>用户画像的价值

  企业必须在开发和营销中解决好用户需求问题,明确回答“用户是谁——用户需要/喜欢什么——哪些渠道可以接触到用户——哪些是企业的种子用户”。

  更了解你,是为了更好的服务你!可以说,正是企业对用户认知的渴求促生了用户画像。

  用户画像是真实用户的缩影,能够为企业带来不少好处。

  1、指导产品研发以及优化用户体验

  在过去较为传统的生产模式中,企业始终奉行着“生产什么就卖什么给用户”的原则。这种闭门造车的产品开发模式,常常会产生“做出来的东西用户完全不买账”的情况。

  如今,“用户需要什么企业就生产什么”成为主流,众多企业把用户真实的需求摆在了最重要的位置。

  在用户需求为导向的产品研发中,企业通过获取到的大量目标用户数据,进行分析、处理、组合,初步搭建用户画像,做出用户喜好、功能需求统计,从而设计制造更加符合核心需要的新产品,为用户提供更加良好的体验和服务。

  2、实现精准化营销

  精准化营销具有极强的针对性,是企业和用户之间点对点的交互。它不但可以让营销变得更加高效,也能为企业节约成本。

  以做活动为例:商家在做活动时,放弃自有的用户资源转而选择外部渠道,换而言之,就是舍弃自家精准的种子用户而选择了对其品牌一无所知的活动对象,结果以超出预算好几倍的成本获取到新用户。

  这就是不精准所带来的资源浪费。

  包括我前面所提到的,网购后的商品推荐以及品牌商定时定点的节日营销,都是精准营销的成功示范。

  要做到精准营销,数据是最不可缺的存在。以数据为基础,建立用户画像,利用标签,让系统进行智能分组,获得不同类型的目标用户群,针对每一个群体策划并推送针对性的营销。

  3、可以做相关的分类统计

  简单来说,借助用户画像的信息标签,可以计算出诸如“喜欢某类东西的人有多少”、“处在25到30岁年龄段的女性用户占多少”等等。

  4、便于做相关的数据挖掘

  在用户画像数据的基础上,通过关联规则计算,可以由A可以联想到B。

  沃尔玛“啤酒和尿布”的故事就是用户画像关联规则分析的典型例子。

  资料来源:“关联规则”百度百科

  我们认识到用户画像具有的极高价值,下面就来看看该如何搭建用户画像。

  >>>>如何构建用户画像

  用户画像准备阶段——数据的挖掘和收集

  对网站、活动页面进行SDK埋点。即预先设定好想要获取的“事件”,让程序员在前/后端模块使用 Java/Python/PHP/Ruby 语言开发,撰写代码把“事件”埋到相应的页面上,用于追踪和记录的用户的行为,并把实时数据传送到后台数据库或者客户端。

  

 

  所谓“事件”,就是指用户作用于产品、网站页面的一系列行为,由数据收集方(产品经理、运营人员)加以描述,使之成为一个个特定的字段标签。

  我们以“网站购物”为例,为了抓取用户的人口属性和行为轨迹,做SDK埋点之前,先预设用户购物时的可能行为,包括:访问首页、注册登录、搜索商品、浏览商品、价格对比、加入购物车、收藏商品、提交订单、支付订单、使用优惠券、查看订单详情、取消订单、商品评价等。

  把这些行为用程序语言进行描述,嵌入网页或者商品页的相应位置,形成触点,让用户在点击时直接产生网络行为数据(登陆次数、访问时长、激活率、外部触点、社交数据)以及服务内行为数据(浏览路径、页面停留时间、访问深度、唯一页面浏览次数等等)。

  数据反馈到服务器,被存放于后台或者客户端,就是我们所要获取到的用户基础数据。

  然而,在大多数时候,利用埋点获取的基础数据范围较广,用户信息不够精确,无法做更加细化的分类的情况。比如说,只知道用户是个男性,而不知道他是哪个年龄段的男性。

  在这种情况下,为了得到更加详细的,具有区分度的数据,我们可以利用A/B test。

  A/B test就是指把两个或者多个不同的产品/活动/奖品等推送给同一个/批人,然后根据用户作出的选择,获取到进一步的信息数据。

  为了知道男性用户是哪个年龄层的,借助A/B test,我们利用抽奖活动,在奖品页面进行SDK埋点后,分别选了适合20~30岁和30~40岁两种不同年龄段使用的礼品,最后用户选择了前者,于是我们能够得出:这是一位年龄在20~30岁的男性用户。

  以上就是数据的获取方法。有了相关的用户数据,我们下一步就是做数据分析处理——数据建模。

  用户画像成型阶段——数据建模

  1、定性与定量相结合的研究方法

  定性化研究方法就是确定事物的性质,是描述性的;定量化研究方法就是确定对象数量特征、数量关系和数量变化,是可量化的。

  一般来说,定性的方法,在用户画像中,表现为对产品、行为、用户个体的性质和特征作出概括,形成对应的产品标签、行为标签、用户标签。

  定量的方法,则是在定性的基础上,给每一个标签打上特定的权重,最后通过数学公式计算得出总的标签权重,从而形成完整的用户模型。

  所以说,用户画像的数据建模是定性与定量的结合。

  2、数据建模——给标签加上权重

  给用户的行为标签赋予权重。

  用户的行为,我们可以用4w表示: WHO(谁);WHEN(什么时候);WHERE(在哪里);WHAT(做了什么),具体分析如下:

  WHO(谁):定义用户,明确我们的研究对象。主要是用于做用户分类,划分用户群体。网络上的用户识别,包括但不仅限于用户注册的ID、昵称、手机号、邮箱、身份证、微信微博号等等。

  WHEN(时间):这里的时间包含了时间跨度和时间长度两个方面。“时间跨度”是以天为单位计算的时长,指某行为发生到现在间隔了多长时间;“时间长度”则为了标识用户在某一页面的停留时间长短。

  越早发生的行为标签权重越小,越近期权重越大,这就是所谓的“时间衰减因子”。

  WHERE(在哪里):就是指用户发生行为的接触点,里面包含有内容+网址。内容是指用户作用于的对象标签,比如小米手机;网址则指用户行为发生的具体地点,比如小米官方网站。权重是加在网址标签上的,比如买小米手机,在小米官网买权重计为1,,在京东买计为0.8,在淘宝买计为0.7。

  WHAT(做了什么):就是指的用户发生了怎样的行为,根据行为的深入程度添加权重。比如,用户购买了权重计为1,用户收藏了计为0.85,用户仅仅是浏览了计为0.7。

  当上面的单个标签权重确定下来后,就可以利用标签权重公式计算总的用户标签权重:

  标签权重=时间衰减因子×行为权重×网址权重

  举个栗子:A用户今天在小米官网购买了小米手机;B用户七天前在京东浏览了小米手机。

  

 

  由此得出单个用户的标签权重,打上“是否忠诚”的标签。

  通过这种方式对多个用户进行数据建模,就能够更广的覆盖目标用户群,为他们都打上标签,然后按照标签分类:总权重达到0.9以上的被归为忠实用户,ta们都购买了该产品......。这样的一来,企业和商家就能够根据相关信息进行更加精准的营销推广、个性化推荐。

  有关用户画像的介绍到此就告一段落了,鉴于自身能力有限,很多地方表达的不到位或者没有提及,有啥意见或者建议欢迎留言!

  作者:草莓君,广州麦多网络科技有限公司新媒体运营人员,负责运营微信公众号“活动盒子”(huodonghezi_com),致力于做有节操的运营汪、优雅的文案狗,正在努力成长中。

三 : 大数据应用之数据画像建设

大家经常听到一个词,叫做“画像”,结合具体对象就是:“用户画像”、“商品画像”、“产品画像”、“资产画像”……特别是大数据时代下,在实际企业中,利用大数据进行“画像”建设是企业经营的基础,建设企业竞争优势重要的工具之一,当然也是大数据在企业应用最价值重要的场景之一。

去评价一家企业数据化运营程度,或者说数据驱动程度,或者说是否是用“数据说话”。也许尝试问下面几个问题可以进行评估:

1、是否建设了“画像”?

2、“ 画像”体系构建程度,针对什么对象进行了画像。

3、如何应用已经构建好的”画像”,已经构建画像的各种标签与指标。

4、……

画像为什么对企业那么重要,如何进行画像建设,我会后续把相关经验分享给大家,这篇文本更多从一些案例,让大家对于用户画像建设有直接的感觉。

标签是画像建设的基础

画像的建设过程分成下面几部分:

在画像建设中,标签的构建是关键。本文重点来讲数据标签的建设。标签是各类数据指标结合具体的应用/业务场景来构建,如果没有应用场景构建出来的标签往往就很难“落地“。

我们下面讲二个案例来说明数据标签建设过程:

案例一:用户的商品价格偏好标签

某公司的业务团队想要了解用户的消费偏好是怎么样的。当业务团队说我们要构建用户消费偏好画像的时候,往往是指各种场景下用户是如何选择做出选择的,所以需要具体把偏爱画像拆分成几个不同数据标签:

我们以价格偏好为例,也就是说用户的在购物时候偏好于哪个价格带的商品。对于价格带的偏好,构建步骤如下:

取用户历史购买消费记录,统计用户历史购买商品的价格,然后对价格进行区间划分。看用户购买的价格带主要集中在哪个区间中(价格带偏爱应该是一个相对动态的标签,更新频率可能一个月需要定期更,而且选择的时间段也应该是过去某个时间,不应该选择过长时间段。大家想想为什么?)。如何进行价格区间划分?

方法一:按统计学的方法:

1、 按分位数进行。例如:25%,50%,75%

2、 按等箱原则。划分几等分

3、 看数据的分布。

4、 ……

方法二:按业务知识经验

把价格带按业务经验,行业经验进行划分。

通过数据统计出来,我们可以看用户是否商品单价是否集中的某个区间范围内。例如,某用户购买的商品价格主要集中在30到40这个区间内,根据历史显示可以说,用户可能偏好于购买这个价格带的商品。当未来我们需要做促销商品推荐的时候,可以向该用户重点推荐打折后在这个价格区间的商品。

通过用户购买的价格区间,以及结合商品所归属的品类,可以看这个价格区间在这个品类中属于什么级别的。可以进一步给用户打上:注重品牌、注重高性价比等标签。

例如:如果某个品类商品的价格范围是(5,40],该用户购物商品主要集中(30,40]这个商品价格区间,用户在这个品类的消费上都是最高价格区间,说明这个用户在购买这个品类主要购买的高端商品。这样又可以为这个用户打上在这个品类的消费特征标签:品类高端用户。

案例二:用户流失概率标签

我们经常会听说一个数据: “养一个新客户的成本是维护一个老客户成本的5倍?在利润贡献方面,老用户更是新用户的16倍”

当然这个5倍更应该理解为期间,更应该理解为:相对争取一个新客,更应该花时间与精力在维护好一个老客上。为什么呢?(同学们一起思考一下) 做用户运营的同学对于流失用户主要痛点如下:

1、 那如何去给用户打上流失概率的标签?

2、 如何及时更新这个流失概率的标签?

3、 什么时候应该开始需要给流失用户进行营销?

4、 针对不同流失概率的用户是否要设计不一样的策略?

5、 对潜在流失用户,应该设计什么样的策略?

6、 对不同类型流失特征的用户,应该投入的成本多少?

对于老客的维护,首先应该及时知道用户的流失概率多少?随时时间的推移流失概率是否有变动,特别是流失概率高的用户要及时进行营销避免真的流失。

流失概率用大数据中机器学习的方法预测,而且根据用户产生的行为可以实时去计算用户流失概率标签(用户的流失概率应该是动态,是否需要非常高的时效性,还要结合具体开发成本)。通知运营同学根据不同的用户特征,设计好营销策略。当用户满足相应条件时间,会自动促销相应的营销策略,这才是大数据应该有的场景。

我们如何给用户的流失概率打上标签呢?如果你的公司的业务比较稳定,公司的业务有一定周期(这个周期多长,要看你公司的业务模式,是对B还是对C),我们会使用机器学习/数据挖掘的方法来去计算这个概率是比较准确的,如果业务太新,数据积累太少建模型往往不是一个好的选择。

我们还是以电商为案例背景,这个公司的CRM团队,希望知道用户流失的概率,根据流失概率定期对相关的用户进行营销,降低用户的流失率。如何构建这个模型从而打上流失概率标签,主要步骤如下:

业务理解。 与业务沟通分析流失用户特征,用户的生命周期定义。例如:多久没有和公司互动或者交易定义为休眼,多久没有交易认为是流失了。

业务分析。流失用户的可能的原因是什么,根据这些原因,相应去找到或者设计预期指标。例如:如果用户有过差评,流失可能性高。用户经常看到公司商品缺货,流失可能性高。

模型构建。 设计流失用户的预测模型。根据之前的业务流程,业务知识的梳理,围绕用户设计一系列的指标,如下图所示,会从各个方面进行指标清洗,放到模型中建模。

 

本文标题:用户画像数据建模-什么是用户画像?金融行业大数据用户画像实践
本文地址: http://www.61k.com/1076122.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1