首页 | 保险时讯 | 保险专题 | 资料中心 | 百姓保险 | 产品大全 | 人才市场 | 黄页 | 博客 | 论坛 | 咨询 | 投诉 | 导航
返回中国保险网首页 中国保险网广告位
    您所在的位置:中国保险网 > 保险时讯 > 人物特写 > 正文

王和:数据变迁将引发保险变革

[ 2015年7月8日10:42 ]   来源:[ 和讯保险 ] 王和   双击自动滚频 
[字体: ] [打印本页] [关闭窗口]
    面向未来,保险业需要就大数据时代的“数据变迁”做一个全新的思考。大数法则决定了保险业的“数据宿命”,保险是一个与数据休戚相关的行业。大数据时代将重新改写人们对数据的认识,甚至是数据自身。因为,即使一个“数据”本身,它也是多维的,也还可以分拆,在分拆的过程中,会造就无限的商机。从信息到数据,从数据到数据颗粒,这一系列的变化,是科技发展的必然,也是社会变革的驱动力,同时,也将对保险理论和技术形成绝对挑战。

  从“抽样”到“全量”

  传统统计学研究的一个重要基础是抽样调查,通过抽样调查得到一定的样本数据,并以此作为分析的基础。但抽样调查存在两大限制和缺陷。一是视角,做问卷调查,需要设计调查问卷,而问卷设计本身,是带有主观色彩的,即先设定哪些领域会存在哪些问题,并据此设计出相应的问卷问题,这实际上是由过去的知识体系决定的。然而,过去的知识体系并一定不代表着调查对象的客观和全貌,所以,抽样调查的样本本身就可能存在一定的局限性。二是样本量,在抽样调查过程中,样本量总是有限的。如果样本总量是有限的,从对象的角度看,其随机性和代表性都值得商榷。比如,街头的问卷调查,就受到一定的局限,一定是有些群体懒得搭理你,而有些群体就很喜欢跟你聊。这就意味着受调查的基本上是相对有闲的人,或比较热心公益的人,所以,调查结果至少没有代表那些拒绝的人。另外,在市场化环境下,抽样调查也受到人们质疑,特别是在委托调查公司做抽样调查时,它的报价主要依据是调查的样本量,不少调查公司从竞争和成本的角度出发,最终只能在实际样本上“做文章”。所以,从抽样调查的样本量看,也存在一定的限制条件。

  大数据时代带来的重要变化主要有两个:一是“数字社会主义”,另一是“数位人生”,即整个社会都被数字化了,每个人也被数字化了。全面数字化的信息和无处不在的感应终端,将彻底改变传统数据获取的可能性和效率。更重要的是信息的数据化是与生俱来,这种数字化趋势将会产生两个结果:一个是这种数据(信息)很客观,第二它是全量数字,这大大降低人为和主观的干预因素,为计量科学创造一个无限的想象空间和实现的可能性,也将彻底改变统计的存在和实现方式。最典型的应用将出现在人口普查领域,以前做一次人口普查非常不易,人力资源投入大,周期长,且成本高。但大数据时代,很多调查和统计分析方式将发生质的变化,都将彻底改变人口普查的方法,继而改变管理模式。再比如,我国每年大约有70亿人次门诊量,现在这些门诊信息均逐步地被数字化了,这意味着将彻底改变医疗诊断、流行病管理、药理学、健康管理等领域,也将彻底改变统计和精算的基础。可以预见,从抽样数据到全量数据,将引发统计、精算,乃至整个社会管理的巨大变化。

  从结构到非结构

  数据主要分为两类:一是结构数据,二是非结构数据,还有一种叫半结构数据。从处理的角度看,结构数据相对简单,目前对于结构数据处理的技术相对成熟。另一种是非结构数据,如音频、视频、图像等。长期以来,在整个社会的数据中结构数据的占比达到95%以上,非结构数据非常少。但近年来,特别是面向未来,非结构数据将呈现井喷式的发展,占比将大幅度并急剧提升。但是,带来的问题是未来需要我们更多地管理和处理非结构数据,既是一个挑战,更是一个商机。如在理赔过程中,未来图像比对技术将成为理赔的一项技术,在查勘时,可以通过拍照,甚至是做一个三维图像,与原厂配件的数据做一个比对,就知道受损的面积多大,大概修复费用是多少。同时,图像比对技术还会在更大的范围进行应用,如用声音波纹比对、瞳孔比对,耳朵比对等等,进行被保险人的身份识别等,在保险领域具有非常广泛的应用前景。这些均属于非结构数据的管理和处理能力范畴。所以,非结构数据的管理和处理能力将成为未来保险业创新主要动力,行业需要高度关注。

  从质量到数量、维度

  过去是一个数据有限时代,能够获取数据的数量是有限的,维度就更少。在数据有限时代,人们更多地关注数据质量问题,保险公司很重要的一项工作就是抓数据质量,而数据质量一直是挺纠结的问题,原因是数据质量问题是说的容易,做起来非常难。但面向未来,在数据化、物联网、感应终端大量应用的情况下,数据将呈现“指数级”增长的趋势,数据在量上会极大的丰富,从而出现一个现象,即数据的自验证能力。当数据量大到足够产生自验证能力时,就会降低对数据质量的要求。我们可以在日常生活中找到这样的例子,当描述一个对象“点”的数量足够大的时,尽管单个点不是那么清晰,但从大的轮廓和面上看,对象是清晰的。

  除了数据的“量”和“质”的关系外,还要看到一个问题,无处不在的感应终端能够使数据的维度极大地丰富,从而使得对于对象的描述更加多维并丰满。原来更多是从一个维度去看,从一个平面去看的问题。当数据的维度不断丰富的时候,就可以从N个维度去观察对象,不仅看到正面,还可以看到背面和侧面等,且还可以实时地观察。这使得很多在传统数据环境下,原本不可能的实现的“对象刻画”成为可能。数据的实时获取、数据维度的丰富。而且是实时丰富,将给数据利用和创新带来巨大的想象空间。但与此同时,也会带来数据的“超高维”问题,挑战传统统计学的基础。

  在数据从质量到数量,到维度的时代,保险将面临从原来利用大数法则做归因分析的思维模式,向未来利用多维定律进行关系分析的思维模式,从几何学的角度看,就是通过多点进行定位的方法。从风险分析的角度看,以往更多的是用一种纵向的思维去看风险,如一个人,是通过对他家族史的风险分析,据此来判断他的性格以及各种各样风险因素,但直观地看,这个方法是很不科学的。未来,不仅可以利用这个人的历史数据,而且,这种数据是多维和实时的,这种多维包括通过其环境数据,他周边人对他的描述,就能够更加客观和科学地对其风险状况进行分析。这就是从质量到数量,到维度,带来的数据变迁。

  从内部到外部

  传统保险业的经营,更多地关注内部数据,包括公司数据和行业数据。但这些数据在解释风险时,是非常有限的。就车险而言,利用承保和理赔中提取的数据非常有限,是难以支撑科学和精细的灾因分析。

  车险经营将从保额定价过渡到车型定价,对保险业而言,是一个很大的挑战。在保额定价时代,基本逻辑是车价相同的车,风险保费是相同的。不久前,保险行业协会发布了一个关于汽车“零整比”的研究报告,告诉了所有人,特别是汽车消费者,不同品牌车辆的零整比最高甚至达到了12.7倍,报告从基础层面支持了车型定价的必要性。但即使采用了车型定价,那么,不同人的风险情况一样吗?在解决了“从车因素”后,下一步要将“从人因素”和“从用因素”纳入定价。就“从人因素”而言,现在是相对简单和粗放的,仅考虑性别、职业、年龄等等。但如果这些因素均相同的人,他们的开车风险能一样吗?答案显然是否定的。一个人可能刚刚拿驾照一年,且性格暴躁,另一个人拿驾照十年了,性格稳重平和,他们两个人开车能一样吗?所以,我们有一个基本的判断,无论是在趋势判断,还是在风险预测和解释上,行业内部数据均是非常有限的,甚至是不足的。所以,需要更多地关注和利用外部数据。比如,现在使用的生命表,或者现在的健康保险定价技术,更多地是基于有限的赔付数据,许多还是N年前的历史数据,怎么能够解释风险。我国每年有大约70亿人次的门诊量,还有大量类似数量级的社会数据。如果能够获得这些数据,无疑将彻底地改变保险经营最根本、最基础的东西。所以,以前更多地依赖于内部数据,未来会更多地依赖于外部数据,而能否获取充足的外部数据,将成为保险经营管理的重要能力。

  从历史到实时

  以往,保险更多是利用历史数据,而且数据的使用、处理都有一个较长的周期。如生命表编制,通常要用很长的时间。这种时滞的存在,越来越挑战对于风险的判断。更重要的是,过去的数据是过去的环境成就的,未来的情况将由未来的环境决定,简单地用过去预测未来面临巨大挑战。当然,原来没办法,只能利用历史数据。但是,现在人们可以获取大量的实时数据,就给了我们无限的想象空间,如能否建立一个动态生命表平台。另外,实时数据也面临着验证和稳定性的问题,同时还面临着对于数据应用的取舍问题,这些都是未来数据应用中面临的新挑战。总而言之,我们将从更多地依赖于历史数据,走向更多地依赖实时数据,同时在依赖和使用实时数据的过程中,也面临着新的挑战。

  从拥有到知道

  传统的数据管理以及保险精算,都希望更多地获取数据,要先建立一个数据库,具备一定的存储能力、计算能力等。通过先建立自己的数据资源池,然后,把所有的数据放到这个池里,进行处理和管理。但未来行业的数据与社会的数据相比,可能只是“九牛一毛”,保险经营会越来越多地依赖社会数据,而社会数据是一个海量数据,无论是从可能性,还是经济性看,都不能再拥有这些数据。所以,未来的数据管理,要遵循“不求所有,但知所在”的原则,你不可能拥有这些数据,关键和核心能力是必须知道有哪些社会数据,这些数据在哪里,通过哪些通道能够获取这些数据。不必将所有的数据都拿到本地,即使都拿来了,明天又更新了,所以,这是数据管理理念的一个非常重要的转变。

  从标准到语义

  在传统的数据管理中,建立统一的数据标准非常重要,如每一个员工都有一个16位或18位代码,必须按照这个代码录入才行,否则,系统就无法识别。但未来使用更多的是外部数据,是社会的海量数据,就不可能要求这些外部数据都按照公司,或者行业的标准进行区分。

  那么,怎么解决这个问题呢?未来将进入一个“后标准”时代,或者是语义时代。语义时代的关键,是在一个语义环境下定义每个字节。给大家举一个最简单的例子——苹果。从传统“标准”思维看,“苹果”有至少两个代码标准,一个是“苹果1”,一个是“苹果2”,“苹果1”是指水果,“苹果2”是手机,不然输入到电脑里,就无法辨别到底是手机,还是水果。但在语义时代,当输入一个词语,语义技术通过语境,就能够判断其准确的寓意,正如人们的日常交流说话时,肯定不会产生这样误解,因为,有一个交流的语境存在。未来,这种语义分析技能,将成为数据管理的入门级要求,因为,这是利用社会数据的基本功。

  从满足到追随

  传统的数据管理和处理是先建立一定的数据处理能力,然后,将数据从各个地方提取过来,通过计算中心集中处理,并提交一个结果。所以,在这种模式下,必然会涉及到数据采集、去哪里采集、数据迁移,以及数据存储等一系列问题。然而,这种模式在未来将面临着很大的挑战,不仅是计算效率受到挑战,而且实现可能性也受到挑战。因为,你不可能把那么多的数据都拿来,也没有必要。因此,未来“数”和“算”的位置会发生反转。原来,是数据追随和服从计算,而未来计算会倒过来追随和服从数据,即数据在哪里,计算就追随到哪里,在数据所在地进行计算,然后,把计算的结果传回来。

  这是未来关于“数”和“算”的解决方案,这又是一种挑战。这几年大家都在讲大集中,当我们把所有的数据都集中在一起,你会发现其中大量的数据实际上是没有用的。所以,一家公司的数据像一个金字塔,数据管理就像在金字塔中间打一个“井”,把最重要的核心数据管起来就可以了,很多边缘的数据不需要把它集中起来,因为,它们只需要本地计算,因为,集中也需要成本。

  从数据到可视化

  未来的数据展示将走向可视化,以前都是看报表,现在看到的更多是仪表盘一类的可视化展示,这也是数据的一个重要变化,即可视化。可视化技术在未来的应用具有广阔的前景,尤其对于数据管理人员、精算人员等,数据展现将更加直观、生动、具象,视觉传递效果更佳。以前表述一组数据,需要大量的解释说明,如果用一个饼图、柱状图,一看就明白了。面向未来,数据的可视化形式的转变,将为保险经营过程中的内部管理和外部客户沟通提供很大的改进和完善空间。

  从高成本到接近免费

  最后,也是非常重要的转变,就是数据从高成本到接近于免费。从传统思维看,数据的获取是需要代价的,天下没有免费的午餐,任何一个数据获得都是有成本的。不管是做市场调查,还是去外部去购买数据,都是要花钱的,就是内部数据也不是免费的,无论是从录入,到处理、传输和存储,都是有成本的。但在互联网和大数据时代,数据如同空气般的存在于整个社会,而且,许多数据是“与生俱来”的。同时,各国政府也在推动数据,特别是公共部门的数据向社会开放。奥巴马一任时就说,在他任期内,要推动公共数据开放到20%。为什么?因为,公共数据、社会数据的开放,会带动整个社会的创新,数据开放产生的创新推动力是难以想像的。

  很多人有奇思妙想,就是得不到数据的验证和支持。如果把这些数据都开放的话,那么,人们就会通过这些数据发现很多的改进空间和价值洼地。面向未来,数据可以是免费的,当然也不是必然和全部是免费的,至少越来越多的数据可以是免费的,或者说是趋于免费的,这将大大降低利用数据进行创新的门槛,也包括保险精算。所以,我认为,未来数据获取和利用能力,将成为决定企业经营、成本和创新的一个重要因素。因此,获取数据,特别是免费获取数据将成为企业的关键能力。

  作者简介:王和,中国人民财产保险股份有限公司执行董事、副总裁。  
    打印本页  [关闭窗口]  
相关新闻:
· 没有相关文章.
保险秘书
行业资讯
企业资讯
监管动态
基层信息
保险人物

Copyright © 1997-2024 China-Insurance Corporation, All Rights Reserved

本网凡所涉及保险条款的内容仅供参考,并均以投保当时的保险合同为准。

企业资讯 | 汽车 | 科技 | 消费 | 教育 | 房产 | 游戏 | 商机 | 聚焦百姓 | 配资 | 人物特写 | 曝光台 | 保险股 | 保险理财 | 行业资讯 | 海外动态 | 中介园地 | 保险数据 | 保险案例 | 车险资讯 | 社保资讯 | 产品速递 | 财经新闻 | 保险评述 |