大数据掘金边界在哪

交易过程中新问题显现万亿级市场迎最严监管

齐鲁晚报     2019年12月28日

  12月11日,由山东产权交易中心、齐鲁交通信息集团有限公司、中国联通山东分公司、上海数据交易中心、山东乾云等5家机构发起成立了山东数据交易有限公司。这家国企打头阵的地方性大数据交易平台恰恰诞生在号称最严监管时代到来的2019年。一场大数据行业诞生以来最大规模“地震”正在发生,那么,到底哪些数据可以买卖?

  齐鲁晚报·齐鲁壹点
记者 蔡宇丹

行业法律法规模糊
不少公司撞线式经营

  汽车厂商在车上装传感器,车主开车时,行车数据回传厂商。数据显示,驾驶员有不良开车习惯。汽车厂商把这些数据卖给保险公司,保险公司据此给车主增加保费。
  “你怎么知道我开车习惯不好?谁告诉你的?!”车主一句反问,就把这个听起来很酷的大数据商业模式“呛死”了。
  不经车主二次授权,汽车厂商凭什么把行车数据卖给保险公司?就是因为大数据商业价值太大!
  全球最著名的投资银行高盛,每年大概要花4亿美元从第三方购买数据,这其中包括全球各地电视台的字幕提要等。 
  上海数据交易中心承建大数据流通与交易技术国家工程实验室,其《数据流通禁止清单》画出的“边界线”。
  不能流通的个人数据有:未经个人授权,可直接识别到特定个人的身份数据、个人敏感数据、特定个人财产数据严禁流通,包括公民身份证号码、社保号、驾驶证、护照/台胞证等有效证件号码;电话、微信、QQ等即时通信账号、E-mail地址;个人姓名、民族、出生日期或年龄、本人相片;婚姻状况、工作单位、学历、履历等个人数据等等。
  贵阳大数据交易所的交易规则第一条就是:用于交易的数据不是底层数据,而是数据清洗、建模、分析的数据结果。
  “目前,这个行业的法律法规很模糊,很多公司都是撞线式经营。”曾任华为大数据业务总监,现为国内大数据公益组织中国首席数据官联盟创始人刘冬冬说。
  今年以来多家P2P平台和催收公司被查,这些P2P公司给个人贷款时的风控数据从哪来?催收公司手中掌握的欠债人社会关系图谱又从何而来?
  在多个省份展开全部取缔P2P网贷的行动时,公信宝、天翼征信等多家爬虫公司、大数据公司被查或被列入警方调查名单。来自警方的行动已经给公众勾画出一条大数据交易的灰色产业链,这个市场上的正规玩家却生意寥寥。
正规军生意寥寥
黑市隐现万亿市场

  贵阳大数据交易所是中国首家大数据交易所,成立于2015年4月,挂牌之初预计未来3到5年日交易额突破100亿元,其第一笔交易卖方为腾讯及广东省数字广东研究院,买方分别为京东云平台、中金数据系统有限公司。
  贵阳大数据交易所官网信息显示,这家交易所目前可交易数据产品数量突破4000个,涵盖数据源、模型算法、数据安全等八大类,涉及金融、电信、卫星、农业等30多个领域,成交量前三的是金融数据、行为数据、企业数据。
  公开报道显示,贵阳大数据交易所2015年交易额不到1000万元;截至2016年9月1日交易额累积突破1亿元;2019年5月交易额累计超过4亿元,这与挂牌时预期的“日交易额突破100亿元,形成一个万亿市场”相差太大。
  记者从天眼查查询到,截至今年6月,全国工商注册了28家大数据交易中心。此次山东数据交易有限公司成立,与之结盟的上海、青岛、江苏、安徽四大数据交易中心都是“国字头”。贵阳大数据交易所、上海数据交易中心、数据宝、武汉东湖、钱塘数据等几个市场知名的大数据交易公司均为国有控股。
  由于交易中心挂牌必须金融办审批,且接受严格监管,很多业务不能从事,这就形成了一个反差——“国字头”交易不活跃,而地下黑市交易正在形成一个隐形的万亿市场。
  “大数据交易是否合法,判断标准有两条,来源是否合规,使用是否合规。”浪潮云总裁肖雪说,现在最大问题就是在未授权情况下超越权限使用数据。
坐拥“数据金矿”
互联网巨头如履薄冰

  2018年5月,欧洲实施号称史上最严网络数据管理法规《通用数据保护条例》(简称GDPR),对个人信息保护覆盖了收集、记录、存储、修改、使用、传播等与个人数据有关的几乎所有环节。
  GDPR尤其强调个人用户“知情权”,使用时必须事先征得数据主体同意,这个“同意”必须是具体的、清晰的。今年1月,谷歌被法国数据保护监管机构罚款5000万欧元,因其在注册页面将用户“同意”选项设定为“全局默认设置”,其中包括“个性化广告”选项,用户只有勾选所有协议后才能注册,监管机构认为谷歌有“强制同意”嫌疑。
  而在中国,类似事情司空见惯。
  “像个人手机里的通讯录,搞旅游的APP,搞餐饮的,打车软件,都要求获取你的通讯录权限,只要勾选了,社交关系就被掌握了;不勾选,基本上没法用这个APP,相当于是一个强绑定关系。”一位业内人士告诉记者。
  2017年12月,齐鲁晚报·齐鲁壹点记者在参加2017中国(济南)新金融高峰论坛时,论坛嘉宾、时任小米金融首席风控官、小米信贷业务负责人陈曦说,小米金融的特征库一共六层1400个类别。所有数据都集中在小米云平台上,比如个人基本信息,偏好、金融基本属性、社会关系挖掘等,利用这些平台收集起来的信息,能够对客户做一个清晰画像。
  这也意味着,凭着这1400多个维度,只要一个身份证号,就能知道你所有信息。
  但陈曦在现场一直强调,对于数据和隐私的保护是小米最核心的一点。小米大数据平台所用数据全部隐含掉所有个人信息。
  这个论坛请来的另一位嘉宾、时任京东金融副总裁周宇航在演讲中透露,京东金融通过标签进行用户画像识别,每个用户差不多有3万以上的标签。
  坐拥“数据金矿”的互联网巨头,其实如履薄冰。2018年4月,Facebook陷入隐私泄露丑闻,扎克伯格在美国国会接受长达10小时质询,最终道歉。
在流通交易领域探索
数据可用不可见

  天眼查数据显示,目前山东省内从事数据交易的公司有一百多家,大数据交易中心有5家,包括青岛大数据交易中心、山东省先行大数据交易中心、山东省新动能大数据交易中心等。
  国内领先的大数据交易平台浪潮旗下的天元数据网,数据供应商有1000多家,会集用户2万+,重点聚焦产业创新。
  目前,浪潮还承建大数据流通与交易技术国家工程实验室,在探索商品标准化、数据交易定价、交易规则,数据交易保障等进行了不少探索。通过“数据铁笼”技术,让数据可用不可见,以保障数据安全和隐私。
  以浪潮的“一贷通”业务为例,王先生要贷款,授权浪潮使用其个人数据做风险评估,王先生的社保数据属于政务大数据,由政府监管,浪潮还需再次获取政府授权方能使用。银行要给王先生放贷,付费使用浪潮提供的针对王先生的大数据风控服务。
  浪潮正在挖掘的健康医疗大数据,更是一座“钻石矿”。
  目前,浪潮和德华安固、太平洋等保险公司签订了战略协议。浪潮做这件事经过了层层授权:第一,政府授权,同意浪潮从事和健康医疗大数据有关的运营;第二,涉及个人隐私的必须有个人授权。在买保险时,投保人会签协议,授权保险公司查询其个人医疗信息。
  最终,浪潮提交给保险公司的,是根据个人健康医疗大数据分析后得出的可否成保的核保服务而非个人原始数据,这还是体现了保护用户“个人识别信息”的重要逻辑“可用,但不可见”。
  而事实上,大数据的真正核心价值也并不在于数据本身,而在于大量数据连接整合后挖掘出的价值。
最严监管时代到来
考验监管者的智慧

  “大数据交易还面临很多政策、产业问题。”浪潮集团大数据公司副总经理姚民伟对齐鲁晚报·齐鲁壹点记者说,在大数据交易上有些基本问题没有解决,做得越大,政策风险和业务风险就会加大。
  比如说,下载某个电商APP时,在用户协议勾选“同意”,平台收集用户的消费大数据,分析用户的购物倾向,向用户推荐“猜你喜欢”。那平台通过推送获取广告收益,是不是该分给用户一点?
  值得庆幸的是,不少乱象也正在被规范。2017年,《网络安全法》开始施行,非法获取、出售公民个人信息最低五十条以上即可认定为“情节严重”,达到入刑标准。12月4日,国家网络安全通报中心发文通报下架整改100款违法违规APP,整改重点针对无隐私协议、收集使用个人信息范围描述不清、超范围采集个人信息和非必要采集个人信息等情形。
  物联网数据、工业大数据如何定价交易?按照GDPR规定,通过传感器从物联网设备中收集数据,同样不能免除约束。有媒体报道称,海尔、华为等在欧洲有较大市场份额并有意进军物联网的制造业领军者,已雇请专门团队应对GDPR。
  如何用好大数据这把双刃剑?随着最严监管时代到来,大数据交易领域出现的新问题,正考验监管者的智慧。“大数据交易,一收就死,一放就泛滥。如何用好大数据,这可能是一个漫长的过程。”肖雪说。



上一篇 下一篇