中国科技财富 > 创新纪事
分享到:

大数据、大责任

来源: 作者:王郁 2016年02月18日 12:26
[导读] 

大数据以前所未有的速度重塑着各领域的业态与人们的生活方式。我们在促进共享数据、享受大数据带来的价值的同时也要对数据做一定的保护。目前,这些问题在我国从法律、实践层面都在一个摸索的状态。1213上午,中关村大数据日分论坛、清华RONG系列论坛之“大数据大责任高峰论坛”暨清华数据创新基地(清数D-Lab)揭牌仪式在清华大学Fit楼二层报告厅成功举办。北京启迪创业孵化器有限公司董事长张金生、清华大学数据科学研究院执行副院长韩亦舜、清华大数据产业联合会秘书长王霞、清数D-Lab主任邱东晓等嘉宾出席本次活动。

本次RONG论坛特邀大数据治理的有关学者和互联网领导企业代表共聚一堂,共同探讨建立持久良性的大数据发展环境、保护各方权利、增进互相信任的方法,让大数据更好地促进经济,造福社会。本次活动由清华大学数据科学研究院主办,清华数据产业联合会协办,北京腾云天下科技有限公司独家支持。清华RONG系列论坛也将继续针对更多领域展开讨论,值得大家关注。

据悉,清数D-Lab是清华大数据产业联合会与启迪创业孵化器有限公司在清华大学数据科学研究院的支持下联合成立的大数据创新创业平台。基地顺应实施国家大数据战略和“大众创业、万众创新”的号召,汇聚了国内大数据领域最优秀的政产学研用资源。基地的建立旨在引领数据创新、服务创新创业、培育数据人才、促进数据开放和打造数据生态。

 

大数据发展面临三大挑战

“时代在召唤,我们就要负起我们的责任。大数据、大责任。我们的定位或者说使命是助飞大数据产业。这意味着我们的角色是产业的服务员,我们其实是垫脚石、发射台、助推器,我们要服务于学校的教学和科研,也要服务于企业的人才,我们也要服务于公共部门的数据开放和数据创新,清数D-Lab其实是大家的大数据实验室。”清华数据院联合会D-Lab主任邱东晓说到。

讲到具体的工作内容是什么?邱东晓从大数据发展三个挑战说起,人才、数据、技术。“现在普遍大家都认识到大数据人才的缺乏,我认为一方面是因为大数据发展快,人才供不应求。另一方面,培养大数据复合型人才其实是一个复杂的过程。”

他指出,第二个挑战是数据分割。“我们经常听到同一个企业、同一个地方政府的数据不能互通,这里面其实是有政策、标准、技术、人为等各种原因。我们认为数据走向融合有几个阶段,就像现在数据分立的阶段,我们要做好各种数据、各种标准。下一个阶段实际上是部分的数据连接起来,我们要做的是帮助企业的业务创新,要形成局部突破。在这方面希望我们能以实验室的本事,收集更多足以做实验的数据,方便大家在上面做创新、突破。第三个阶段是数据大融合的阶段,这个阶段会导致产业的融合,我们希望这个平台能够在人才输送、横向融合、技术创新,甚至在资本的里面都能给大家做好服务工作。这个数据融合也不是一步到位的事情,实际上我们认为是愚公移山的过程,我们要有这个心理准备。开放和连接是大趋势,这个过程是曲折的,但是胜利是一定的。

第三个挑战在邱东晓看来是技术挑战:“我们经常听到一个说法,大数据技术不是问题,其实主要是为了强调大数据思维。大数据应用,有点像小煤矿,煤矿背着箩筐挖了一矿煤,大数据没什么。实际上不是这样的,有环保、衍生品、质量等问题,甚至还要考虑雾霾的影响。这些说明了大数据实际上是高技术。有院士提出,在分析基础、计算模式、物理算法、判断标准上,大数据还有很多要提高的地方。对此,我们要重点攻关、孵化、推广,从收集、储存、分析、应用,要形成学校和企业的合作,也要引进国外的人才和技术,这样才能够形成一个达到国际领先水平的技术突破。”

邱东晓指出,以上谈到的三点:人才、数据、技术,其实是相互关联的。为企业做好人才和数据的准备,在创新方面就有了基础。他强调要特别指出的是:“这里的创新不单是指技术,我们是提到了技术创新,那是因为技术创新是一个根本性的创新,商业模式或者应用服务模式的创新也是重要的成功因素。打开思路和视野企业才有飞跃,现在比较有影响的企业,某种意义上也是数据服务的提供上,在亿到百亿的规模。因为大数据本身是个工具,要做到千亿级的规模或者更大,要跟传统的产业结合。但是清数D-Lab我们希望能够带来更多的跨界、跨行业的交流,相信在这个过程中,在合作的企业中会有千亿的企业出现,大数据时代一定会带来这样新的企业,这样的整合也一定会发生。所以我们现在就要抱团,现在就要一起成功。”

 

我的数据 你的责任

“我的数据,你的责任。这里说的我不是我个人,而是数据拥有者,你指的是采集人。”清华大学数据科学研究院执行副院长韩亦舜表示,“有人跟我探讨数据的权属怎么定,我觉得数据可以比较简单地划分为跟人无关的数据和跟人有关的数据。比如说自然界的,天气、海啸、地震、石油等,这些跟人没有太多直接关系的数据,谁采集谁就可以拥有。但是跟人有关的数据,谁采集的时候就要注意了,这个数据是我的。”

他指出,我们每天都会遇到各种各样被迫要点的同意,大多数情况下都接受了。如果你拿苹果手机,你愿不愿意把这个屏幕给别人,然后就点同意了。这个背后,当我跟数据采集者之间建立这种关系的时候,我们之间应该有一种契约,我的数据给你是因为你向我提供了特定服务,如果你不加说明、不加处理就把我的数据让给别人,这应该是不合理的,至少不是在我情愿的情况下,这个我们大家都记在心上,采集别人的数据你要想好,你要对别人的数据负责任。

公民数据,政府责任。在韩亦舜看来,所有公民的信息政府应该合理加以利用,现在政府更多地是强调要保障数据安全,但是实际上这个背后蕴藏着很大的,对社会的一种新的不负责任。就是说这些数据不加利用,对我们社会也是有害的。所以怎么样把公民的数据用好是政府的责任。

除此以外,个人的医疗健康信息,他认为我们每一个人应该有一个自己的空间,在这个空间里属于你自己的个人隐私。但是当你走到街上的时候,你还说那个数据你要拥有、有权删掉不一定合理。还有讲到个人的健康数据,我们应该换位思考,每个人当医生的知识、技能叠加在病人的情况下,得到成功或者失败的病例时,其实这是人类的财富,我们不应该以个人的隐私加以拒绝。所以怎么界定什么叫个人的数据?当你在一个私密空间里的时候可以考虑保护你的隐私,但是当你真正走到社会上去的,完全强调个人的隐私而不是你的数据可能会对社会产生的社会价值、对人类的价值时,这样的隐私概念也未尝见得。

在今天“数据满天飞”的时代,韩亦舜建议要严格立法:“编造数据、数据造假这件事是要负法律责任。今天我们在很多地方都有这个情况,政府就说我们的数据就是假的。我觉得数据给我们的机会是让我们把这个世界看得更真,如果有人造假,就是重新干扰我们认知世界的技能,所以不应该允许数据造假,哪怕数据不是那么漂亮,只要真实都是有需要的。相反,漂亮的假数据都一钱不值,而且还影响我们认知世界。提倡每一个人在过手数据时,在自己填写数据时一定要真实才有意义,才有经济意义和社会意义。”

 

数据主权:不可回避的问题

今年8月份,我们出台了促进大数据产业发展行动纲要,表明我们中国政府把大数据提高到国家战略的层面。从国家战略层面的角度来讲,数据怎么治理对我们国家数据主权或者数据强国应该是什么样的意义?

中国国际经济交流中心战略研究部副研究员、《大数据治国战略研究》课题组组长张茉楠博士认为:“从我的理解角度来讲,其实大数据并不单单是一种技术创新,一种科技的文明。其实他从更大的角度来讲,我认为他是对我们人类社会生产方式、生活方式,乃至于整个儿社会治理架构重组。从这个意义来讲,包括现在数据层面上,数据主权已经成为国家新的数据典型代表。另一方面,我觉得在大数据时代,首先要强调价值,价值是我们大数据发展的根本。围绕价值来看,现在的数据革命背后数据主权、数据治理、数据责任以及数据文明与数据伦理问题,我认为是未来我们去创造整个儿社会大数据发展的核心。”张茉楠说,“在这样的情况下,我觉得我们去探讨这些问题本身就义不容辞,肩负着这样一种时代的社会责任。今年《大数据行动纲要》出台之后,包括未来十三五规划当中,数据主权是一个关键词。数据主权更多强调的是权益和归属制,但是我认为更多的是站在人类发展的文明,特别是中国要从原来农业文明、工业文明更好地迈向信息文明,实际上是对文明层次、社会哲学层面上的一种提升。”

不能说的秘密,被张茉楠总结为七大方面的来源。第一个是。第二个是,这是调侃的,更多的是企业在没有真正归属的情况下利用这些数据。第三是。第四是,通过互联王交换来的数据。第五个是。第六是,数据周期让下游去做产业数据。第七个更极端的是,本身没有数据,但是实际上吹大了也有人信,所以从这个角度来讲,我们又回归到责任本身。“大数据时代,我们真正的社会文明是利他主还是利己主?在现在的框架之内,我们要想一个问题,谁拥有、谁监管、谁控制大数据的利用?这样数据归属权的问题,我觉得都是不可回避的。”张茉楠说道。

 

让大数据服务好金融

“在金融行业,其实金融就是一个数据的行业,所有的都是围绕数据来谈的。”在蚂蚁金服副总裁&首席数据科学家漆远看来,从数据衍生出支付、理财、保险、融资、金融云、征信服务等等,这一系列的背后都是基于数据。大数据要真正变成随时随地可及的服务,传统金融有用户,要和很多的网点、ATM、POS机等等打交道,有时间和距离上的限制。今天互联网金融,用互联网的技术、大数据的技术来达到一个低成本、个性化、随时随地可及的服务,真正把用户作为一个中心。

“有一本书专门讲长尾经济。”漆远介绍到,长尾经济在金融上非常明显的反映,传统金融是美国当年立下汗马功劳的一个百年老店发起的,服务的对象主要是中小企业、大型企业,美国的金融行业是非常发达的,但是今天在互联网方向,中国的发展在某种角度比美国还要热,某种角度上是我们占了一个机会,现在的相对银行业还是比较弱的。我们希望更好地服务到以前金融业没有服务到的地方,小微企业、普通个人、中小企业、中产个人,能做到这个背后真正支撑的就是大数据和云计算的技术。

蚂蚁金服集团,已经有超过四亿的支付宝活跃用户,超过四亿的支付宝实名认证用户,80%是无线用户。日交易笔数已经超过了Master card。谈到未来应用,漆远谈到了几个方面。

人工智能上面有大量应用在大数据,否则背后数据不能产生价值。今天的人工智能平台能支撑各种业务,从微贷到信用、理财等等。我们做了超大规模服务器,这个水平能支持百亿特征的公司,全世界没有几家。这是语音识别,今年双11有95%已经自主智能服务了,全是通过智能机器人和知识库的处理等等。风险控制通过大数据智能技术来抓异常风险操作,十万分之一的故障率,远低于世界的业界水平。

蚂蚁微贷是一个真正利用大数据来做的模式,决定给哪个小企业贷款、贷多少钱、什么时候收钱全部通过数据模型做,否则通过银行做,非常缓慢。只能是大企业,否则成本非常高。

90后淘宝卖家大学生毕业第一笔贷款就是拿了淘宝的信用贷款,这是一个真实的故事。阿里巴巴三个战略,国际化、农村化、大数据。农村化就是服务农村,我们向18万的农村小微发放贷款,累计服务5000万农村消费,这个很有意思的,农村上网比城市还多。

保险相对比较传统的行业,今天的大数据给它造成了很大的机会。从各个方面,农业、互联网、车险等。举一个例子是运费险,运费险是一口价,你买了报5%,退货就免费。在阿里巴巴做创新,我们做了一个大数据模型,做完之后,保险变成了真正有竞争力的行业,每年是100%的增长速度,虽然并不大,但是是非常有前途的一个行业。

车险差异化定价,简单来说就是我们希望产生一个新的合作模式,把技术和第三方合作产生新的产品。另外一个例子就是淘金100指数,我们和聚源、中证、博时合作,发布首个电商大数据指数基金。美国可以把各个行业区做出发展形图,我们完成了这个工作的创新。

大数据智能,一个新的世界正在打开。今天从技术角度来讲,从数据的使用方、加工、提供方,怎么保护隐私、数据安全等等,但是融合起来,我们要产生更好的技术产生更好的服务于用户。

 

点击下载:
[责任编辑:中国科技财富]
分享到:

相关阅读:

网友评论表达个人看法,并不表明本网同意其观点或证实其描述。

验证码:

验证码
TEL:010-58884150 010-58884151 E-Mail:webmaster@fortuneworld.com.cn 如果您有任何意见或建议,请联系我们!
版权所有:中国科技财富 京ICP备05061179号-1
中国科技财富 版权所有