数极客首页

大数据漫谈(四) — 数据应用

一个字“活”概括了智能商业与传统商业的本质区别,数据是“活”的,因在线而实时,以记录而全本,用户的每一次行为都转化为新的数据汇入数据的大海,而每一个新数据的汇入都实时引发各个数据集的连锁反应。

——曾教授

讲了这么多的大数据相关定义与相关技术了,那大数据怎么转变为商业价值呢,这又是一个大的话题。阿里在大数据的应用上,最早的提出了存、通、用三个概念,而现在大数据应用更多是在谈数据反馈闭环。根据数据反馈闭环,我们又把数据使用分成如下几个层面来描述:

一、数据化所谓存,其实就是大数据的采集与存储,必须先有数据,其实前几篇已经介绍过了。很多时候,如果我们连数据都没有,大数据只能是空中楼阁。所以,一个想要做大数据的企业,必须先想办法拥有数据,或者采集、爬取、购买数据。

关于通,前面也讲过了,主要是两个层面的问题:

1是指数据的互通,比如一个企业内部存在很多信息孤岛,信息孤岛之间必须打通,形成统一的大数据平台。关于通,最好的办法其实就是企业建立一个统一的大数据平台,不管这个大数据平台是基于私有云(如Hadoop生态的解决方案),还是基于公共云(如阿里云数加的解决方案),当所有的数据上传到这个大数据平台,数据天然就打通了。

2是数据的标准,如果想让不同的数据源可以相互关联,形成更大的效应,就跟我在上文讲到的一样,就得有数据标准。如上文所言,数据标准不仅仅可以指导ETL过程中的数据清洗,数据校验,好的数据标准还可以使得无线的数据跟PC的数据相互关联互通,甚至企业之间的数据关联互通。

这些过程,我们可以把它叫做数据化的过程,也就是大数据的基本要素 — 数据的形成。

二、算法用,就是大数据的加工使用,指采用数据科技的相关技术,对大数据进行加工,分析,并最终创造商业价值的过程。这个过程中,最核心就是算法。我们提到算法时,往往也会谈到引擎,仅仅提引擎一词,更多想到的可能是汽车的发动机。汽车引擎不管多复杂,其实输入输出是很简单的,需要的是汽油+空气,输出动力(汽油的能量)。大数据的引擎可能是一组算法的封装,数据就是输入的汽油,通过引擎的转换,输出数据中的能量,提供给更上层的数据产品或者服务,从而产生商业价值。

算法也是“机器学习”的核心,机器学习又是”人工智能“的核心,是使计算机具有智能的根本途径。在过去十年,机器学习促成了无人驾驶车、高效语音识别、精确网络搜索及人类基因组认知的大力发展。

如果你不去利用数据,世界上的数据就不会有用。算法其实指的是如何在业务过程中有效拓展人为管理,利用数据。

从根本上来说,数据是不会说话的,只有数据没有任何价值。如果拥有大量的数据,而不知道怎么使用?,阿里曾经做过一个比喻,“坐在金山上啃馒头”。大数据真正的价值在算法,算法决定行动。在不远的未来,“所有业务都将成为算法业务”,算法才是真正价值所在,世界上所有大规模的东西都将被数据和算法所管理。

DT时代的智能商业对算法提出了全新的要求:算法的迭代方向、参数工程等等,都必须与商业逻辑、机制设计、甚至是价值观取向融合为一。当算法迭代优化时,决定其方向的不仅是数据和机器本身的特性,更包含了我们对商业本质的理解、对人性的洞察和创造未来商业新样貌的理想。 这就是我们称算法为智能商业的“引擎”而非“工具”的关键理由,它是智能的核心。 基于数据和算法,完成“机器学习”,实现“人工智能”。

三、数据产品(或数据应用)把用户,数据和算法巧妙地连接起来的,是数据产品(或数据应用),这也是互联网时代特别强调产品重要性的根本原因。因此,智能商业的成功,最关键的一步往往是一个极富想象力的创新产品,针对某个用户问题,定义了全新的用户体验方式,同时启动了数据智能的引擎,持续提升用户体验。

智能化数据产品的要求是非常高的,不仅仅是与最终用户形成个性化,智能化的交互,有完好的用户体验与突破的技术创新之外,最重要的,同时需要再次记录数据,使得用户反馈的闭环得以发生。

整个过程是自动的、智能的、可学习提升的,它是大数据时代的灵魂,是智能商业的根基。智能商业的核心特征就是能主动地了解用户,通过学习不断提升用户体验。智能商业的成功,最关键的一步往往是一个极富想象力的创新产品,针对某个用户问题,定义了全新的用户体验方式,同时启动了数据智能的引擎,持续提升用户体验。智能模块和学习功能将成为应用的大脑

比如蚂蚁小贷,通过数据和产品的紧密融合,基于算法的数据智能实时发挥作用,最终能实现秒级放贷,这个是传统的金融服务没法想象的。同时,获贷后的用户产生的数据,又被源源不断的采集起来,作为未来更多判断的基础。

再比如搜索系统,用户的任何一次点击行为,都被实时记录并反馈到智能化的算法引擎,不仅优化了你的搜索结果,而且优化了任何搜索这个关键词的人得到的搜索结果。

这样的智能商业,才是对传统商业的颠覆,才是真正的“降维”攻击,胜者一骑绝尘。

四、反馈闭环上面已经谈到自动化、智能化、可学习提升的反馈闭环,闭环的形成决定了智能化商业的形成,但是,闭环的效率决定了大数据的使用效率。所以说,一个好的大数据产品,不仅仅是有用户反馈闭环,而且需要一个高效的用户反馈闭环。

大数据漫谈(四) — 数据应用

大数据反馈闭环

用户行为通过产品实时反馈到数据平台,通过数据智能算法,优化结果又通过数据产品实时提升用户体验,在这样的反馈闭环中,数据既是高速流动的介质,又持续增值;算法既是推动反馈闭环运转的引擎,又持续优化;产品既是反馈闭环的载体,又持续改进功能,在为用户提供更赞的产品体验的同时,也促使数据反馈更低成本、更高效率地发生。

我们再想象一下未来的自动驾驶,所有的汽车都是数据生产终端,会产生他们的数据,包括他们的预定路线,当前位置,行驶速度。这些数据通过高速的,实时的网络传递到一个智能化的云端中心,或者直接传递到其它汽车,在这里,所有的汽车是数据的生产者。同时,他们也是数据的使用者,他们通过从云端获取其它汽车的运行数据,或者是直接获取其它汽车的运行数据。不管是通过云端获取还是直接获取,唯一不同的智能化算法运行在云端还是终端。作为数据的使用者,汽车可以随时根据其它汽车的数据来修正自己的路线与速度,你可以看到,再繁忙的十字路口都没有红绿灯,但是,所有的汽车都不会发生交通事故。

这应该不会是一个太远的未来,至于是不是从云端获取,还是直接终端与终端互联,这个也不是我们今天讨论的关键。为了达成这个目标,这里有几个重点:

1、所有的汽车都必须联网或者是能互联,也就是数据的采集必须是全量,至少是一个区域内的全量,能做到一个区域内的自洽。未来的大数据应用,基本是全量大数据应用而不是采样大数据应用。

2、数据的采集与使用必须实时,很多数据的价值可能就是1分钟以内,甚至几秒钟之内,算法的效率也必须足够快,马上能处理数据并使用数据。实时化时代,对我们的网络技术、连接协议与标准、算法处理速度都是极大的挑战。

3、每个人都是数据的产生者,马上又是数据的使用者,马上又产生新数据,数据闭环必须达成,而且闭环效率要求非常高。

4、不一定需要云端中心化,数据不一定需要上传到大数据处理中心,通过中心化的云端智能化处理之后再反馈到终端。个人觉得,未来万物互联的物联网时代,这个是不一定的,基于区块链+物联网技术,可能是个去中心化的新时代,一个万物互联,随时随地计算,终端即服务端的时代。

以上讲了数据应用过程中的不同层面以及智能商业的核心问题,要描述智能商业,还有一个非常大的特性,他是“活”的。

数据是活的,每个人/终端随时都是数据的生产者,而且,这些数据被实时收集处理,然后,实时再被自己,或者他人使用。

算法是活的,它从真实的商业场景中发芽,而用户对产品、服务的每一次体验,都成为算法迭代成长的养分,使算法敏捷迭代,越来越懂用户所需、越来越聪明地反映商业本质;

反馈闭环是活的,在其中,产品在迭代,数据在流动,算法在成长;

最终,用户体验是活的,不再是预先设计的、固化的死产品、死服务,而是基于与用户的持续互动不断改善,不断适应用户所需,与用户一起成长;

工业时代的做法也将完全被颠覆,预先规划的大规模化生产也将不复存在。在工业4.0时代,一个个性化,智能化的时代,取而代之的将会是一个欣欣向荣的“活”的商业生态系统。

参考资料:阿里巴巴集团总参谋长曾鸣 | 智能商业:数据时代的新商业范式

本文作者拖雷(陈吉平),袋鼠云CEO ,国内最早一批Oracle ACE Director,前阿里巴巴研究员,先后担任嗨淘、无线事业部、数据事业部资深总监,生活服务事业部总经理,以及阿里云事业群总裁助理。2015年离职后,做了半年独立天使投资人,2015年底创办袋鼠云。

发表评论

评论已关闭。

相关文章