大数据 BIg Data

听说
,词源出自Alvin Toffler,上世纪70年代的作品《第三次浪潮》。

逝者 | 阿尔文·托夫勒:怎样
化解未来

的冲击

什么是大数据?

固然
大数据是一个泛泛的概念词,但是关于大数据,关于大数据处置
剖析

的话题近来持续升温,往常

基本

成了新一轮工业反动
级别的话题。

大数据是什么,作为数据采集团队 ,我们很长的时间里不时

也在思索

,什么是大数据大数据的前景和价值在哪里。

这篇文章里,我会跟大家一同
分享我的见地
以及各种有趣的内容和资源,它们关于:

  1. 什么是大数据
  2. 大数据的理论
  3. 大数据的应用场景
什么是大数据?

最近都在说裁员,假定

想知道

互联网裁员潮对就业薪资是不是真的产生了耐久
的负面影响,能够

用我们的工具,帮你定时每天采集几次生成列表看一看。

(一)什么是大数据

先听听行家的说法:

大数据就是多,就是多。原来的设备存不下、算不动。

————啪菠萝·毕加索

大数据,不是随机样本,而是一切
数据;不是精确

性,而是混杂性;不是因果关系,而是相关关系。

_______Sch?nberger

移步ted:Kenneth Cukier: BIg data is beer data

America’s favorite pie is?
Audience: Apple. Kenneth
Cukier: Apple. Of course it is. How do we know it? Because of data. You look at supermarket sales. You look at supermarket sales of 30-centimeter pies that are frozen, and apple wins, no contest. The majority of the sales are apple. But then supermarkets started selling smaller, 11-centimeter pies, and suddenly, apple fell to fourth or fifth place. Why? What happened? Okay, think about it. When you buy a 30-centimeter pie, the whole family has to agree, and apple is everyone’s second favorite. (Laughter) But when you buy an individual 11-centimeter pie, you can buy the one that you want. You can get your first choice. You have more data. You can see something that you couldn’ see when you only had smaller amounts of it.

曾经人们以为最爱吃的派都是苹果派,不过当你有了更细致的数据,你会发现,苹果派受欢送

其实是一种妥协的结果:苹果派是每个人第二喜欢的口味。

拿到小尺寸派的数据以后你更发现,其实苹果派只能排到第四,第五位的样子了。

你有了更多数据,你就能看到之前你看不到的信息。

大数据最中心
的价值是什么? – 商业 – 知乎 举荐

@Han Hsiao这篇内容的结构

十分

明晰
,对大数据的正面意义提出了十分

明晰
地讨论

大数据听着很牛,理论

上也很牛吗? – 人工智能 – 知乎 这里 @陈萌萌说的也特别好,狐疑

她是不是真的是一个ai。

大数据最中心
的价值是什么? – 商业 – 知乎,依然

是这个问题, @刘飞的文章。

大数据大数据的采集

大数据行业,自身

是依托于数据源存在的效劳
性行业。

大数据最基本

之处在于信息搜集
方式呈现
了严重
变化与改造
大数据的呈现
与大量信息直接在网络呈现关系十分

紧密

什么是大数据?

微博、天猫、淘宝、微信等等都直接产生了大量包括定位、音讯

记载
、消费记载
、评价、阅读等等殊为庞大的信息,能够

说互联网企业都自然的带有数据企业的标签。不过假定

我们从数据的源头看的更认真
一些,还是会发现,其实很多数据依然

是有庞大

的采集与归类的需求。

什么是大数据?

Joel Selanikio:Transcript of “The BIg-data revolution in healthcare”

There’s a concept that people talk about nowadays called “BIg data.” And what they’re talking about is all of the information that we’re generating through our interaction with and over the Internet, everything from Facebook and Twier to music downloads, movies, streaming, all this kind of stuff, the live streaming of TED. And the folks who work with BIg data, for them, they talk about that their BIggest problem is we have so much information. The BIggest problem is: how do we organize all that information?

往常

人人都说大数据,但其实大家说的是 facebook,twier,streaming 等等站点上每天产生的信息,做大数据的人呢,会觉得我们有的数据量真实
太大了。

(组织信息依然

是最难的问题)

I can tell you that, working in global health, that is not our BIggest problem. Because for us, even though the light is beer on the Internet, the data that would help us solve the problems we’re trying to solve is not actually present on the Internet. So we don’ know, for example, how many people right now are being affected by disasters or by conflict situations. We don’ know for, really, basically, any of the clinicsin the developing world, which ones have medicines and which ones don’. We have no idea of what the supply chain is for those clinics. We don’ know — and this is really amazing to me — we don’ know how many children were born — or how many children there are — in Bolivia or Botswana or Bhutan. We don’ know how many kids died last week in any of those countries. We don’ know the needs of the elderly, the mentally ill. For all of these different critically important problems or critically important areas that we want to solve problems in, we basically know nothing at all.

许多有效的数据还完好

不在网络上,要依托
原始的办法

来搜集
。数据方面还有很多基本

层面的问题在十分

多的范畴
十分

显然

有哪些「神奇」的数据获取方式? – Liu Cao 的回答

– 知乎 看到这里举荐

一个 @Liu Cao

的回答

严澜(lanceyan)的博客 – 技术分享 框架交流 大数据处置
架构搭建 机器人

猛烈

举荐

:怎样
用形象的比喻描画

大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?其中 @Xiaoyu Ma

(二)大数据的理论

工具看这里:大数据剖析

普通
用什么工具剖析

? – JavaScript – 知乎

最近看到个例子,说pokemon go 带给玩家运动量上的变化:

1、应用中的数据剖析

示例:·

什么是大数据?
什么是大数据?

六个月以后,大部分

pokemon go 的玩家的运动量逐步

和 non-player基本

分歧
了。

看来的确

是一个能用相当效果的游戏。

2、交通状况

大数据剖析

示例:

什么是大数据?
什么是大数据?
什么是大数据?
什么是大数据?
什么是大数据?

 

Susan Etlinger: What do we do with all this BIg data?

Now, there’s a group of data scientists out of the University of Illinois-Chicago, and they’re called the Health Media Collaboratory, and they’ve been working with the Centers for Disease Control to beer understand how people talk about quiing smoking, how they talk about electronic cigarees, and what they can do collectively to help them quit. The interesting thing is, if you want to understand how people talk about smoking, first you have to understand what they mean when they say “smoking.” And on Twier, there are four main categories: number one, smoking cigarees; number two, smoking marijuana;number three, smoking ribs; and number four, smoking hot women.

这里十分

有趣

(三)大数据的应用场景

先贴两个新闻察看

京津冀大数据产业展开

现状 | 报告 | 数据观 | 中国大数据产业察看

_大数据门户 数据观 | 中国大数据产业察看

_大数据门户

往常
,在政策上,国度
战略层面上,大数据遭到
的注重
水平

都越来越高。

应用场景上,往常

散布

在:

  1. 供给

    链和渠道剖析

    &优化

  2. 定价剖析

    与优化

  3. 狡诈
    行为剖析

    &检测

  4. 设备管理
  5. 社交媒体剖析

    &客户剖析

什么是大数据?

大数据时期
》一书作者维克托以为
大数据时期
有三大转变:

第一,我们能够

剖析

更多的数据,有时分
致使

能够

处置
和某个特别现象相关的一切
数据,而不是依赖于随机采样。更高的精确

性可使我们发现更多的细节。

第二,研讨
数据如此之多,致使

于我们不再热衷于追求精确

度。恰当
疏忽

微观层面的精确

度,将带来更好的洞察力和更大的商业利益。

第三,不再热衷于寻觅
因果关系,而是事物之间的相关关系。例如,不去探求
机票价钱
变动的缘由
,但是关注买机票的最佳机遇
。”大数据突破

了企业传统数据的边境
,改动
了过去商业智能仅仅依托
企业内部业务数据的局面

,而大数据则使数据来源愈加
多样化,不只
包括企业内部数据,也包括企业外部数据,特别
是和消费者相关的数据

据野史记载,中亚古国花剌子模有一古怪

的习俗

,凡是

给君王带来好音讯

的信使,就会得到提升,给君王带来坏音讯

的人则会被送去喂老虎。从前的人喜欢批判
这位君王的天真品性,以为奖励带来好音讯

的人,就能鼓舞
好音讯

的到来,处死带来坏音讯

的人,就能根绝坏音讯

在今天这个信息爆炸的时期
,我们不一定能让信使一定送来好音讯

,但你能够

让我们的爬虫定时给你送来最有用最合你需求的信息。

发表评论

评论已关闭。

相关文章