数极客首页

一直在讨论的大数据,这次在美国大选中究竟干了什么?

回首美国大选这场混战,大数据技术在其中其实发挥了不小的作用,致使

占领
了至关重要的位置

本稿件由南七道整理翻译,原文来自于Uvm、Befair等网站特朗普入主白宫,美国大选落下帷幕。回首这场混战,大数据技术在其中其实发挥了不小的作用,致使

占领
了至关重要的位置

社交媒体上的大数据剖析

从美国大选之初,各候选人各方面的数据统计就曾经
被统计在各家网站上。比如

从这张数据来看,上图表示的是各个候选人的推文提及率。而在同样的时间序列中,特朗普在推文中的提及率占有显然
的抢先
优势,不过其他候选人在同一个坐标轴中简直

不可见。

图中下方的图标则是关于每位共和党候选人的推文的幸福感指数中止

的比较

,特朗普相关于
克鲁兹和卢比奥有微小
的优势,关于
卡森有显然
的优势。并且,特朗普的平均

幸福指数比希拉里略高(5.79比5.70),但仍比桑德斯低(5.79比5.85)。虽说这些数据并不能够

直接决议
最终
的大选结果,但也间接的为特朗普获胜起到了润滑

和推进
作用。

除了这些幸福指数和提及率,大数据统计还对各个候选人的各个“标签”中止

了统计,而正是这些标签决议
了幸福指数等相关数据的分值上下
。在下图特朗普和希拉里的“标签”对比

中,词语的颜色依据

感情状态表示——越蓝越快乐,越紫越悲伤,而且词语的大小由加权平均

tf-idf值决议

从图中不难看出,希拉里的词图中,正面词汇与负面词汇相交错

,其中比较

重要的正面词汇有“阅历

”,“才干
”,“女性”,“世界”;负面词汇有“立功

”,“调查”和“谎言

”,这或许
是与电子邮件效劳
器丑闻相关。而特朗普的词图中,最大的词汇包括支持者形容的“前行”,以及往常

的共和党初选中的“胜利

”;负面词汇,或许来自于他的反对者,包括“欺负

”,“攻击”,“种族主义”,“骗子”和“风险
”。

除此之外,还有可供我们参考的是词汇转移图,如图所示:

希拉里的词汇转移图与参照散布

比较

相似

(5.76比5.77)。负面词汇包括电子邮件调查及“监狱”,“立功

”,“囚犯”,“丑闻”等。此外,“票据”是以负面方式
呈现的词汇(被了解

为支付票据),但是在希拉里这里则是指比尔·希拉里。正面词汇主要有“她”,“女性”,“感激

”,“安康
”,而负面词汇“憎恶

”,“悲伤”,“失败者”,“诈骗”,“种族主义”较少被提及。

经过
剖析

大众

趋向
,民众能够

经过
数据了解

到谁更契合
国民的规范

。而社交媒体运用大数据的统计和判别
使得民众判别
方向发作
了一定的倾向

,引导了整个行动

的导向,致使

改动
了很多人的原始初衷,心中的那杆秤在不知不觉中发作
了一定的倾向

个人数据团队的关键性作用

当然,这个只是社交媒体和一些数据公司较为公正的数据统计,而关于
特朗普和希拉里自己

而言,个人背后的数据团队比较

看来,简直

就是一场大数据的盛宴。

传言希拉里有一支堪比硅谷公司的大数据团队——50名专业的程序员和开发者,大部分

都是曾经供职于Facebook、Google、Twier等大型的科技公司的高层人士。在他们的辅佐

下,假定

想要想应用
更多技术伎俩

来辅佐

希拉里赢取更多选票和资金,简直

是轻而易举的事情。比如

,民主党关于
竞选页面中止

细微的调整,就能够

让捐赠人贮存

信誉
卡信息。这种伎俩

常用于电商公司将窗口用户变为付费用户的伎俩

上,但往常

在政治上同样适用,很多民众在不知不觉中便曾经
成为了希拉里“忠实”的支持者。

除此之外,这些大数据团队还能够

处置
一些突发的技术问题。比如

,2015年,联邦竞选委员会报告竞选筹资截止日当天,外部邮箱系统忽然

解体

。固然
当时局面

一片紊乱
,但是希拉里的竞选团队竟在4个多小时内搭建了一个暂时
邮箱系统Balloon,使得危及顺利处置

这样看来,特朗普似乎只需

Twier这样一个武器,实则不然,特朗普背后的数据团队关于
他商人出身的身份中止

了量身打造,为这样一位本该有着金钱光环的人打造了一副政客的钢筋铁甲,使得他的争辩
才干

突飞猛进。特朗普背后的大数据团队着重于希拉里过去的演讲,经过
关键词和数据剖析

来洞悉希拉里演讲的漏洞

和缺陷
,从而为特朗普提供有力的攻击武器。

还记得曾经的争辩
会吗?希拉里发言26分钟内便被特朗普打断了25次,这难道不是大数据团队支持的结果?

国内数据公司DataEye CEO汪祥斌以为
,其实从上两届奥巴马的总统大选开端
大数据在整个总统大选过程中的应用曾经
越来越深化
,从大选筹资阶段开端
,精准的筹资邮件选择

到选情实时剖析

,选民人群精准定位,结果预测各个环节都曾经
开端
数据化,整个总统大选曾经
变成一个典型的数据驱动的业务决策过程。不难看出美国的政治曾经
全面进入了大数据时期

大数据公司是大选的幕后英雄

假定

说到特地
为民主党和共和党提供数据剖析

和效劳
的要数TargetSmart和DeepRootAnalytics这两大公司了。前者特地
为民主党派和州民主党派以及他们的同盟提供大数据剖析

和效劳
;然后
者则给共和党及其从属

团队提供数据剖析

TargetSmart和DeepRoot都是应用
Alteryx的软件来阐明

他们容纳

、净化、混合以及剖析

来源不同的大范围
资料

。这种办法

主要来剖析

选民的年龄结构

,依据

不同年龄段来分段并且打分,然后应用
这些资讯来优化他们在媒体上的花销,特别是在十分

重要的电视广告上,从而扩展
宣传效应,使得事情的效果事半功倍。

资料

将会指示客户该将他们的竞选广告放到哪,从而使得广告在目的
人群的曝光率大大提升,同时还会提示他们花销的纪录,透过让客户在情形
中能够

认识
到这个问题,不只
提供他们所做的与目的
人群相关的理由,而且也会剖析

竞争对手或同盟所做的,对目的
人群的影响,这就允许他们能够

对正在中止

的分配任务具有战略
性,并对广告投放更聪明——把广告投放在最不显眼而又最高效的中央
,同时依据

其他人

或组织的移动

来及时做出反响

这一届大选特朗普和希拉里合计
为大选烧掉了将近1亿美金,这些钱烧在哪些中央
?无外乎宣传公关,而这个其中的宣传打广告以及拉选票就占领
了多数,包括电视广告,网络广告,直邮信件等等。在汪祥斌看来,如此昂扬

的广告投入也为大数据的应用提供了宽广
的发挥
空间。不只
仅是筹资的多少,谁能更有效的中止

精准的广告投放某种意义上来说也直接决议
宣传战的结果。

大选&赌盘相爱相杀

因2016年美国总统选举胜负难料,猛烈

的选情也直接带动了赌客下注的热情,博彩公司因而

收到创纪录的赌金。在此之前英国互联网博彩公司Betfair称,其“下一任总统”赌盘可能超越英国脱欧公投赌盘,成为历来投注金额最高的一个赌盘。目前该赌盘曾经
收到约1亿3000万美圆
的赌金。

而关于
该公司而言,关于
选举下注早曾经
是见怪不怪的事了。在此之前,该公司网站共有70多个与美国总统选举相关的赌盘,下注的赌盘从谁将赢得

最多的支持票,到各党将拿下多少个州都有。而“下一任总统”赌盘是下注额最高的一个。

英国另外一博彩公司Ladbrokes则透露表现,自从该公司在4年前为本届美国总统选举收注以来,至今的下注额已达500万英镑。不过绝大多数赌金是在美国以外的地域
下注的。遭到
美法律王法公法律的限制,美国境内的政治赌博只局限在与大学有联络
的相对小的平台上,而且是供大学做学术研讨
用处

的,不过这些数据统计结果一旦发布
,公民的选择和态度就会发作
相应的变化。

南七道:南七道新媒开创

人,36氪专栏作者,互联网明星创业公司脸萌、FaceU等品牌操盘手,关注互联网和科技创业。微信公众号:南七道。

作者:南七道,转自:http://36kr.com/p/5056459.html

发表评论

评论已关闭。

相关文章