数极客首页

2016美国大选,来自人工智能和大数据的预测

近期最火的好莱坞大片,莫过于2016年的美国大选了,两位候选人秉承了一撕到底的肉体
,为宽广

的吃瓜大众

提供了茶余饭后的最佳谈资。

2016年6月,有“数据巫师”之称的美国统计学家纳特·西尔弗(NateSilver)在知名数据博客538(FiveThirtyEight)发表最新剖析

,预测希拉里·克林顿有八成可能击败唐纳德·特朗普,当选

第45任美国总统。西尔弗在博客中提供了三种不同模型的预测,而该博客将持续跟踪美国选情,依据

最新民意调查每天更新预测结果,直到11月8日大选。不过,依据

其网站11月2日的最新数据显现
,希拉里获胜的概率降落
到了67%左右。

2016年10月中,微软大数据剖析

预测希拉里·克林顿极有可能赢得

选举,概率 87%。微软运用
搜索,社交网络聊天和其他相关数据智能预测行将
到来的事情
,包括今年的选举。依据

在上周日的最终
更新显现
,希拉里·克林顿将有高达 87%的机遇

成为下一个美国总统,她的共和党对手唐纳德·特朗普,只需

12%的机遇

2016年10月底,印度的一家人工智能企业依据

其模型得出的结论是:共和党候选人特朗普将赢得

本次的总统大选。要知道

,这可是在10月底联邦调查局重启电邮门旧案之前! 依据

外电报导,印度这家公司推出的人工智能系统名为 MogIA,是经过
在Google、Facebook、YouTube等网站上搜集
超越
两千万份资料

中止

剖析

,最终
的结果令人不测

不只
仅是预测未来

的总统,致使

是总统自己

也会运用
技术伎俩

来为自己

保驾护航。 坊间有传言,2012年,美国总统奥巴马仰仗其大数据剖析

团队,击败竞争对手胜利

连任。奥巴马团队的竞选总指挥吉姆·梅西纳表示,在整个竞选过程中,奥巴马的每次活动都是以数据作为支撑,而对多种来源的数据中止

搜集、整理、剖析

和运用,确保了以数据为基础

的决策。在每一次发起

活动和公开争辩
前,奥巴马团队都能依据

受众的特性
选取其最关怀

的议题,精心准备、赢得

支持。发起

渠道和互动方式的选择也为目的
选民量身定做,例如,奥巴马发现很大一部分

目的
选民在社交新闻网站上,于是决议
在社交新闻网站上回答

问题。

这时,你可能会猎奇
,机器怎样
能预测总统大选的结果呢?这里简单为大家剖析

一下。关于
人工智能和机器学习的建模,其规范

的步骤主要包括以下几个步骤:特征化工程、数据的获取,数据的清算
、建模和最终
的评价

  1. 数据的特征化:和专家的常见观念
    略有不同,笔者以为
    第一
    ,也是最重要的步骤,不是获取数据,而是肯定
    特征化工程(feature engineering)怎样
    做。什么是特征化?举个简单的例子,机器是无法了解

    总统候选人是什么,我们需求
    将候选人的特征用数据表示出来,最终抵达

    机器能够

    处置
    的目的。这些特征包括人类自身

    的特性
    ,例如性别、身高、学历等等,还能够

    包括候选人与候选人之间的关系、候选人与选民之间的互动等等。这也是为什么很多预测模型都热衷于互联网选民的行为剖析

    ,由于
    这些数据不只
    直接反响
    了选民和候选人直接的关系,而且自身

    都是数字化的,很容易获取并中止

    特征化处置
    。之所以个人觉得这步十分

    关键,第一
    是由于
    良好的特征,能够

    辅佐

    我们更有效地描写
    事物,提升机器学习的效果。此外,只需

    特征汇合

    肯定
    了,才干
    肯定
    获取哪些数据。

    注:本文部分

    内容和观念
    摘自IBM研讨
    院科学家黄申博士的最新力作《大数据架构商业之路:从业务需求到技术计划

    来源:微信公众号?浩瀚星斗

    发表评论

    评论已关闭。

相关文章