数极客首页

感同身受!12个数据科学家秒懂的瞬间

来源:微信公众号(ID:BIgDataDigest)

作者 | Ramesh Ilangovan

编译 | 白丁、大饼、宁云州

所谓数据科学家就是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。–Josh Wills, Cloudera云纪元

毫无疑问,数据科学是往常
职场上最受追捧的技艺
之一。
CNBC的一篇文章在综合思索
就业机遇

、薪水中位数、膂力
工作强度、工作压力等要素
后,将“数据科学家”评选为2017年最受欢送

的10大职业之一。数据科学在职场中的确

越来越热,数据科学家年薪的中位数超越
了11万美圆
而且职场中关于
数据科学家的需求有16%的预期增长。

话虽如此,想要成为一名数据科学家却并不简单。这份工作在央求

全面扎实的技术才干

的同时,还央求

丰厚
的想象力。数据科学家必需
有才干

搜集
恰当的数据、将之整理为合适

剖析

的方式
、设计发明

性中央
法来完成
数据可视化、并挖掘

数据信息来回答

细致

问题。

正因如此,顶级数据科学家在技术型公司通常会得到摇滚巨星般的待遇。但是
,数据“极客”的生活跟“轻松”两个字却毫不沾边。新工具和新技术每天都似乎

雨后春笋般不时
涌现,数据科学家必需
不时
更新学问
和技艺
,才干
保住自己

在公司的位置

那么,就让我们来看看数据科学家有哪些日常。

1、当被他人

问:“什么是大数据?”

“啥,你逗我?”⊙o⊙

我们生活在高度数字化的世界,大数据无处不在。经过
社交媒体、网银、GPS、电子商务,我们无时不刻都在生成海量的数据。事实上,据报道,我们每天生成的数据量高达2.5兆字节。

大数据曾经
改动
了我们与人沟通的方式和生活方式。借助大数据剖析

,批发
网站得以针对用户喜好

发送精准的产品举荐

,政府机关得以控制
并预测立功

行为,交管部门得以管控交通流量,执业医师得以更精确

地诊断疾病。

大数据的应用简直

不胜枚举,而且真实

而有效地进步
了我们的生活质量,因而

每个人都应该很熟习
大数据”这个词了。

2、你第一次跑通R代码是什么时分

有一天,新手数据科学家会懂上边这张图。R编程是数据科学范畴
最必不可少的技艺
之一。KDnuggets上就有文章以为
, R是2016年剖析

和数据科学范畴
最受欢送

的软件,而Python仅排名第二。

思索
到R在市面上的受欢送

水平

,当R代码如你所愿发挥作用时,你会情不自禁地以为
自己

就是数据之王。

3、当你不得不处置
非结构

化流数据

非结构

数据剖析

通常被称为“暗黑剖析

”(dark analytics)。这个令人生畏的名号绝非虚张气势
,而是名不虚传

、毫不夸大

即便

是最娴熟的数据科学家,处置
起非结构

化流数据来也免不了一个脑袋两个大。不论

是社交媒体、视频、客户日志还是天文
空间效劳
数据,剖析

工作都需求
在多元数据上实时、增量中止

。此外,时效性也是此类数据剖析

工作的重中之重。

因而

,当你一脚踏入暗黑剖析

的范畴
,那种(面对庞然大物茫然手足无措

的)觉得
就跟试图揭开宇宙奇妙

的空间科学家毫无二致。

4、当你模型的预测精确

度高于90

这可不是小事。为了做好剖析

工作,数据科学家必需
在数据研讨
、解读、准备和处置
上投入大量的时间,这个过程需求
极大的耐烦
和努力。但是
,假定

你构建的模型的精确

预测度能够

抵达

90%以上,报答
也是无比丰厚的。

当客户、经理、同事的赞扬和观赏

如潮水般向你涌来时,你在喜不自胜之余脑海里只会记得一件事 — 周末嗨翻天!

5、当你想要找出模型中的漏洞

从成百上千行代码中找到错误,就跟让宿醉的你去大海里捞针一样痛苦。

但是直面理想
吧,这就是工作呀,谁让你是数据科学家呢。

6、当你的经理问及漏洞

修复停顿

通常状况

下,数据科学机构中的经理们都不了解

技术性任务的实质

,不论

是排查模型缺陷或者改善模型性能;他们普遍愈加
关注项目管理(例如最终
时限等。)

面对“这个项目什么时分
能终了

?”这样的问题,数据科学家能做的就是能拖一会儿就拖一会儿或者痛快
消逝

7、当你的小白朋友指出了你模型的漏洞

你死死盯着代码,几个小时过去了却一无所获。就在你简直

要放弃的时分
,一个朋友偶尔

扫了一眼,马上就指出了其中的错误。

最初的尴尬

和怒火过去之后,你很快就会松一口吻
,毕竟省事

事儿又少了一件。

没什么大不了的,我们能够

这样安慰

自己

:“旁观者清嘛”。

8、当你的SQL查询跑的特别慢

慢悠悠

的效劳
器,糟糕的网络状况

,或者别的什么缘由
,都会招致
SQL查询执行的特别慢,就跟看着油漆一点点风干一样;当然你也不用不时

盯着电脑屏幕,倒杯咖啡,让SQL自己

飞一会吧。

这很无聊,而且极耗耐烦
;不过大家都是这样过来的。

9、?当你好不容易建好模,用户又要改数据

在费尽九牛二虎之力剖析

数据、建了无数模型,剖析

出了无数趋向
后,你最不想听到的就是你用的是“错误”数据。

也就是说,你要剖析

一套完好

不同的数据集,一切
的模型都要中止

严重
调整,从头再来一遍。痛苦啊!

10、当你再有20分钟就要见客户,但PPT还没做好

你刚做完见客户的PPT,擦擦皮鞋整整领带就能够

去见客户了吧?就大多数状况

而言,答案是招认

的。

数据工程师需求
跟同事和经理复核PPT;这意味着在最终
一分钟内PPT会有无数改动。做这些改动是十分

有压力的,由于
这关系到你的个人名誉

、业务成败、公司形象、致使

你的职业出路

不过,当你最终得到客户首肯时,你会认识
到有些改动
是十分

关键的,而且能让你的案例更有压服
力。

正如大名鼎鼎的史蒂芬·乔布斯说的:

“庞大

的商业成就绝非一人可为,而是团队之功。”

11、客户最终认同你的模型的输出结果

这是一切
数据科学家都天天幻想

的时辰

面对央求

极高、条件极为严苛的客户,你夜以继日的努力工作,力图
模型抵达

最大限度的精确

有效。你不得不一次又一次给自己

打气,拿出最大的耐烦
来面对这帮闹心的客户。但是
,当客户诚心诚意
地向你竖起大拇指时,最终的胜利

是属于你的。

Kirk Borne博士对此有着精辟见解:

“客户可能会出错,但客户永远是客户。”

12、当市场迎来一家新的大数据公司

剖析

行业展开

十分

迅猛,新工具和新技术也层出不穷。数据科学家见证着各种大数据、剖析

和深度学习工具的不时
涌现。

数据极客骨子里都是持续学习者,他们关于
业内新展开

永远持开放态度,并且会随之拓展自己

的学问
和技艺

原文链接:https://medium.com/towards-data-science/12-situations-data-scientists-will-totally-relate-to-bb6bd3f0a28e

发表评论

评论已关闭。

相关文章