数极客首页

在 Booking 当数据科学家是怎样一种体验

  • 作者 Nishikant Dhanuka
  • 编译  Mika

Nishikant是Booking公司的一名高级数据剖析

师,在本文中他分享了自己

在Booking从数据科学家新手到巨匠

的展开

进程

求职

在迪拜做了3年咨询类工作之后,我作为一名数据科学家参与

了Booking 。从咨询转行到数据科学范畴
是我职业生活
中的严重
转变,往常

看来我很快乐
当初做了这一选择。

在面试时,我就对Booking的觉得
特别好。我有机遇

与数据科学家交谈,面试官的背景十分

多样,其中一位具有
天文学的博士学位,另一位是自己

创业公司的首席技术官。

同时Booking的伙食特别好,这也是我选择Booking的缘由
之一。

入职

我还记得入职的第一天,同事问我”你对你的屏幕还称心

吗?”这让我很不测
,由于
我以前工作时只配备

了一台笔记本电脑。Booking之后给我配备

了一台Mac、两个大屏幕以及其他一些酷炫的设备。

入职后不久,我参与的第一个入职项目触及
到剖析

大量文本,我需求
从中得出业务见解。以前我只需

结构

化数据方面的阅历

,因而

我对这个新应战
感到兴奋。我希望进步
自己

文本数据的水平

,但不久之后我就遇到艰难

了,那就是Booking庞大的数据范围

Booking每24小时订出150万个房间,同时有数百万人访问网站,这意味着数据科学家所接触的数据范围
相当大。还好公司有运用
Spark中止

散布

式计算的内部培训。经过
培训,往常
我能够

在多台机器上运转
剖析

项目

我的第二个项目是为协作
网站构建举荐

引擎。以前我只做过规范

回归和分类模型,这是我第一次接触到协同过滤和合成
机。

由于数据范围
,我不得不用PySpark中止

稀分散

矩阵。在编写代码之后,我们中止

了A / B测试,看这样能否
会对我们的业务带来积极影响。这也是我第一次接触A / B测试,但侥幸

的是公司配有完备的实验工具和基础

设备
,从而让这一过程并不艰难

。经过
多次

迭代,我们顺利处置
了冷启动问题,并胜利

完成了该项目。

Booking的数据科学家在Analytics Fair上展示

项目

接下来是大量的项目,每个项目都有不同的应战
,作为数据科学家我需求
不时
地学习。例如,其中一个项目需求
我将业务问题表示为加权网络图,并中止

相关剖析

; 在另一个项目中,我需求
从简单的数据剖析

中得出有价值的见解。

就这样过了两年半,我目前是Booking的高级数据科学家。往常

我努力
于研讨
人工智能产品的机器翻译,并经过
部署神经网络和深度学习处置

计划

构建全面的消费
系统。

团队构成

下面我打算引见
下Booking的团队构成。

我们采用“嵌入式”结构

,数据科学家与业务紧密

相连。我参与的团队中有开发人员、数据科学家、产品担任
人和其他专家。团队分别

一切
的力气
,将相关概念实施

到细致

产品。在日常运营中,我们遵照
一定的准绳

:每日会议、回想

、待办事项、团队目的
、KPI和OKR(目的
和关键结果)。再加上每两周一次的会议,能够

让团队稳步展开

,并尽快学习。

正是与业务的紧密

联络
,Booking的数据科学家都有很强的沟通才干

和商业认识
,同时还有很强的专业技艺
。这些都是我们在面试求职者时要测试的基本

技艺

出色的数据科学家

Booking共有120 多名数据科学家,而且社区在日益壮大。每位数据科学家都有不同的背景和技艺
强项。

有些人是数据科学新手,有些人则有丰厚
的工作阅历

; 有些人是贝叶斯派,有些人是频率学派; 有些人喜欢用R言语
,有些人更喜欢用Python; 有些人喜欢用Vowpal WabBI,有些人则喜欢运用
Spark和H2O中止

散布

式计算。

这种多样性能够

让大家彼此学习和进步。我们每周都会举行相关的聚会和谈判

,当中我们会谈论

最新的行业意向
和研讨
论文,并分别

处置

Booking的理论

问题。此外,公司还会定期举行
相关技术培训,包括A / B测试、Git、Hive、Python、R、Spark、H2O、TensorFlow等内容。

Booking数据科学社区每周谈判

在我看来,在Booking工作最大的财富就是出色的数据科学社区,在当中我每天都能学习新事物,并且十分

开心。

面对的应战

同时我们也有面对一些应战

第一
,由于我们的数据科学社区展开

得十分

快,这也为分享学问
带来了难度。为了解

决这个问题,我们尝试了很多办法

,比如

针对专业的话题(比如

自然言语
处置
),黑客马拉松等方面展开讨论,从而更好地分享学问

让数据科学家参与业务也有其不利之处。有时在日常工作中我们会短少

同事的相关反响

。为了解

决这个问题,我们鼓舞
大家分享各自的成果,并与同事一同
讨论他们的最新项目。同时我们也为新员工提供导师计划

固然

我们已多次

为数据科学社区做出贡献

,但我们也希望将成果分享给外部。我们目前正在制定一些指导计划

Booking的数据科学家们在船上聚会

最终
我想说,在Booking当数据科学家十分

快乐

,而且历来
不会短少

机遇与应战

原文链接

https://towardsdatascience.com/diary-of-a-data-scientist-at-booking-com-924734c71417

发表评论

评论已关闭。

相关文章