数极客首页

2018年校招数据分析师笔试题A

针对2018年应届毕业的校招工作基本

接近序幕
,以下是浙江执御今年的数据剖析

师笔试题A卷,每年虽有更新变化,但考核的点基本

差不多,分享出来供大家学习参考。

一、 选择题(每题2分,合计20分)
1、 请找出数列11,18,38,83…的下一项( )
a.146
b.168
c.171
d.203

2、 有一组数据的众数>中位数>均值,请问这组数据的散布

( )
a.左偏
b.右偏
c.对称
d.以上都不对

3、 下列的抽样办法

中,抽样误差最小的是( )
a.单纯随机抽样
b.系统抽样
c.分层抽样
d.以上都不是

4、 关于规范

差与规范

误,以下说法正确的是( )
a.样本数增大时,样本差减小,规范

差不变
b.可信区间大小与规范

差有关,而参考值范围与规范

误有关
c.样本数增大时,规范

差与规范

误均减小
d.总体规范

差一定时,增大样本数会减小规范

5、 希望描画

一群用户在某页面停留时长的集中趋向
,最好采用( )
a.均值
b.众数
c.中位数
d.均值和中位数

6、 随机抽取2个在JollyChic上购物的人群,检验他们的平均

消费水平

是不是分歧
,能够

用以下哪种检验办法

( )
a. F检验
b.单样本T检验
c.多样本T检验
d.单位根检验
7、 以下关于k-means聚类剖析

办法

说法正确的是( )
a.能自动辨认

类的个数,随即选择
初始点为中心点计算
b.能自动辨认

类的个数,不是随即选择
初始点为中心点计算
c.不能自动辨认

类的个数,随即选择
初始点为中心点计算
d.不能自动辨认

类的个数,不是随即选择
初始点为中心点计算

8、 在R中定义函数exec_str <- function(str) {eval(parse(text=str))},并执行exec_str(“5^3”),得到的结果是( )
a.5^3
b.15
c.125
d.以上都不对

9、 在Excel中有2个表格,表a有两列uid、gender,表b中有一列uid,需从表a中找到与表uid对应的gender,可运用
函数( )
a.match
b.vlookup
c.hlookup
d.if

10、 在Excel工作表中,正确表示if函数的表达式是( )
a.if(“平均

成果
”>60,”及格”,”不及格”)
b.if(a1>60,”及格”,”不及格”)
c.if(a1>60、及格、不及格)
d.if(a1>60,及格,不及格)

二、 问答题(合计80分)
1、 数据剖析

师是做什么的?自己

目前招聘
数据剖析

师职位的优势是什么?(10分)

2、 异常值是什么?请罗列
至少一种辨认

连续型变量异常值的办法

?(10分)

3、 聚类剖析

是什么?分类算法是什么?分别有哪几种常规的算法?聚类与分类有什么异同点?(15分)

4、 经过
支付表jc_pay_fact,计算近7天城市city 为Dubai且支付金额gmv大于60的支付客户数和支付金额
注:jc_pay_fact表数据示例:
pay_date,city,buyer_id,order_id,gmv
2017-9-24,dubai,001,11001,100.21
2017-9-26,new york,003,12085,90.21
请写出查询SQL语句(10分)

5、 作为一个APP需求
在各个渠道中止

推行
装置

,作为剖析

师能够

从哪些角度对渠道用户的质量中止

评价
剖析

?(15分)

6、 影响一个平台销售额的要素
是多方面的,请罗列
出5个以上的影响要素
并简单阐明

是怎样
影响的,以及针对性的战略
倡议

?(20分)

本文为 数据剖析

网 原创文章,转载或内容协作
请联络
我们,本文链接:https://www.afenxi.com/52927.html

发表评论

评论已关闭。

相关文章