数极客首页

利用 pandas和ggplot来分析 iPhone 的步行数据

本文中我将展示

怎样
应用
pandasggplot 来剖析

iPhone 的步行数据,我主要应用
Rodeo(Yhat’s 的 IDE)来中止

数据剖析

数据搜集

第一
我想从我的 iPhone 中导出用于剖析

的步行数据,Quantified Self 实验室的工作人员开发了一个数据提取的便利
工具——QS Access。
以下是一组关于步行数据的截图:
应用 pandas和ggplot来剖析 iPhone 的步行数据

数据剖析

我主要应用
pandas 中的时间序列剖析

工具来剖析

数据,当 Wes McKinney开端
处置
pandas 项目时,他就曾经
在一家投资管理公司工作,该行业普遍
依赖于时间序列剖析

办法

。因而

,pandas 中包含十分

多的时间序列剖析

函数。

第一
,当我们具有
了时间序列数据后,我们能够

定义参数 parse_dates 使得 pandas 能够

正确地处置
时间序列数据。关于
我们来说,终了

时点变量并没有包含额外的有价值的信息,所以我们在剖析

过程中将不思索
该变量的状况

最终
我们将开端
时点变量设定为索引变量,这个设定有助于我们进一步的数据剖析


应用 pandas和ggplot来剖析 iPhone 的步行数据

每小时步行数据

怎样
快速地绘图剖析

现有的步行数据呢?
应用 pandas和ggplot来剖析 iPhone 的步行数据

更精确

地说,我们能够

应用
downsampling 的办法

来降低时间的频度。比如

,我们能够

采集每小时的数据,然后应用
重抽样和汇合


算的办法

取得

日度数据、周度数据和月度数据。

获取每天步行数据

应用 pandas和ggplot来剖析 iPhone 的步行数据

获取每周和每月步行数据

和上述代码一样,只需
WM 传送
resample 函数中就能得到每周和每月的步行数据。

由于我更关怀

每天的运动状况

,所以我将应用
平均

函数来计算每周或每月中平均

每天的步行状况

。细致

的代码如下所示:
应用 pandas和ggplot来剖析 iPhone 的步行数据

更深化
的剖析

应用 pandas和ggplot来剖析 iPhone 的步行数据

趋向
剖析

最终
让我们来讨论下上文提到的上升趋向
,四月初由于工作的缘由
,我从夏洛特搬到了纽约城,担任 Yhat的软件工程师。
我想知道

经过这次搬家之后,我每天的步行状况

有没有发作
改动
?我们能够

应用
上文剖析

周末与工作日步行状况

的办法

来剖析

这个问题。
应用 pandas和ggplot来剖析 iPhone 的步行数据

总结

我希望这个剖析

能够

让您开端
关注自己

每天的步行状况

,并应用
Rodeo 和 pandas 来剖析

数据。假定

你对这个项目感兴味
的话,能够

参阅该链接。

原文链接:http://blog.yhat.com/posts/phone-steps-timeseries.html
原文作者:Ross
译者:Fibears

发表评论

评论已关闭。

相关文章