数极客首页

BI与数据可视化

什么是数据可视化

数据可视化(Data Visualization)起源于18世纪,William Playfair 在他出版的书籍《The Commercial and Political Atlas》中第一次使用了柱形图和折线图。当时是为了表示国家的进出口量,在今天依然这么使用。19世纪初,他出版了《Statistical Breviary》一书,里面第一次使用了饼状图。这三种都是至今最常用的最著名的可视化图形。19世纪中叶,数据可视化主要被用于军事用途,用来表示军队死亡原因、军队的分布图等。进入20世纪,数据可视化有了飞跃性的发展。1990年,在人机界面学会上,作为信息可视化原型的技术被发表。1995年,IEEE Information Visualization 正式创立,信息可视化作为独立的学科被正式确立。随着2012年世界进入大数据时代,数据可视化作为大量数据的呈现方式,成为当前重要的课题。

The main goal of data visualization is its aBIlity to visualize data, communicating information clearly and effectively.(数据可视化的目的,是要对数据进行可视化处理,以使得能够明确地、有效地传递信息。)

— Vitaly Friedman

大数据时代已经来临,但数据本身是枯燥的、乏味的,如果不能进行可视化,人们很难发现它的价值,也不利于媒体进行传播。

关键词:代码+设计下面来看两个来自BI的案例。下图用不同颜色的四条曲线代表四家无线网络服务供应商,横轴标注时间,纵轴标注用户付费增长额,从中可以直观看出四家供应商的对比关系和各自的趋势变化。

虽然图形非常简单,但每条曲线的每一个拐点都包含数据信息。为了得到这张图,我们至少需要考虑这几个步骤:①设定信息框架和布局;②把数据整理成可以被分类调用的数组;②制定一个或几个函数,使每个具体数据在框架内获得一个位置信息;③在对应位置绘制图形并设置参数对图形进行美化;④添加标签、图例辅助阅读。我们知道常用的办公软件就可以方便地做出数据图表,但如果数据变得复杂或者当我们对图形的美观性提出要求时,我们就不得不借助更加专业化的工具了。下面这张图是一种很常见的可视化类型:呈现地理位置信息。如何在一张地图上标注地理位置呢?

首先我们必须要获得某个地理空间的相关信息(比如经纬度),这种信息通常采用GeoJSON格式的文件存储,GeoJSON文件来源于JSON(JavaScript Object Notation) ——一种轻量级的数据交换格式,即 JavaScript 对象标记法。下载这些文件,然后用你的可视化工具或者自己编写的代码调用它们就可以了。

神器:JavaScript图形库为了更深入地理解数据可视化, 学习JavaScript是绕不开的一条路。像MATLAB和Mathematica、Maple这样的软件虽然可以处理大规模数据信息,但因为它们主要是为数学计算而非图形设计服务的,所以更多地被应用于数学领域。了解网页制作的同学都知道,JavaScript作为一种被大多数浏览器支持的脚本语言,配合DOM和SVG就可以绘制出丰富的矢量图形,并给它们加上动态效果。随着数据可视化的流行,世界各地的开发者开发出许多简单易用的函数,用来简化 JavaScript 操作数据的难度。他们将生成可视化的复杂步骤精简到几个简单的函数,只需要输入几个简单的数据,就能够转换为各种绚丽的图形。在开源代码库 Github 上最受关注的前10个仓库中,有7个是基于 JavaScript 开发的,数不胜数的函数库可适应于各种需求。在可视化图形库方面,最受关注的有下面这些:

  • D3.js
  • Processing.js
  • EaselJS
  • ECharts
  • Three.js

D3.js 和 Three.js 是最受欢迎的两个。D3的全称是(Data-Driven Documents),即:一个被数据驱动的文档,官方网站是http://d3js.org/,里面有丰富的案例供大家参考和借用。

在HTML文件中直接添加下面的标签就可以开启你的D3之旅了。

<script src=”http://d3js.org/d3.v3.min.js” charset=”utf-8″></script>

至于其他几个,Three.js 是用于制作三维图形的库。Processing.js与EaselJS 与前两个相差较多。而ECharts是百度开发的可视化库,被称为国人的骄傲,同样推荐大家学习。

商业价值:另一个“BI上文中的“BI”是Business Insider的缩写,然而通常人们说起“BI”的时候,指的是Business Intelligence,即商业智能商业智能包括数据仓库、查询报表、数据分析、数据挖掘、数据备份和恢复等内容,目的是帮助企业进行决策。它是数据可视化在商业领域的一种应用。市面上流行的等商业智能软件如:tableau、Qlik、魔镜等,将数据运算与美观的图表进行嫁接,操作简单,转眼间就能创建好各种图表。其中,Tableau被美国高德纳咨询公司评为世界上发展速度最快的商业智能公司。2013年5月18日,Tableau在美国纽约股市上挂牌交易,市值达到20亿美元。

从中,我们可以看出数据可视化的巨大潜力。

数据可以有多美?下面分享几个应用了数据可视化技术的经典网站,其图形绚丽无比,赏心悦目,并且有良好的交互体验。The Internet map

网址: http://internet-map.net/全世界各大网站的可视化。网站都用圆形表示,圆的大小表示网站的访问量。中国是黄色,美国是蓝色,日本是紫色,欧洲是红色。2. Cybermap

网址: http://cybermap.kaspersky.com/由卡巴斯基制作的 Cybermap,能实时展现现在世界上有多少起服务器攻击事件。地球上纵横交错的蓝色、绿色、红色线条表示服务器攻击事件。3. Tweetping

网址: http://tweetping.net/世界上使用Twier的规模分布。4.earth wind map

网址: http://earth.nullschool.net/世界各地的风速、风向的可视化地图。根据美国国家气象局的气象数据制作。

作者:李璋参考资料

[1] http://www.ourd3js.com/wordpress/?p=2209

[2] http://d3js.org/

[3] http://liginc.co.jp/web/service/other-service/90986

[4] データ可視化「実践」入門,森藤大地,あんちべ,2014

[5] http://www.tableau.com

[6] 数据新闻网http://djchina.org/

来源:狐说

发表评论

评论已关闭。

相关文章