技术开发 频道

传媒大学沈浩:数据可视化的前世今生

  【IT168 专稿】今年春节期间,百度基于LBS(基于地理位置的服务)、大数据和可视化技术推出了“百度迁徙”,结合央视的报道,首次实现了全程、动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征,也让老百姓真正体会到了大数据的价值。

  由此可见,大数据在可视化后更容易被人们接受和理解。在中国传媒大学的校园里,有一位老师对数据可视化也非常推崇,他经常对自己的学生说“只有看得见,才能做得到;只有看得见,才能做得好”——他就是沈浩教授。

  沈浩教授目前在中国传媒大学新闻学院任教,并担任调查统计研究所的所长。他是一位拥有二十多年统计和数据分析经验、精通各种统计分析技术和方法的资深专家,尤其在数据可视化领域,堪称一位虔诚的布道者。为了进一步了解数据可视化技术的发展历程和未来趋势,IT168记者视频采访了这位数据可视化领域的专家。

  数据可视化的前世今生

  大数据时代主要包括数据科学、网络科学、空间地理科学,以及可视化技术四个重要领域。其中,可视化是极具有艺术性和创意性的,其分类包括数据可视化、信息可视化和交互可视化。数据可视化作为可视化领域的组成部分,已经成为大数据时代的一个重要特征。

  纵览数据可视化的历史,沈教授认为早期的数据可视化并没有得到太多重视,只是强调图表的呈现。对于企业而言主要是企业报表,即报表可视化。从商业角度来看,早期的数据可视化可以归类到商业智能领域。而当今的数据可视化经历了大量技术性的突破,特别是在当前大数据时代下,专注于可视化的产品越来越多。数据可视化的概念从内涵到外延都有了长足的发展,甚至可以从传统商业智能中独立出来。

  当前,数据可视化既是一种呈现数据的方式,也是一种批判的思维方式。从企业用户的角度来看,数据可视化是一种需求,它对企业决策(驾驶舱)具有重要的指导作用。企业管理者和决策者通过仪表盘感知企业的运营数据,不再依靠IT人员就能获取和洞察企业数据。

  早期的数据可以划分为四个层面,即存储层、报表层、分析层、展现层,而随着数据可视化的发展,当前的数据展现层就包含了报表和分析,也就是说数据可以由四个层面简化为存储和展现两个层面。

  谈到数据可视化发展的新趋势,沈教授表示,随着非结构和半结构化数据的增长,数据可视化的发展需要迎合多类型的数据,词云、泡泡图、热图等形式的出现更加贴合新的数据类型。另外,在展现形式上,数据可视化工具还应该满足直接发布到云端、移动端的需求。

  作为中国传媒大学的老师,沈教授还介绍了数据可视化在新闻领域的发展,他表示目前有一种新闻模式叫做数据新闻,它将数据展现与新闻报道相结合,让普通受众感知到数据背后的新闻价值。他在新闻学院开设了数据可视化传播与应用的课程,为学生展示数据提供知识和技能。

  适合中小企业的数据可视化

  Excel也许是我们最早接触到的可视化工具,从2003到2013版本,Excel最大的变革也发生在可视化技术中。沈教授认为数据可视化有两个层面,一是艺术层面,需要专门的设计师将创意融入可视化界面;二是技术层面,既可以通过编程的方式,也通过现有的工具,普通人(非码农)也可以快速实现数据可视化。

  在编程工具中,沈教授从不同角度分别推荐了三款数据可视化工具,即从艺术的角度创作的数据可视化,比较典型的工具是Processing.js,它是为艺术家提供的编程语言。从统计和数据处理的角度上,R语言是一款典型的工具,它本身既可以做数据分析,又可以做图形处理。介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js是一个不错的选择。像D3.js这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。

  除此之外,他还推荐了两款不需要编程的数据可视化工具,首先是Tableau。早在2006年Tableau 3.0版本时,沈浩教授就开始接触这一产品,短短几年间,Tableau已经发展成为商业智能和分析平台的领头羊(2014年Gartner魔力象限)。还有一款产品是Xcelsius水晶易表,现已成为SAP BusinessObjects解决方案中的一款产品。这些让新闻学院的文科生都能熟练使用的数据可视化工具,有一个共同的特点,技术门槛低,并且支持多种数据源。

  沈教授认为,Tableau是一款适合中小企业的、轻量级的数据可视化工具。即使没有编程技术,也可以快速制作出各种报表,处理海量数据,并且可以直接在图表上洞察数据。如果有编程的能力,还可以将与这些编程工具相结合,让它的计算能力更强。

  但是像Tableau这种工具,它只是把数据读进去,却不会写数据,它并不是数据处理的工具。所以我们仍需要可以建模的工具,比如Alteryx的优势是空间数据,它既可以连接数据,也可以建模并上传到云端,还可以与R结合,做更深入的分析。

  对于中小企业的数据可视化应用,沈浩教授更推崇的是云计算的模式。他认为数据可视化并不需几百万的部署费用,那些适合大型企业的BI工具往往是重量级的,价格非常昂贵。

  小结

  从与沈教授的交谈中,笔者深深感受到数据展现过程的重要性,数据可视化工具早已成为沟通数据与价值之间的桥梁。通过数据可视化,我们能够更加直观的从数据中获得洞察,尤其对企业管理和决策更加重要。对于中小企业而言,一款简单、易用、价格低廉的产品或者工具也许更加适用。

0
相关文章