技术开发 频道

数据科学家常用的10种编程语言和工具

  【IT168 翻译】SAP大中华区副总裁刘伟曾经在DTCC大会上说过:“数据科学家是21世纪最性感的职业”。那么要进入数据科学领域应该掌握哪些技能?如何从一个数据分析师转变角色成为一个数据科学家?首先你要对数据科学家这份工作做一个研究,例如数据科学家需要掌握哪些数据科学工具和编程语言?一般来说,R和Python是需要重点掌握的。如果你已经掌握了一些编程语言,那么你就应该关注一些流行的工具。

  数据分析和数据科学家是一个很好的职业发展方向。职业网站Glassdoor将数据科学家评为2016美国最好的工作。据悉,数据科学家的平均年薪为116840美元,目前有很大的市场需求。同时,数据科学家也荣登Glassdoor的best Work-Life Balance 名单。

  我们采访了当前的数据分析师和数据科学家,总结了他们认为从事数据科学必备的技能、语言和工具。接下来,我们就来看一下到底有哪些工具和编程语言受到了数据科学家的青睐。

  R

数据科学家常用的10种编程语言和工具

  数据科学家和分析人员有两大神器,其中之一就是R。R是由Ross Ihaka 和Robert Gentleman创建的开源语言,主要用于数据分析和数据可视化。 R有非常活跃的用户社区,社区提供R安装包,也会对R的相关问题进行解答。R语言已经引起了很多企业的重视。微软旗下的企业平台支持R语言。

  Python

数据科学家常用的10种编程语言和工具

  数据科学家的另一个神器就是Python。Python最早出现在1990年,是由Guido van Rossem创建的。如果你准备从事数据科学家和分析师的工作,那么你首要掌握的技能就是R或Python。Python是一款较为通用的语言,被Datacamp网站评为最适合编程初学者的语言。相对来说,R的学习曲线较为陡峭。

  Scala

数据科学家常用的10种编程语言和工具

  Scala集成了面向对象编程和函数式编程的各种特性。它是实时数据处理最流行的语言。它是很多流数据技术的实现语言,例如Apache Spark和Apache Kafka。 O'Reilly的2015年数据科学薪酬调查指出,Scala工程师的薪资在2015年上涨了10%。

  SQL

数据科学家常用的10种编程语言和工具

  SQL虽然不应用于大数据,但仍然是数据分析中非常受欢迎的工具。 O'Reilly的调查指出,68%的受访者表示他们在使用SQL。SQL是关系数据库管理系统的标准语言,现在仍有很多的传统企业在使用RDBMS。因此,SQL仍然是企业组织的重要工具。

  Excel

数据科学家常用的10种编程语言和工具

  即使是在高级工具层出不穷的时代,Excel仍然是一个很流行的工具。 据O'Reilly的调查,59%的数据科学家和分析师在使用Excel,而且和去年同期相比,Excel的使用率没有下降。Excel是数据分析的主力,因为它的普遍性和易用性,成为了非程序员和分析师的首选工具。

  SAS

数据科学家常用的10种编程语言和工具

  SAS进入了Gartner高级分析平台魔力象限的领导者象限,无论是在前瞻性还是执行力都表现出色。SAS是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件,直到现在,仍然焕发着勃勃生机,是现下流行的数据分析工具。数据科学家使用Crowdflower对LinkedIn上数以千计的招聘信息进行了分析,发现SAS的需求量大概在15%~20%之间。

  Java

数据科学家常用的10种编程语言和工具

  据Crowdflower分析显示,数据科学家这项工作对Java的要求提高了,LinkedIn上大约有35%~40%的数据科学家招聘广告中都明确要求有Java工作经验。O'Reilly的调查显示Java的使用率从2014年的32%下降至2015年23%,但是有25%的受访数据科学家表示Java是他们的常用语言。

  MatLab

数据科学家常用的10种编程语言和工具

  MatLab是MathWorks公司1984年开发的商业数学软件,在学术界的影响力很大,主要用于数据采集和数学建模。 O'Reilly的调查显示,MatLab的使用率出现了下降,但是Crowdflower分析则表示,目前MatLab的市场空缺达到了85%-90%。

  SPSS

数据科学家常用的10种编程语言和工具

  SPSS让IBM进入了Gartner高级分析平台魔力象限的领导者象限。现在,许多大学都采用SPSS技术来进行他们的学位工作。SPSS于2009年被IBM收购,现在旗下已经有一系列的子产品。

  Julia

数据科学家常用的10种编程语言和工具

  Julia相比于其他工具是一个比较新的工具,知名度不是很广。Julia的主要应用场景是培训咨询和商业支持。VentureBeat认为Julia是一款可以替代数据科学专有工具的免费工具,相比于Python和R语言更为现代。

  原文出处:

  http://www.informationweek.com/devops/programming-languages/10-programming-languages-and-tools-data-scientists-use-now

1
相关文章