神译局是36氪旗下编译团队,重视科技、商业、职场、日子等范畴,关键介绍国外的新技术、新观念、新风向。
编者按:数据科学家是21世纪的抢手作业。工欲善其事必先利其器。数据剖析东西何其多,终究用哪样才适宜?Lewis Chou在Medium上剖析了3类6种东西的特色和适用场景,看完这篇文章,相信你就能够知道了。原文标题是:Top 6 Data Analytics Tools in 2019
说到数据剖析东西,咱们总是有疑问。那么多的数据剖析东西,它们之间终究有什么差异?哪个更好?我应该学习哪一个?
虽然这是一个陈词滥调的论题,但它的确很重要,我一直在尽力寻觅这个终极问题的答案。假如你到网上查找这个范畴的相关信息的话,很难找到公平的观点。由于特定数据剖析东西的评价者或许会从不同的视点动身,并带有一些个人感触。
今日,让咱们放下这些个人感触。我会测验跟咱们一同客观地谈谈我对商场上数据剖析东西的个人观点,以供参阅。
我一共挑选了三类共6种东西。接下来我会逐个进行介绍。
1. Excel东西
Excel具有多种强壮功用,比方创立表单,数据透视表,VBA等,Excel的体系如此巨大,以至于没有任何一项剖析东西能够逾越它,保证了咱们能够依据自己的需求剖析数据。
可是,有些人或许认为他们十分通晓计算机编程言语,然后轻视用Excel作为东西,由于Excel无法处理大数据。可是请考虑一下,咱们日常日子中运用的数据是不是超出了大数据的约束?在我看来,Excel便是一款全能型的播放器。它最合适小型数据,而且经过插件还能够处理数百万的数据。
综上所述,依据Excel的强壮功用及其用户规划,我认为它是必不可少的东西。假如你想学习数据剖析,Excel肯定是首选。
2. BI东西
商业智能是为数据剖析而生的,它诞生的起点很高。其意图是缩短从商业数据到商业决议计划的时刻,并运用数据来影响决议计划。
Excel的产品方针不是这样。Excel能够做许多作业。你能够运用Excel画课程表,制造问卷或用作计算器,乃至能够用来画画。假如你会VBA,还能够制造小型游戏。不过这些并不是真实的数据剖析功用。
可是BI东西便是专门用于数据剖析的。
以常见的BI东西(例如Power BI,FineReport 和Tableau)为例。你会发现它们都是依照数据剖析流程规划的。先是数据处理,数据清洗,然后是数据建模,最终是数据可视化,用图表来辨认问题并影响决议计划。
这些是数据剖析的仅有办法,而且在这个过程中存在一些职工的痛点。
比方说,能够用BI东西来简化重复的低附加值的数据清洗作业。
假如数据量很大,传统东西Excel是无法完结数据透视表的。
假如咱们用Excel来进行图形显现,会需求花费很多时刻来修改图表,包含色彩和字体设置等小事。
这些痛点是BI东西能够为咱们带来改变和价值的当地。
现在,让咱们比较一下商场上的三种盛行的BI东西:Power BI,FineReport 和Tableau。
1 )Tableau
Tableau的中心实质实际上是Excel的数据透视表和数据透视图。能够说Tableau敏锐地认识到了Excel的这一功用。它进入BI商场较早,并连续了这一中心价值。
从开展前史和其时商场反应的视点来看,Tableau的可视化作用更好。我不认为这是由于它的图表有多酷,可是它的规划、色彩和用户界面给咱们一种简略而新鲜的感觉。
的确,这就像Tableau自己的宣扬相同,他们投入了很多的学术精力来研讨咱们喜爱哪种图表,以及如何为用户供给操作和视觉上的终极体会。
此外,Tableau还增加了数据清洗功用和更智能的剖析功用。这也是Tableau能够预期的产品开发优势。
2)Power BI
Power BI的优势在于其事务模型和数据剖析功用。
Power BI曾经是Excel的插件,可是开展并不抱负。因而它摆脱了Excel,开展成BI东西。作为后来者,Power BI每个月都有迭代更新,而且跟进的速度很快。
Power BI其时具有三种授权方法:Power BI Free、Power BI Pro以及Power BI Premium。与Tableau相同,免费版的功用也不完整。可是给个人用简直现已满足。而且Power BI的数据剖析功用强壮。它的PowerPivot 和DAX言语让我能够以相似在Excel中编写公式的方法来进行杂乱的高档剖析。
3)FineReport运用
FineReport之所以共同在于它的自助服务数据剖析十分合适企业用户。只需简略的拖放操作,你就能够运用FineReport 规划各种款式的陈述,并轻松构建数据决议计划剖析体系。
FineReport 能够直接连接到各种数据库,而且方便快捷地自定义各种款式,然后制造周报、月报和季报、年报。其格局相似于Excel的界面。功用包含陈述创立,陈述权限分配,陈述办理,数据输入等。
此外,FineReport 的可视化功用也十分杰出,它供给了多种仪表板模板和许多自行开发的可视插件库。
在价格方面,FineReport 的个人版本是完全免费的,而且一切功用都是敞开的。
3. R&Python言语
R和Python是我要评论的第三类东西。虽然像Excel和BI东西这样的软件已尽最大尽力考虑到数据剖析的大多数运用场景,但其实它们基本上都是定制化的。假如软件没有规划某项功用或替某功用开发按钮,那很或许你就没法用它们来完结作业。
在这一点上面,编程言语是不相同的。它十分强壮和灵敏。你能够编写代码来履行所需的任何操作。比方说,R和Python是数据科学家必不可少的东西。从专业的视点来看,它们肯定比Excel和BI东西强壮。
那么,R和Python能够完成哪些Excel和BI东西难以完成的运用场景呢?
1)专业计算剖析
就R言语而言,它最拿手的是计算剖析,例如正态散布,运用算法对聚类进行分类和回归剖析等。这种剖析就像用数据作试验相同。它能够协助咱们答复以下问题。
比方说,数据的散布是正态散布、三角散布仍是其他类型的散布?离散状况如何?它是否在咱们想要到达的计算可控范围内?不同参数对成果的影响的巨细是多少?还有假定仿真剖析。假如某个参数发生改变,会带来多大影响?
2)独立猜测剖析
比方说,咱们计划猜测顾客的行为。他会在咱们的商铺逗留多长时刻?他会花多少钱?咱们能够找出他的个人信用状况,并依据他的在线消费记载确认借款金额。或许,咱们能够依据他在网页上的阅读前史推送不同的物品。这也触及其时盛行的机器学习和人工智能概念。
定论
以上比较说明晰几种软件之间的差异。我想归纳的关键的是,存在便是合理。Excel,BI东西或编程言语存在部分功用堆叠,但它们也是互补的东西。每个运用的价值取决于要开发的运用的类型和其时的状况。
在挑选数据剖析东西之前,你有必要首要了解自己的作业:你会不会用到我刚刚说到的运用场景。或考虑一下你的工作方向:你是面向数据科学仍是事务剖析的。
译者:boxi。