📅  最后修改于: 2021-01-08 14:07:38             🧑  作者: Mango
在本主题中,我们将比较这三种语言的各个方面,以使您对这些语言的市场价值和功能有清晰的认识,以便选择可以继续前进的语言。
众所周知,要学习数据分析,您可以使用三种重要的语言,分别是Python,R和SAS。
如果您是数据科学界的新手,并且没有上述任何一种语言的经验,那么熟悉至少一种语言至关重要。
首先,让我们快速介绍这三种语言。
谈到企业分析领域,SAS目前是无可争议的市场领导者。它提供了大量的统计功能;它提供了一个支持良好的技术支持团队。它还具有良好的GUI,让People可以比其他人更快地获取它。
R是一种开放源代码编程语言。我们可以免费访问它并执行所有数据分析任务。它是用于统计的通用语言。
当前,R是使用最广泛的编程语言,也是数据科学家的首选。它由一个才华横溢且朝气蓬勃的贡献者社区提供支持。 R也是大学教学大纲的一部分,这就是为什么在大学教授R。它部署在关键业务应用程序上。
Python是一种开源的多用途语言。如今,它已在数据科学中变得非常流行。其背后的原因是其庞大的数据挖掘和活跃的社区。
现在,我们将在各个方面进行比较:
让我们以专业的角度来看一下用法。
一家国际人力资源公司向大约1000名定性专业人士询问了他们喜欢哪种语言-是SAS,R还是Python。调查的一些结果如下:
请参见下面的饼图:
让我们看看各个行业的偏好。
大型公司通常更喜欢使用SAS提供更好的客户服务,这就是SAS在营销公司和金融服务部门中占据优势的原因,因为后者无需担心工具选择的预算。
另一方面, Python和R在新兴公司和中型公司中使用。高科技公司和电信公司都需要大量非结构化数据才能进行分析,因此,这些领域的许多数据科学家都使用R和Python更适合的机器学习技术。
在图形中,您可以看到各个行业的工具偏好设置,例如金融服务,市场营销,医疗保健,零售等。
SAS是一种昂贵的软件,用于商业目的,通常由预算较大的大型公司使用。但是,R和Python是免费的开源软件,我们都可以免费下载和学习它。
SAS编程无须先决条件,因为它具有易于使用的简单GUI。通过将其本机程序包与宏结合使用,可以解析SQL代码,它有助于为具有SQL基本知识的人学习SAS。
在Python中分析数据时,我们需要Scipy,Pandas和Numpy等数据挖掘库。紧迫的是,我们无法使用本机Python语言进行数据分析。
用Python库(Scipy,Pandas和Numpy)编写的代码有点类似于R库的代码。因此,对于已经了解数据科学中R的人们来说,学习Python很容易。对于那些已经知道R的人,建议在开始学习Python数据挖掘生态系统之前先学习Python编程语言的基础知识。
SAS是一种非常有效的语言,用于使用SQL进行很好的集成的顺序数据访问和数据库访问。使用拖放界面,人们可以轻松快速地创建更好的统计模型。
当数据分析任务需要独立服务器时,首选R。它是内存分析中最好的工具,也是探索数据的绝佳工具。
Numpy,Scipy,Pandas和Scikit等Python库使它成为仅次于R的数据科学中第二受欢迎的编程语言。您还可以使用Seaborn和Matlplotlib等库创建漂亮的图形和图表。
R和Python通过邮件列表,堆栈溢出以及其他用户提供的文档和代码在线提供了巨大的社区支持。
由社区管理员管理的在线活动社区支持SAS。