📅  最后修改于: 2021-01-08 09:17:28             🧑  作者: Mango
R Programming Tutorial是为初学者和专业人士设计的。我们的教程提供了数据分析和可视化的所有基本和高级概念。
R是一个软件环境,用于分析统计信息和图形表示。 R允许我们使用函数进行模块化编程。
我们的R教程包括R的所有主题,例如介绍,功能,安装,rstudio ide,变量,数据类型,运算符,if语句,向量,数据处理,图形,统计建模等。该编程语言基于R两位作者的首字母(Robert Gentleman和Ross Ihaka)。
“ R是一种解释性的计算机编程语言,由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建。” R开发核心团队目前正在开发R。它也是用于分析统计信息,图形表示,报告和数据建模的软件环境。 R是S编程语言的实现,结合了词法作用域语义。
R不仅允许我们进行分支和循环,而且允许使用函数进行模块化编程。 R允许与用C,C++ 、. Net, Python和FORTRAN语言编写的过程集成,以提高效率。
在当今时代,R是最重要的工具之一,研究人员,数据分析师,统计学家和市场营销人员使用R来检索,清理,分析,可视化和呈现数据。
R的历史可以追溯到20到30年前。 R由Ross lhaka和Robert Gentleman在新西兰奥克兰大学开发,R开发核心团队目前正在开发它。该编程语言名称取自两个开发人员的名称。 1992年考虑了第一个项目。1995年发布了初始版本,2000年发布了稳定的beta版本。
下表显示了R语言的发布日期,版本和说明:
Version-Release | Date | Description |
---|---|---|
0.49 | 1997-04-23 | First time R’s source was released, and CRAN (Comprehensive R Archive Network) was started. |
0.60 | 1997-12-05 | R officially gets the GNU license. |
0.65.1 | 1999-10-07 | update.packages and install.packages both are included. |
1.0 | 2000-02-29 | The first production-ready version was released. |
1.4 | 2001-12-19 | First version for Mac OS is made available. |
2.0 | 2004-10-04 | The first version for Mac OS is made available. |
2.1 | 2005-04-18 | Add support for UTF-8encoding, internationalization, localization etc. |
2.11 | 2010-04-22 | Add support for Windows 64-bit systems. |
2.13 | 2011-04-14 | Added a function that rapidly converts code to byte code. |
2.14 | 2011-10-31 | Added some new packages. |
2.15 | 2012-03-30 | Improved serialization speed for long vectors. |
3.0 | 2013-04-03 | Support for larger numeric values on 64-bit systems. |
3.4 | 2017-04-21 | The just-in-time compilation (JIT) is enabled by default. |
3.5 | 2018-04-23 | Added new features such as compact internal representation of integer sequences, serialization format etc. |
R是一种特定于领域的编程语言,旨在进行数据分析。它具有一些独特的功能,使其功能非常强大。可以说,最重要的是向量的表示法。这些向量使我们可以在单个命令中对一组值执行复杂的操作。 R编程具有以下功能:
市场上有几种工具可以执行数据分析。学习新语言是需要时间的。数据科学家可以使用两个出色的工具,即R和Python。在开始学习数据科学时,我们可能没有时间去学习它们。学习统计建模和算法比学习编程语言更为重要。编程语言用于计算和传达我们的发现。
数据科学中的重要任务是我们处理数据的方式:清理,特征工程,特征选择和导入。这应该是我们的主要重点。数据科学家的工作是了解数据,对其进行操作并提供最佳方法。对于机器学习,可以使用R. Keras和TensorFlow实施最佳算法,从而使我们能够创建高端机器学习技术。 R具有执行Xgboost的程序包。 Xgboost是Kaggle竞争的最佳算法之一。
R与其他语言进行通信,并可能调用Python,Java和C++。 R也可以访问大数据世界。我们可以将R与其他数据库连接,例如Spark或Hadoop 。
简而言之,R是研究和探索数据的好工具。精细的分析(例如聚类,相关性和数据约简)是使用R完成的。
数据科学负责识别,提取和表示来自数据源的有意义的信息。 R, Python,SAS,SQL,Tableau,MATLAB等是用于数据科学的最有用的工具。 R和Python是最常用的。但仍然,在R和Python这两者中选择更好或最合适的一种变得令人困惑。
Comparison Index | R | Python |
---|---|---|
Overview | “R is an interpreted computer programming language which was created by Ross Ihaka and Robert Gentleman at the University of Auckland, New Zealand .” The R Development Core Team currently develops R. R is also a software environment which is used to analyze statistical information, graphical representation, reporting, and data modeling. | Python is an Interpreted high-level programming language used for general-purpose programming. Guido Van Rossum created it, and it was first released in 1991. Python has a very simple and clean code syntax. It emphasizes the code readability and debugging is also simple and easier in Python. |
Specialties for data science | R packages have advanced techniques which are very useful for statistical work. The CRAN text view is provided by many useful R packages. These packages cover everything from Psychometrics to Genetics to Finance. | For finding outliers in a data set both R and Python are equally good. But for developing a web service to allow peoples to upload datasets and find outliers, Python is better. |
Functionalities | For data analysis, R has inbuilt functionalities | Most of the data analysis functionalities are not inbuilt. They are available through packages like Numpy and Pandas |
Key domains of application | Data visualization is a key aspect of analysis. R packages such as ggplot2, ggvis, lattice, etc. make data visualization easier. | Python is better for deep learning because Python packages such as Caffe, Keras, OpenNN, etc. allows the development of the deep neural network in a very simple way. |
Availability of packages | There are hundreds of packages and ways to accomplish needful data science tasks. | Python has few main packages such as viz, Sccikit learn, and Pandas for data analysis of machine learning, respectively. |
有多个实时应用程序。一些受欢迎的应用程序如下:
R编程用于统计信息和数据表示。因此,我们需要在数学上具有统计理论的知识。理解用于数据表示的不同类型的图最重要的是,我们应该具有任何编程的先验知识。
本教程对有兴趣获得数据分析项目实施知识的学生很有帮助。本教程涵盖了R的所有基础知识以及如何使用R进行数据分析。
我们向您保证,此R编程教程不会有任何问题。但是,如果有任何错误,请在联系表格中发布问题。