📜  R教程|学习R编程语言教程

📅  最后修改于: 2021-01-08 09:17:28             🧑  作者: Mango

R编程教程

R Programming Tutorial是为初学者和专业人士设计的。我们的教程提供了数据分析和可视化的所有基本和高级概念。

R是一个软件环境,用于分析统计信息和图形表示。 R允许我们使用函数进行模块化编程。

我们的R教程包括R的所有主题,例如介绍,功能,安装,rstudio ide,变量,数据类型,运算符,if语句,向量,数据处理,图形,统计建模等。该编程语言基于R两位作者的首字母(Robert Gentleman和Ross Ihaka)。

什么是R编程

“ R是一种解释性的计算机编程语言,由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建。” R开发核心团队目前正在开发R。它也是用于分析统计信息图形表示报告数据建模的软件环境。 R是S编程语言的实现,结合了词法作用域语义

R不仅允许我们进行分支和循环,而且允许使用函数进行模块化编程。 R允许与用C,C++ 、. Net, Python和FORTRAN语言编写的过程集成,以提高效率。

在当今时代,R是最重要的工具之一,研究人员,数据分析师,统计学家和市场营销人员使用R来检索,清理,分析,可视化和呈现数据。

R编程的历史

R的历史可以追溯到20到30年前。 R由Ross lhaka和Robert Gentleman在新西兰奥克兰大学开发,R开发核心团队目前正在开发它。该编程语言名称取自两个开发人员的名称。 1992年考虑了第一个项目。1995年发布了初始版本,2000年发布了稳定的beta版本。

下表显示了R语言的发布日期,版本和说明:

Version-Release Date Description
0.49 1997-04-23 First time R’s source was released, and CRAN (Comprehensive R Archive Network) was started.
0.60 1997-12-05 R officially gets the GNU license.
0.65.1 1999-10-07 update.packages and install.packages both are included.
1.0 2000-02-29 The first production-ready version was released.
1.4 2001-12-19 First version for Mac OS is made available.
2.0 2004-10-04 The first version for Mac OS is made available.
2.1 2005-04-18 Add support for UTF-8encoding, internationalization, localization etc.
2.11 2010-04-22 Add support for Windows 64-bit systems.
2.13 2011-04-14 Added a function that rapidly converts code to byte code.
2.14 2011-10-31 Added some new packages.
2.15 2012-03-30 Improved serialization speed for long vectors.
3.0 2013-04-03 Support for larger numeric values on 64-bit systems.
3.4 2017-04-21 The just-in-time compilation (JIT) is enabled by default.
3.5 2018-04-23 Added new features such as compact internal representation of integer sequences, serialization format etc.

R编程的特点

R是一种特定于领域的编程语言,旨在进行数据分析。它具有一些独特的功能,使其功能非常强大。可以说,最重要的是向量的表示法。这些向量使我们可以在单个命令中对一组值执行复杂的操作。 R编程具有以下功能:

  • 它是一种简单有效的编程语言,已经得到了很好的开发。
  • 它是数据分析软件。
  • 它是一种经过精心设计,简单而有效的语言,具有用户定义的,循环的,有条件的和各种I / O功能的概念。
  • 它具有用于数据分析的一致且集成的工具集。
  • 对于数组,列表和向量的不同类型的计算,R包含一组运算符。
  • 它提供有效的数据处理和存储功能。
  • 它是一个开源,功能强大且高度可扩展的软件。
  • 它提供了高度可扩展的图形技术。
  • 它允许我们使用向量执行多个计算。
  • R是一种解释性语言。

为什么要使用R编程?

市场上有几种工具可以执行数据分析。学习新语言是需要时间的。数据科学家可以使用两个出色的工具,即R和Python。在开始学习数据科学时,我们可能没有时间去学习它们。学习统计建模和算法比学习编程语言更为重要。编程语言用于计算和传达我们的发现。

数据科学中的重要任务是我们处理数据的方式:清理,特征工程,特征选择和导入。这应该是我们的主要重点。数据科学家的工作是了解数据,对其进行操作并提供最佳方法。对于机器学习,可以使用R. KerasTensorFlow实施最佳算法,从而使我们能够创建高端机器学习技术。 R具有执行Xgboost的程序包。 Xgboost是Kaggle竞争的最佳算法之一。

R与其他语言进行通信,并可能调用Python,Java和C++。 R也可以访问大数据世界。我们可以将R与其他数据库连接,例如SparkHadoop

简而言之,R是研究和探索数据的好工具。精细的分析(例如聚类,相关性和数据约简)是使用R完成的。

R和Python之间的比较

数据科学负责识别,提取和表示来自数据源的有意义的信息。 R, Python,SAS,SQL,Tableau,MATLAB等是用于数据科学的最有用的工具。 R和Python是最常用的。但仍然,在R和Python这两者中选择更好或最合适的一种变得令人困惑。

Comparison Index R Python
Overview “R is an interpreted computer programming language which was created by Ross Ihaka and Robert Gentleman at the University of Auckland, New Zealand .” The R Development Core Team currently develops R. R is also a software environment which is used to analyze statistical information, graphical representation, reporting, and data modeling. Python is an Interpreted high-level programming language used for general-purpose programming. Guido Van Rossum created it, and it was first released in 1991. Python has a very simple and clean code syntax. It emphasizes the code readability and debugging is also simple and easier in Python.
Specialties for data science R packages have advanced techniques which are very useful for statistical work. The CRAN text view is provided by many useful R packages. These packages cover everything from Psychometrics to Genetics to Finance. For finding outliers in a data set both R and Python are equally good. But for developing a web service to allow peoples to upload datasets and find outliers, Python is better.
Functionalities For data analysis, R has inbuilt functionalities Most of the data analysis functionalities are not inbuilt. They are available through packages like Numpy and Pandas
Key domains of application Data visualization is a key aspect of analysis. R packages such as ggplot2, ggvis, lattice, etc. make data visualization easier. Python is better for deep learning because Python packages such as Caffe, Keras, OpenNN, etc. allows the development of the deep neural network in a very simple way.
Availability of packages There are hundreds of packages and ways to accomplish needful data science tasks. Python has few main packages such as viz, Sccikit learn, and Pandas for data analysis of machine learning, respectively.

R的应用

有多个实时应用程序。一些受欢迎的应用程序如下:

  • 脸书
  • 谷歌
  • 推特
  • 人力资源咨询小组
  • 阳光基金会
  • RealClimate
  • 国防部
  • XBOX ONE
  • 澳新银行
  • 美国食品药品管理局

先决条件

R编程用于统计信息和数据表示。因此,我们需要在数学上具有统计理论的知识。理解用于数据表示的不同类型的图最重要的是,我们应该具有任何编程的先验知识。

听众

本教程对有兴趣获得数据分析项目实施知识的学生很有帮助。本教程涵盖了R的所有基础知识以及如何使用R进行数据分析。

问题

我们向您保证,此R编程教程不会有任何问题。但是,如果有任何错误,请在联系表格中发布问题。