机器学习是一个研究领域,它使机器无需直接编程即可学习。随着许多学生、教师、开发人员和数据科学家使用机器学习来开发各种项目和产品,机器学习发展成为趋势。但是,开发机器学习模型需要很高的系统要求规范,因为有时模型训练过程可能需要 2 小时到 2 天甚至更长时间。因此,低端系统无法处理好的机器学习模型的训练,或者即使它们以某种方式训练模型,也可能会出现关键的系统问题。
但是,有许多开源机器学习环境可用,它们不需要任何系统要求规范,并使用云基础设施在尽可能最佳的时间内训练您的模型。以下是最高效、最常用的在线机器学习环境:
1.谷歌合作实验室
它是一种可以轻松访问以开发产品和项目的云服务,由 Google 提供。它支持免费 GPU,并基于Jupyter Notebooks 设置。它提供给大家构建机器学习和使用广泛使用的库,例如PyTorch,TensorFlow和Keras深学习应用的论坛。它为您的系统提供了一种无需承担 ML 活动全部工作负载的方法。它是同类平台中最成功的平台之一。
- RAM – 12 GB 到 26.75 GB
- 磁盘空间– 25 GB
- CPU 核心– 2
- 支持的语言Python
2. IBM沃森
IBM 推出了 Watson 数据平台和数据科学体验 (DSX) 来支持开源解决方案。最终,它为数据科学工作推出了多云自由选择平台。这是在Kubernetes对股票容器化的帮助下实现的。因此,它可以分布在Docker或CloudFoundry容器中,无论数据存储在何处。
- 内存– 16 GB
- 磁盘空间– 90 GB
- CPU 核心– 4
- 支持的语言– Apache Spark、 Python、R、Scala
3. Kaggle 内核
它是云中深度学习和机器学习应用程序的绝佳平台。 Kaggle 和 Colab 有很多相似之处,都是谷歌的产品。它支持浏览器中的Jupyter Notebooks。 Jupyter Notebook 的许多键盘快捷键几乎与 Kaggle 相同。 Kaggle 拥有大量数据集,并拥有一个广泛的社区,致力于促进、学习和验证数据科学技能。 GPU 和 TPU 的使用在 Kaggle 内核中有一些使用限制。
- 内存– 25 GB
- 磁盘空间– 155 GB
- CPU 内核– 1
- 支持的语言– Python, R
4.科克拉克
它是一个用于计算、研究、协作和编写文档的虚拟在线工作空间。这包括使用各种科学语言,在LaTeX、R/knitr或 Markdown 中提供作者文本功能、基于 Web 的Linux控制台、时间旅行功能以及网络资源,例如聊天室、课程管理等。但是,它的大部分功能都属于付费计划。
- 内存– 16 GB
- 磁盘空间– 20 GB
- CPU 核心– 3
- 支持的语言– Julia、Octave、 Python、SageMath、R Statistics 等。
5.微软 Azure
微软的 Azure 笔记本在功能上与 Colab 有点相似,但它在速度方面胜出,在这方面比 Colab 好得多。 Azure Notebooks 是一系列名为 Libraries 的链接笔记本。这些库的每个数据文件的大小都小于 100 兆字节。 Azure Notebooks 更适合基本应用程序。 Azure 仅提供 12 个月的免费服务。
- RAM – 变量
- 磁盘空间–变量
- CPU 内核–可变
- 支持的语言– Python、R、F#