📜  使用随机数创建 pandas 数据框 - Python (1)

📅  最后修改于: 2023-12-03 14:49:58.418000             🧑  作者: Mango

使用随机数创建 pandas 数据框 - Python

在数据分析和科学计算中,pandas 是一个非常强大的工具,它能够方便地处理和分析数据。这篇文章将演示如何使用 Python 的随机数函数 numpy.random 创建一个具有随机数字的数据框。

步骤
步骤1 - 安装pandas和numpy

为了开始编写代码,我们需要先安装 pandas 和 numpy 这两个库。

!pip install pandas numpy
步骤2 - 导入所需的工具

我们需要导入 pandas 和 numpy。

import pandas as pd
import numpy as np
步骤3 - 创建随机数

我们将使用 numpy.random 函数创建随机数。下面的代码将创建一个包含随机整数的数组:

random_int = np.random.randint(10, 50, size=(5, 3))
print(random_int)
[[39 29 41]
 [36 29 13]
 [42 39 18]
 [46 46 16]
 [33 10 13]]

我们可以将这个数组转化为数据框:

df = pd.DataFrame(random_int, columns=['col1', 'col2', 'col3'])
print(df)
col1  col2  col3

0 39 29 41 1 36 29 13 2 42 39 18 3 46 46 16 4 33 10 13

步骤4 - 创建随机小数

我们还可以使用 numpy.random 函数创建随机小数。下面的代码将创建一个包含随机浮点数的数组:

random_float = np.random.rand(5, 3)
print(random_float)
[[0.98480087 0.09682054 0.27026416]
 [0.42585379 0.01675706 0.15781213]
 [0.75406236 0.13994584 0.84380099]
 [0.4132706  0.77035386 0.56134087]
 [0.36579478 0.29461839 0.9367762 ]]

我们可以将这个数组转化为数据框:

df = pd.DataFrame(random_float, columns=['col1', 'col2', 'col3'])
print(df)
   col1      col2      col3

0 0.984801 0.096821 0.270264 1 0.425854 0.016757 0.157812 2 0.754062 0.139946 0.843801 3 0.413271 0.770354 0.561341 4 0.365795 0.294618 0.936776

结论

在本篇文章中,我们学习了如何使用随机数函数 numpy.random 创建随机数字的数据框。这对于模拟数据或测试数据分析脚本时非常有用。