📜  获取假人并将它们输入到 pandas 数据框 - Python (1)

📅  最后修改于: 2023-12-03 15:41:27.381000             🧑  作者: Mango

获取假人并将其输入到 Pandas 数据框 - Python

在许多数据科学项目中,我们需要大量的测试数据。创建假人数据是一个好方法来快速构建虚拟数据。在本教程中,我们将介绍如何使用 Python 的 Faker 库来生成假人数据,并将其输入到 Pandas 数据框中。

安装 Faker 库

要安装 Faker 库,请使用以下命令:

pip install Faker
创建假人数据

使用 Faker 库是生成假人数据的最简单和最快捷的方法。这个库可以用来生成各种假数据,如人名、地址、电话号码、电子邮件等。 在以下示例中,我们将创建一个 fake_person 函数来生成随机的假人数据。

from faker import Faker
import pandas as pd

fake = Faker()

def fake_person():
    name = fake.name()
    email = fake.email()
    phone = fake.phone_number()
    address = fake.address()
    dob = fake.date_of_birth()
    return (name, email, phone, address, dob)

fake_person 函数将返回一个包含假人的姓名、电子邮件、电话号码、地址和出生日期的元组。

输入数据到 Pandas 数据框

现在我们已经创建了一个函数来生成假人数据,让我们将这些数据输入到一个 Pandas 数据框中。

data = []

for i in range(100):
    data.append(fake_person())

df = pd.DataFrame(data, columns=['Name', 'Email', 'Phone', 'Address', 'DOB'])
print(df)

在这个代码片段中,我们使用 for 循环和 append 方法来将生成的假人数据添加到一个名为 data 的列表中。接下来,我们使用 Pandas 的 DataFrame 函数将 data 列表转换为数据框,并指定每一列的名称。最后,我们打印数据框。

输出结果应为:

                  Name                                             Email                 Phone                                            Address         DOB
0       Henry Johnston                      towandanewman@wright-harvey.info  +1-161-643-4971x8917                      531 Green Groves\nParker, OK  1971-03-27
1         Kevin Harris                  kathleen01@reed-gardner-baker.info  707-490-9301x921051                             USNV Black\nFPO AA 40823  1910-10-23
2           Mark Moore                                   joewu@gmail.com         +19303341178     984 Garcia Mews Apt. 416\nWest Michaelburgh, ME    1904-02-05
3         Rickey Smith                           hreadymindy@hotmail.com            8426485366        72559 Castillo Groves\nNew Valerie, AL  1927-06-12
4    Jacqueline Benson                             cmccullough@wade.com   634-508-7522x83495      017 Barrett Mount\nNew Nathanieltown, KS  1952-04-22
..                 ...                                               ...                   ...                                                ...         ...
95        Susan Nelson  christina91@alexander-schultz-saunders-henry.com  +1-790-686-3142x7559   1969 Matthew Knoll\nNorth Shawnaville, WI 02344  1918-07-15
96    Kathryn Figueroa                   christophermmiller@hotmail.com     (805)817-4685x880            41931 Bradford Glen\nNew Vince, MA    1914-12-18
97   Patricia Peterson                                  aaustin@yahoo.com            491.376.4598             48712 Scott Skyway\nPrincehaven, FL    1913-05-10
98  Terrance Rodriguez                   kevinpham@gallegos-anderson.com           920.753.0673         655 Britney Forge\nPort Carlosville, NY    1908-11-15
99        Dale Russell                              carl58@bailey.com         1-648-955-0372  6238 Candace Bypass\nWest Matthewfurt, AK 60176  1999-05-24

[100 rows x 5 columns]

我们可以看到,我们已经成功地将生成的假人数据输入到了 Pandas 数据框中。

在本教程中,我们介绍了如何使用 Python 的 Faker 库来生成假人数据,并将其输入到 Pandas 数据框中。通过使用这些方法,您可以快速生成假数据并在数据科学项目中使用它们。