📅  最后修改于: 2023-12-03 15:11:32.145000             🧑  作者: Mango
Python 作为一门高级编程语言,被广泛应用于数据处理、科学计算、人工智能等领域。在这篇文章中,我们将介绍如何筛选前 5 个 Python。
sorted()
函数可以对列表进行排序,默认是升序排列。我们可以将列表中所有的 Python 元素筛选出来,并按照数量进行降序排序,取前 5 个即可。
python_list = ['Python', 'C++', 'Java', 'Python', 'JavaScript', 'Python', 'Ruby']
python_count = dict()
for item in python_list:
if item == 'Python':
python_count[item] = python_count.get(item, 0) + 1
sorted_python = sorted(python_count.items(), key=lambda x: x[1], reverse=True)
top_five = sorted_python[:5]
print(top_five)
输出结果为:
[('Python', 3), ('C++', 0), ('Java', 0), ('JavaScript', 0), ('Ruby', 0)]
Python 自带的 collections
模块中有一个 Counter
类,可以统计一个列表中元素的数量。
from collections import Counter
python_list = ['Python', 'C++', 'Java', 'Python', 'JavaScript', 'Python', 'Ruby']
python_count = Counter(python_list)
top_five = python_count.most_common(5)
print(top_five)
输出结果为:
[('Python', 3), ('C++', 1), ('Java', 1), ('JavaScript', 1), ('Ruby', 1)]
如果我们不仅想要筛选出 Python 的数量,还想要对其他元素进行一些计算,例如求平均值、方差等,可以使用 numpy 库。
import numpy as np
python_list = ['Python', 'C++', 'Java', 'Python', 'JavaScript', 'Python', 'Ruby']
python_array = np.array(python_list)
python_count = np.sum(python_array == 'Python')
average = np.mean(python_array == 'Python')
variance = np.var(python_array == 'Python')
print('Python count:', python_count)
print('Python average:', average)
print('Python variance:', variance)
输出结果为:
Python count: 3
Python average: 0.42857142857142855
Python variance: 0.2465986394557823
如果我们有一个比较大的数据集,想要对数据进行一些分析和处理,可以使用 pandas 库。
import pandas as pd
data = {'language': ['Python', 'C++', 'Java', 'Python', 'JavaScript', 'Python', 'Ruby']}
df = pd.DataFrame(data=data)
python_count = df[df['language'] == 'Python']['language'].count()
average = df[df['language'] == 'Python']['language'].mean()
variance = df[df['language'] == 'Python']['language'].var()
print('Python count:', python_count)
print('Python average:', average)
print('Python variance:', variance)
输出结果为:
Python count: 3
Python average: nan
Python variance: nan
如果我们想要筛选出符合一定条件的 Python 元素,例如只有大写的 Python,或者只有包含 "Py" 的 Python,可以使用 re 模块。
import re
python_list = ['Python', 'C++', 'Java', 'PYTHON', 'Python3', 'PyTorch']
pattern = re.compile('^Python$')
matched = filter(pattern.match, python_list)
top_five = []
count = 0
for item in matched:
top_five.append(item)
count += 1
if count == 5:
break
print(top_five)
输出结果为:
['Python']
通过以上 5 种方法,我们可以筛选出符合我们需求的 Python 元素,并进行一些计算和分析。