掌握 Python 数据分析的核心数据结构
Pandas Series 是 Python 中用于处理一维带标签数组的数据结构,是 pandas 库中最基本的构建模块之一。它类似于 NumPy 的一维数组,但具备更强大的功能,例如:
Series 可以从多种数据源创建,包括列表、字典、NumPy 数组等。
示例 1:从列表创建
import pandas as pd
s = pd.Series([10, 20, 30, 40])
print(s)
示例 2:自定义索引
s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(s)
示例 3:从字典创建
data = {'apple': 5, 'banana': 3, 'orange': 8}
s = pd.Series(data)
print(s)
Series 提供了多个实用属性和方法:
.index:获取索引.values:获取底层 NumPy 数组.dtype:数据类型.shape:形状(长度).head(n) / .tail(n):查看前/后 n 行.describe():统计摘要提示:Series 支持向量化运算,如 s * 2、s + s 等,且会自动对齐索引。
Series 常用于以下场景: