Series是Pandas中的一维带标签数组,可通过列表、字典等创建并支持自定义索引;可使用s[‘a’]、s.loc、s.iloc等方式按标签或位置访问数据;支持布尔索引筛选;常用处理方法包括dropna()、fillna()、astype()、replace()及str和apply操作;统计分析涵盖mean()、sum()、describe()、value_counts()等函数,配合缺失值检测isnull(),全面支撑数据清洗与分析任务。

Series 是 Pandas 中一种一维带标签的数组结构,广泛用于、分析和处理。掌握其常用方法能显著提升数据操作效率。以下是 Python 中 Series 常用方法的整理,涵盖创建、访问、运算、统计、处理缺失值等核心操作。
1. 创建与基本属性
Series 可由列表、数组、字典等创建,支持自定义索引。
示例:
-
pd.Series([1, 2, 3], index=['a', 'b', 'c'])—— 用列表创建 -
pd.Series({'x': 10, 'y': 20})—— 用字典创建 -
s.values—— 获取底层 NumPy 数组 -
s.index—— 查看索引 -
s.name, s.index.name—— 设置或查看名称
2. 与选择
支持按标签、位置或条件筛选数据。
常用方式:
-
s['a']或s.a—— 按标签取值(若标签合法) -
s[1:3]—— 切片(支持标签或位置) -
s.loc['a']—— 明确按标签访问 -
s.iloc[0]—— 按位置访问 -
s[s > 5]—— 布尔索引,筛选大于5的值
3. 常用数据处理方法
对数据进行清洗、转换和类型操作。
法语助手旗下的AI智能写作平台,支持语法、拼写自动纠错,一键改写、润色你的法语作文。
31 立即学习“”;
-
s.dropna()—— 删除缺失值 -
s.fillna(0)—— 填充 NaN 值 -
s.astype('str')—— 转换数据类型 -
s.replace(1, 100)—— 替换特定值 -
s.str.lower()—— 字符串操作(需为字符串类型) -
s.apply(lambda x: x*2)—— 对每个元素应用函数
4. 统计与描述性分析
快速获取数据分布和统计信息。
-
s.mean(), s.median(), s.std()—— 均值、中位数、标准差 -
s.sum(), s.min(), s.max()—— 求和、最小、最大 -
s.describe()—— 返回综合统计摘要 -
s.value_counts()—— 统计各值出现次数 -
s.isnull(), s.notnull()—— 检查缺失值
基本上就这些,熟练使用这些方法可以应对大多数数据分析场景。
以上就是Python中Series常用方法整理的详细内容,更多请关注php中文网其它相关文章!
相关标签:
微信扫一扫打赏
支付宝扫一扫打赏
