您现在的位置是:网站首页> 编程资料编程资料

Pandas中Series的属性,方法,常用操作使用案例_python_

2023-05-26 324人已围观

简介 Pandas中Series的属性,方法,常用操作使用案例_python_

包的引入:

import numpy as np import pandas as pd

1. Series 对象的创建

1.1 创建一个空的 Series 对象

s = pd.Series() print(s) print(type(s))

1.2 通过列表创建一个 Series 对象

需要传入一个列表序列

l = [1, 2, 3, 4] s = pd.Series(l) print(s) print('-'*20) print(type(s))

1.3 通过元组创建一个 Series 对象

需要传入一个元组序列

t = (1, 2, 3) s = pd.Series(t) print(s) print('-'*20) print(type(s))

1.4 通过字典创建一个 Series 对象

需要传入一个字典

m = {'zs': 12, 'ls': 23, 'ww': 22} s = pd.Series(m) print(s) print('-'*20) print(type(s))

1.5 通过 ndarray 创建一个 Series 对象

需要传入一个 ndarray

ndarr = np.array([1, 2, 3]) s = pd.Series(ndarr) print(s) print('-'*20) print(type(s))

1.6 创建 Series 对象时指定索引

index:用于设置 Series 对象的索引

age = [12, 23, 22, 34] name = ['zs', 'ls', 'ww', 'zl'] s = pd.Series(age, index=name) print(s) print('-'*20) print(type(s))

1.7 通过一个标量(数)创建一个 Series 对象

num = 999 s = pd.Series(num, index=[1, 2, 3, 4]) print(s) print('-'*20) print(type(s))

ndarr = np.arange(0, 10, 2) s = pd.Series(5, index=ndarr) print(s) print('-'*20) print(type(s))

2. Series 的属性

2.1 values ---- 返回一个 ndarray 数组

l = [11, 22, 33, 44] s = pd.Series(l) print(s) print('-'*20) ndarr = s.values print(ndarr) print('-'*20) print(type(ndarr))

2.2 index ---- 返回 Series 的索引序列

d = {'zs': 12, 'ls': 23, 'ww': 35} s = pd.Series(d) print(s) print('-'*20) idx = s.index print(idx) print('-'*20) print(type(idx))

2.3 dtype ---- 返回 Series 中元素的数据类型

d = {'zs': 12, 'ls': 23, 'ww': 35} s = pd.Series(d) print(s) print('-'*20) print(s.dtype)

2. 4 size ---- 返回 Series 中元素的个数

d = {'zs': 12, 'ls': 23, 'ww': 35} s = pd.Series(d) print(s) print('-'*20) print(s.size)

2.5 ndim ---- 返回 Series 的维数

d = {'zs': 12, 'ls': 23, 'ww': 35} s1 = pd.Series(d) print(s1) print('-'*20) print(s1.ndim) l = [[1, 1], [2, 2], [3, 3]] s2 = pd.Series(l) print(s2) print('-'*20) print(s2.ndim)

2.6 shape ---- 返回 Series 的维度

d = {'zs': 12, 'ls': 23, 'ww': 35} s1 = pd.Series(d) print(s1) print('-'*20) print(s1.shape) print() l = [[1, 1], [2, 2], [3, 3]] s2 = pd.Series(l) print(s2) print('-'*20) print(s2.shape)

3. Series 的方法

3.1 mean() ---- 求算术平均数

l = [12, 23, 24, 34] s = pd.Series(l, index=['zs', 'ls', 'ww', 'zl']) print(s) print() print(s.mean())

3.2 min() max() ---- 求最值

l1 = [12, 23, 24, 34] s1 = pd.Series(l, index=['zs', 'ls', 'ww', 'zl']) print(s1) print() print(s1.max()) print(s1.min()) print() l2 = ['ac', 'ca', 'cd', 'ab'] s2 = pd.Series(l2) print(s2) print() print(s2.max()) print(s2.min())

3.3 argmax() argmin() idxmax() idxmin() ---- 获取最值索引

l1 = [12, 23, 24, 34] s1 = pd.Series(l, index=['zs', 'ls', 'ww', 'zl']) print(s1) print() # argmax() -- 最大值的数字索引 # idxmax() -- 最大值的标签索引 # 两个都不支持字符串类型的数据 print(s1.max(), s1.argmax(), s1.idxmax()) print(s1.min(), s1.argmin(), s1.idxmin())

-六神源码网