Pandas_cum累积计算和rolling滚动计算的用法详解

yipeiwu_com5年前Python基础

Pandas主要统计特征函数:

方法名 函数功能
sum() 计算数据样本的总和(按列计算)
mean() 计算数据样本的算术平均数
var() 计算数据样本的方差
std() 计算数据样本的标准差
corr() 计算数据样本的Spearman(Pearman)相关系数矩阵
cov() 计算数据样本的协方差矩阵
skew() 样本值的偏度(三阶矩)
kurt() 样本值的峰度(四阶矩)
describe() 给出样本的基本描述(基本统计量如均值、标准差等)

cum累积计算函数

cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum()

方法名 函数功能
cumsum() 依次给出前1、2、… 、n个数的和
cumprod() 依次给出前1、2、… 、n个数的积
cummax() 依次给出前1、2、… 、n个数的最大值
cummin() 依次给出前1、2、… 、n个数的最小值

计算出前n项和:

D=pd.Series(range(0,20))
D.cumsum() 
0    0
1    1
2    3
3    6
....
19  190
dtype: int64

rolling滚动计算函数

rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。

方法名 函数功能
rolling_sum() 计算数据样本的总和(按列计算)
rolling_mean() 数据样本的算术平均数
rolling_var() 计算数据样本的方差
rolling_std() 计算数据样本的标准差
rolling_corr() 计算数据样本的Spearman(Pearman)相关系数矩阵
rolling_cov() 计算数据样本的协方差矩阵
rolling_skew() 样本值的偏度(三阶矩)
rolling_kurt() 样本值的峰度(四阶矩)

依次对相邻两项求和:

pd.rolling_sum(D,2)
0   NaN  
1   1.0
2   3.0
3   5.0
4   7.0
....
19  37.0
dtype: float64

以上这篇Pandas_cum累积计算和rolling滚动计算的用法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

numpy linalg模块的具体使用方法

最近在看机器学习的 LogisticRegressor,BayesianLogisticRegressor算法,里面得到一阶导数矩阵g和二阶导数Hessian矩阵H的时候,用到...

Python上下文管理器用法及实例解析

这篇文章主要介绍了Python上下文管理器用法及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 with上下文管理器 语法:...

python3+pyqt5+itchat微信定时发送消息的方法

python3+pyqt5+itchat微信定时发送消息的方法

编这个程序是想过节过年,一些重要的纪念日,给亲戚好友发祝福之类的,但要凌晨0点才显得比较有诚意,可我又比较贪睡,常常忘了,所以就有了编个微信定时发送消息小程序. 运行环境: python...

Python线程指南分享

Python线程指南分享

本文介绍了Python对于线程的支持,包括“学会”多线程编程需要掌握的基础以及Python两个线程标准库的完整介绍及使用示例。 注意:本文基于Python2.4完成,;如果看到不明白的词...

Pandas之Dropna滤除缺失数据的实现方法

约定: import pandas as pd import numpy as np from numpy import nan as NaN 滤除缺失数据 pandas的设计目...