Python利用pandas计算多个CSV文件数据值的实例

yipeiwu_com6年前Python基础

功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件

pip install pandas

import pandas as pd
import glob,os,sys
input_path='./'
output_fiel='pandas_union_concat.csv'
all_files=glob.glob(os.path.join(input_path,'sales_*'))
all_data_frames=[]
for file in all_files:
  data_frame=pd.read_csv(file,index_col=None)
  total_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).sum()
  average_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).mean()
  data={
    'filename':os.path.basename(file),
    'total_sales':total_sales,
    'average_sales':average_sales
  }
  all_data_frames.append(pd.DataFrame(data,columns=['filename','total_sales','average_sales']))
data_frame_concat=pd.concat(all_data_frames,axis=0,ignore_index=True)
data_frame_concat.to_csv(output_fiel,index=False)

以上这篇Python利用pandas计算多个CSV文件数据值的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python中字典和集合学习小结

映射类型:     表示一个任意对象的集合,且可以通过另一个几乎是任意键值的集合进行索引     与序列不同,映射是无序的,通...

python 统计一个列表当中的每一个元素出现了多少次的方法

如下所示: #coding=utf-8 #方式一 print('*'*20 + '方式一' + '*'*20) li1 = [1,2,2,3,3,3,4,4,4,4,5,5,5,5,...

Python的网络编程库Gevent的安装及使用技巧

安装(以CentOS为例) gevent依赖libevent和greenlet: 1.安装libevent 直接yum install libevent 然后配置python的安装 2....

详解利用OpenCV提取图像中的矩形区域(PPT屏幕等)

详解利用OpenCV提取图像中的矩形区域(PPT屏幕等)

前言 最近参加了大创项目,题目涉及到计算机视觉,学姐发了个修正图像的博客链接,于是打算用这个题目入门OpenCV。 分析问题 照片中的PPT区域总是沿着x,y,z三个轴都有倾斜(如下图)...

python在Windows8下获取本机ip地址的方法

本文实例讲述了python在Windows8下获取本机ip地址的方法。分享给大家供大家参考。具体实现方法如下: import socket hostname = socket.ge...