使用NumPy和pandas对CSV文件进行写操作的实例

yipeiwu_com6年前Python基础

数组存储成CSV之类的区隔型文件:

下面代码给随机数生成器指定种子,并生成一个3*4的NumPy数组

将一个数组元素的值设为NaN:

 In [26]: import numpy as np
 In [27]: np.random.seed(42)
 In [28]: a = np.random.randn(3,4)
 In [29]: a[2][2] = np.nan
 In [30]: print(a)
 [[ 0.49671415 -0.1382643  0.64768854 1.52302986]
 [-0.23415337 -0.23413696 1.57921282 0.76743473]
 [-0.46947439 0.54256004     nan -0.46572975]]

NumPy的savetxt()函数是与loadtxt()相对应的一个函数,它能以诸如CSV之类的区隔型文件格式保存数组:

In [31]: np.savetxt('np.csv',a,fmt='%.2f',delimiter=',',header="#1,#2,#3,#4")

上面的函数调用中,我们规定了用以保存数组的文件的名称、数组、可选格式、间隔符和一个可选的标题

通过cat np.csv,可以查看刚才所建的np.csv文件的具体内容

利用随机数组来创建pandas DataFrame:

 In [38]: df = pd.DataFrame(a)
 In [39]: df
 Out[39]: 
  0     1     2     3
 0 0.496714 -0.138264 0.647689 1.523030
 1 -0.234153 -0.234137 1.579213 0.767435
 2 -0.469474 0.542560    NaN -0.465730

pandas会自动替我们给数据取好列名

利用pandas的to_csv()方法可以为CSV文件生成一个DataFrame:

In [40]: df.to_csv('pd.csv',float_format='%.2f',na_rep="NAN!")

对于这个方法,我们需要提供文件名、类似于NumPy的savetxt()函数的格式化参数的可选格式串和一个表示NaN的可选字符串

以上这篇使用NumPy和pandas对CSV文件进行写操作的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python正则分析nginx的访问日志

前言 本文的脚本是分析nginx的访问日志, 主要为了检查站点uri的访问次数的,检查的结果会提供给研发人员做参考,因为谈到分析嘛,那肯定要用到正则表达式了,所以请没有接触过正则的小伙伴...

Pyhton中防止SQL注入的方法

复制代码 代码如下: c=db.cursor() max_price=5 c.execute("""SELECT spam, eggs, sausage FROM breakfast &...

Python设计模式之命令模式简单示例

Python设计模式之命令模式简单示例

本文实例讲述了Python设计模式之命令模式。分享给大家供大家参考,具体如下: 命令模式介绍: 在面向对象编程中,命令模式是概括所有方法信息的设计模式。 此模式对象包涵方法名,及其相关参...

使用django的ORM框架按月统计近一年内的数据方法

如下所示: # 计算时间 time = datetime.datetime.now() - relativedelta(years=1) # 获取近一年数据 one_year_dat...

python实现一个简单的并查集的示例代码

并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。常常在使用中以森林来表示。 并查集有三种基本操作,获得根节点,判断两节点是否连通,以及将两不连通的节点相连(相当于将两...