用pandas按列合并两个文件的实例

yipeiwu_com6年前Python基础

直接上图,图文并茂,相信你很快就知道要干什么。

A文件:

B文件:

可以发现,A文件中“汉字井号”这一列和B文件中“WELL”这一列的属性相同,以这一列为主键,把B文件中“TIME”这一列数据添加到A文件中,如果B文件缺少某些行,则空着,最后A文件的行数不变,效果如下:

代码如下:

# -*- coding: utf-8 -*-
"""
Created on Wed Nov 29 16:02:05 2017
@author: wq
"""
import pandas as pd
df1 = pd.read_csv(u'input.csv', encoding='gbk')
df2 = pd.read_csv('input1.csv', encoding='gbk')
outfile = pd.merge(df1, df2, how='left', left_on=u'汉字井号',right_on='WELL')
outfile.to_csv('outfile.csv', index=False, encoding='gbk')

以上这篇用pandas按列合并两个文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

将python文件打包成EXE应用程序的方法

将python文件打包成EXE应用程序的方法

相信大家都想把自己完成的项目打包成EXE应用文件,然后就可以放在桌面随时都能运行了,下面来分享利用pytinstaller这个第三方库来打包程序,既简单又快捷,我也试过用其他的方式来打包...

Python跑循环时内存泄露的解决方法

Python跑循环时内存泄露的解决方法

Python跑循环时内存泄露 今天在用Tensorflow跑回归做测试时,仅仅需要循环四千多次 (补充说一句,我在个人PC上跑的)。运行以后,我就吃饭去了。等我回来后,Console窗口...

Python3.6+selenium2.53.6自动化测试_读取excel文件的方法

Python3.6+selenium2.53.6自动化测试_读取excel文件的方法

环境: 编辑工具: 浏览器: 安装xlrd 安装DDT 一 分析 1 目录结构 2 导入包 二 代码 import xlrd cla...

如何基于python测量代码运行时间

这篇文章主要介绍了如何基于python测量代码运行时间,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Python 社区有句俗语: “...

TensorFlow tensor的拼接实例

TensorFlow提供两种类型的拼接: tf.concat(values, axis, name='concat'):按照指定的已经存在的轴进行拼接 tf.stack(values...