详解Python3 pandas.merge用法

yipeiwu_com6年前 (2020-03-06)Python基础

摘要

数据分析与建模的时候大部分时间在数据准备上，包括对数据的加载、清理、转换以及重塑。pandas提供了一组高级的、灵活的、高效的核心函数，能够轻松的将数据规整化。这节主要对pandas合并数据集的merge函数进行详解。(用过SQL或其他关系型数据库的可能会对这个方法比较熟悉。)码字不易，喜欢请点赞！！！

1.merge函数的参数一览表

2.创建两个DataFrame

在这里插入图片描述

3.pd.merge()方法设置连接字段。

默认参数how是inner内连接，并且会按照相同的字段key进行合并，即等价于on=‘key'。

在这里插入图片描述

也可以显示的设置on=‘key'，这里也推荐这么做。

在这里插入图片描述

当两边合并字段不同时，可以使用left_on和right_on参数设置合并字段。当然这里合并字段都是key所以left_on和right_on参数值都是key。

在这里插入图片描述

4.pd.merge()方法设置连接方法。

主要包括inner（内连接）、outer（外链接）、left（左连接）、right（右连接）。

参数how默认值是inner内连接，上面的都是采用内连接，连接两边都有的值。

当采用outer外连接时，会取并集，并用NaN填充。

在这里插入图片描述

外连接其实左连接和右连接的并集。左连接是左侧DataFrame取全部数据，右侧DataFrame匹配左侧DataFrame。（右连接right和左连接类似）

在这里插入图片描述

5.pd.merge()方法索引连接，以及重复列名命名。

pd.merge()方法可以通过设置left_index或者right_index的值为True来使用索引连接，例如这里df1使用data1当连接关键字，而df2使用索引当连接关键字。

在这里插入图片描述

从上面可以发现两个DataFrame中都有key列，merge合并之后，pandas会自动在后面加上（_x,_y）来区分，我们也可以通过设置suffixes来设置名字。

在这里插入图片描述

总结

以上所述是小编给大家介绍的详解Python3 pandas.merge用法,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

相关文章

基于Django实现日志记录报错信息

这篇文章主要介绍了基于Django实现日志记录报错信息,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下当服务器500错误的时候，普通日...

Python读取一个目录下所有目录和文件的方法

本文实例讲述了Python读取一个目录下所有目录和文件的方法。分享给大家供大家参考，具体如下：这里介绍的是刚学python时的一个读取目录的列子，给大家分享下： #!/usr/bi...

django使用xadmin的全局配置详解

django使用xadmin的全局配置详解

这篇主要写一些xadmin一些基础的全局设置主题设置首先需要在创建好的app中新建一个adminx.py的文件，然后添加代码 # _*_ coding: utf-8 _*_ i...

Pytorch DataLoader 变长数据处理方式

关于Pytorch中怎么自定义Dataset数据集类、怎样使用DataLoader迭代加载数据，这篇官方文档已经说得很清楚了，这里就不在赘述。现在的问题：有的时候，特别对于NLP任务...

浅析PEP572: 海象运算符

现在已经是Python 3.8的最后一个alpha版本，接着就是本月底要发布的的3.8.0 beta 1了。按规定，3.8已经不会再添加(修改)功能了，之前非常有争议的PEP 572的实...