pyspark 读取csv文件创建DataFrame的两种方法

yipeiwu_com6年前 (2020-03-06)Python基础

方法一：用pandas辅助

from pyspark import SparkContext 
from pyspark.sql import SQLContext 
import pandas as pd 
sc = SparkContext()
sqlContext=SQLContext(sc) 
df=pd.read_csv(r'game-clicks.csv') 
sdf=sqlc.createDataFrame(df)

方法二：纯spark

from pyspark import SparkContext 
from pyspark.sql import SQLContext
sc = SparkContext()
sqlContext = SQLContext(sc)
sqlContext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('game-clicks.csv')

以上这篇pyspark 读取csv文件创建DataFrame的两种方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

基于python内置函数与匿名函数详解

内置函数 Built-in Functions abs() dict() help()...

Python处理XML格式数据的方法详解

本文实例讲述了Python处理XML格式数据的方法。分享给大家供大家参考，具体如下：这里的操作是基于Python3平台。在使用Python处理XML的问题上，首先遇到的是编码问题。...

django框架F&Q 聚合与分组操作示例

本文实例讲述了django框架F&Q 聚合与分组操作。分享给大家供大家参考，具体如下： F 使用查询条件的值,专门取对象中某列值的操作，可以对同一个表中的两个列进行比较 from d...

Python使用Turtle模块绘制五星红旗代码示例

在Udacity上课时学到了python的turtle方法，这是一个很经典的用来教小孩儿编程的图形模块，最早起源于logo语言。python本身内置了这个模块，其可视化的方法可以帮助小孩...

python 调用pyautogui 实时获取鼠标的位置、移动鼠标的方法

PyAutoGUI是一个纯Python的GUI自动化工具，其目的是可以用程序自动控制鼠标和键盘操作，利用它可以实现自动化任务本章介绍了许多不同函数，下面是快速的汇总参考： moveTo...

宜配屋

pyspark 读取csv文件创建DataFrame的两种方法

相关文章

基于python内置函数与匿名函数详解

Python处理XML格式数据的方法详解

django框架F&Q 聚合与分组操作示例

Python使用Turtle模块绘制五星红旗代码示例

python 调用pyautogui 实时获取鼠标的位置、移动鼠标的方法

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

pyspark 读取csv文件创建DataFrame的两种方法

相关文章

基于python内置函数与匿名函数详解

Python处理XML格式数据的方法详解

django框架F&Q 聚合与分组操作示例

Python使用Turtle模块绘制五星红旗代码示例

python 调用pyautogui 实时获取鼠标的位置、移动鼠标的方法

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号