pyspark 读取csv文件创建DataFrame的两种方法

yipeiwu_com6年前 (2020-03-06)Python基础

方法一：用pandas辅助

from pyspark import SparkContext 
from pyspark.sql import SQLContext 
import pandas as pd 
sc = SparkContext()
sqlContext=SQLContext(sc) 
df=pd.read_csv(r'game-clicks.csv') 
sdf=sqlc.createDataFrame(df)

方法二：纯spark

from pyspark import SparkContext 
from pyspark.sql import SQLContext
sc = SparkContext()
sqlContext = SQLContext(sc)
sqlContext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('game-clicks.csv')

以上这篇pyspark 读取csv文件创建DataFrame的两种方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python结合API实现即时天气信息

python结合API实现即时天气信息 import urllib.request import urllib.parse import json """ 利用“最美天气”抓取...

Python函数参数类型及排序原理总结

这篇文章主要介绍了Python函数参数类型及排序原理总结,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Python中函数的参数问题有...

python format 格式化输出方法

0、前言在python2.7及以上的版本，str.format()的方式为格式化提供了非常大的便利。与之前的%型格式化字符串相比，他显得更为方便与优越。下面我们就来看看format的具...

python 文件操作api(文件操作函数)

python中对文件、文件夹（文件操作函数）的操作需要涉及到os模块和shutil模块。得到当前工作目录，即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下...

Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程

使用Flask-SQLAlchemy管理数据库 Flask-SQLAlchemy是一个Flask扩展，它简化了在Flask应用程序中对SQLAlchemy的使用。SQLAlchemy是一...

宜配屋

pyspark 读取csv文件创建DataFrame的两种方法

相关文章

python结合API实现即时天气信息

Python函数参数类型及排序原理总结

python format 格式化输出方法

python 文件操作api(文件操作函数)

Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

pyspark 读取csv文件创建DataFrame的两种方法

相关文章

python结合API实现即时天气信息

Python函数参数类型及排序原理总结

python format 格式化输出方法

python 文件操作api(文件操作函数)

Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号