python训练数据时打乱训练数据与标签的两种方法小结

yipeiwu_com6年前Python基础

如下所示:

<code class="language-python">import numpy as np 
 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
y = np.array([1,2,3,4,5])
 
print '-------第1种方法:通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------' 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
data_num, _= data.shape #得到样本数 
index = np.arange(data_num) # 生成下标 
np.random.shuffle(index) 
print '-------原数据:----------' 
print '数据:',data 
print '标签:', y
print '-------打乱数据:----------' 
print '数据:',data[index] 
print '标签:',y[index]

print '-------第2种方法:直接的打乱数据,利用随机数种子,好处:每次打乱的顺序是固定的----------' 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
y = np.array([1,2,3,4,5])

print '-------原数据:----------' 
print '数据:',data 
print '标签:', y
print '-------打乱数据:----------' 
np.random.seed(116)
np.random.shuffle(data) 
np.random.seed(116)
np.random.shuffle(y) 
print '数据:',data 
print '标签:', y</code>

以上这篇python训练数据时打乱训练数据与标签的两种方法小结就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python操作excel的方法总结(xlrd、xlwt、openpyxl)

前言 在处理excel数据时发现了xlwt的局限性–不能写入超过65535行、256列的数据(因为它只支持Excel 2003及之前的版本,在这些版本的Excel中行数和列数有此限制),...

Python Excel处理库openpyxl使用详解

openpyxl是一个第三方库,可以处理xlsx格式的Excel文件。pip install openpyxl安装。 读取Excel文件 需要导入相关函数 from openpy...

使用批处理脚本自动生成并上传NuGet包(操作方法)

使用批处理脚本自动生成并上传NuGet包(操作方法)

  Hello 大家好,我是TANZAME,我们又见面了。   NuGet是什么这里就不再重复啰嗦,园子里一搜一大把。今天要跟大家分享的是,在日常开发过程中如何统一管理我们的包,如何通过...

在Python中使用dict和set方法的教程

在Python中使用dict和set方法的教程

dict Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 举个例子,假设要...

使用Rasterio读取栅格数据的实例讲解

Rasterio简介 有没有觉得用GDAL的Python绑定书写的代码很不Pythonic,强迫症的你可能有些忍受不了。不过,没关系,MapBox旗下的开源库Rasterio帮我们解决了...