python训练数据时打乱训练数据与标签的两种方法小结

yipeiwu_com6年前Python基础

如下所示:

<code class="language-python">import numpy as np 
 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
y = np.array([1,2,3,4,5])
 
print '-------第1种方法:通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------' 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
data_num, _= data.shape #得到样本数 
index = np.arange(data_num) # 生成下标 
np.random.shuffle(index) 
print '-------原数据:----------' 
print '数据:',data 
print '标签:', y
print '-------打乱数据:----------' 
print '数据:',data[index] 
print '标签:',y[index]

print '-------第2种方法:直接的打乱数据,利用随机数种子,好处:每次打乱的顺序是固定的----------' 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
y = np.array([1,2,3,4,5])

print '-------原数据:----------' 
print '数据:',data 
print '标签:', y
print '-------打乱数据:----------' 
np.random.seed(116)
np.random.shuffle(data) 
np.random.seed(116)
np.random.shuffle(y) 
print '数据:',data 
print '标签:', y</code>

以上这篇python训练数据时打乱训练数据与标签的两种方法小结就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python整数与Numpy数据溢出问题解决

Python整数与Numpy数据溢出问题解决

某位 A 同学发了我一张截图,问为何结果中出现了负数? 看了图,我第一感觉就是数据溢出了。数据超出能表示的最大值,就会出现奇奇怪怪的结果。 然后,他继续发了张图,内容是 print(1...

Django教程笔记之中间件middleware详解

Django教程笔记之中间件middleware详解

中间件介绍 中间件顾名思义,是介于request与response处理之间的一道处理过程,相对比较轻量级,并且在全局上改变django的输入与输出。因为改变的是全局,所以需要谨慎实用,用...

python实现ID3决策树算法

ID3决策树是以信息增益作为决策标准的一种贪心决策树算法 # -*- coding: utf-8 -*- from numpy import * import math imp...

Python基于回溯法子集树模板解决选排问题示例

Python基于回溯法子集树模板解决选排问题示例

本文实例讲述了Python基于回溯法子集树模板解决选排问题。分享给大家供大家参考,具体如下: 问题 从n个元素中挑选m个元素进行排列,每个元素最多可重复r次。其中m∈[2,n],r∈[1...

Python二叉树定义与遍历方法实例分析

本文实例讲述了Python二叉树定义与遍历方法。分享给大家供大家参考,具体如下: 二叉树基本概述: 二叉树是有限个元素的几个,如果为空则为空二叉树,或者有一个结点称之为根节点,分列根节点...