对python打乱数据集中X,y标签对的方法详解

yipeiwu_com6年前Python基础

今天踩过的两个小坑:

一.用random的shuffle打乱数据集中的数据-标签对

index=[i for i in range(len(X_batch))]
# print(type(index))
index=random.shuffle(index)

结果shuffle完以后index变成None了,看了下api,这样说明的:

python打乱数据集中X,y标签

这个函数如果返回值,就返回None,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。

python打乱数据集中X,y标签

因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。

二.整体引用index这个list中的数据

因为index是一个list,所以代码这样写:

X_batch=X_batch[index]

Y_batch=Y_batch[index]

是有问题的,报错是:TypeError: list indices must be integers or slices, not list.

这是因为我的X_batch,Y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果X_batch,Y_batch是数组,index是数组,就可以。

所以代码改成了:

X_batch,Y_batch=data_generator(data_path)
index=[i for i in range(len(X_batch))]
# print(type(index))
random.shuffle(index)
index=np.array(index)

X_batch=[np.array(X_batch)[index]]
Y_batch=[np.array(Y_batch)[index]]

参考代码:

python打乱数据集中X,y标签

以上这篇对python打乱数据集中X,y标签对的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python切片操作实例分析

本文实例讲述了Python切片操作。分享给大家供大家参考,具体如下: 在很多编程语言中,针对字符串提供了截取函数,其实目的就是对字符串切片。Python没有针对字符串的截取函数,只需要切...

python 计算数组中每个数字出现多少次--“Bucket”桶的思想

python 计算数组中每个数字出现多少次--“Bucket”桶的思想

题目: 解法一:比较元素是否相等 思路说明: 这种应该是普通人最先想到的解法,先获取到数组之后进行有小到大排序,然后初始化一个min=0(代表新数字的开始角标),然后遍历新数组的每一个...

详谈python read readline readlines的区别

详谈python read readline readlines的区别

file 对象使用 open 函数来创建,下表列出了 file 对象常用函数read、readline、readlines区别: 1.从文件读取指定的字节数,size如果未给定或为负则读...

Python实现将HTML转换成doc格式文件的方法示例

本文实例讲述了Python实现将HTML转换成doc格式文件的方法。分享给大家供大家参考,具体如下: 网页上的一些文章,因为有格式的原因,它们在网页上的源码都是带有html标签的,用cs...

Python类中方法getitem和getattr详解

1、getitem 方法 使用这个方法最大的印象就是调用对象的属性可以像字典取值一样使用中括号['key'] 使用中括号对对象中的属性进行取值、赋值或者删除时,会自动触发对应的__g...