python 实现对数据集的归一化的方法(0-1之间)

yipeiwu_com6年前Python基础

多数情况下,需要对数据集进行归一化处理,再对数据进行分析

 #首先,引入两个库 ,numpy,sklearn
from sklearn.preprocessing import MinMaxScaler
import numpy as np
 #将csv文件导入矩阵当中
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
 #将数据集进行归一化处理
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)

 #最后的my_matrix_normorlize 实现了归一化my_matrix_normorlize

完整未解释代码:

from sklearn.preprocessing import MinMaxScaler
import numpy as np
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)

以上这篇python 实现对数据集的归一化的方法(0-1之间)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python 遍历目录(包括子目录)下所有文件的实例

如下所示: def list_all_files(rootdir): import os _files = [] list = os.listdir(rootdir) #列出文...

Django返回json数据用法示例

本文实例讲述了Django返回json数据用法。分享给大家供大家参考,具体如下: 1、前端。jQuery发送GET请求,并解析json数据。getJSON方法可参考这里。 url =...

Python分析彩票记录并预测中奖号码过程详解

Python分析彩票记录并预测中奖号码过程详解

0 引言 上周被一则新闻震惊到了,《2454万元大奖无人认领!福彩史上第二大弃奖在广东中山产生 》,在2019年5月2日开奖的双色球中,广东中山一位彩民博中2454万元,兑奖时间截至2...

python numpy格式化打印的实例

1.问题描述 在使用numpy的时候,我们经常在debug的时候将numpy数组打印下来,但是有的时候数组里面都是小数,数组又比较大,打印下来的时候非常不适合观察。这里主要讲一下如何让n...

pandas数据预处理之dataframe的groupby操作方法

pandas数据预处理之dataframe的groupby操作方法

在数据预处理过程中可能会遇到这样的问题,如下图:数据中某一个key有多组数据,如何分别对每个key进行相同的运算? dataframe里面给出了一个group by的一个操作,对于”g...