百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

sklearn 实现线性回归——波士顿房价预测

bigegpt 2024-08-06 11:54 3 浏览

机器学习线性回归原理介绍和功能实现 中介绍了线性回归的原理和编码实现,本文用代码展示一下用机器学习框架sklearn实现线性回归。

导入库文件,参考注释

#使用sklearn估计器 构建 >线性回归模型
#加载所需函数
import numpy as np
import pandas as pd

#从sklearn框架导入线性回归模型
from sklearn.linear_model import LinearRegression 
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split

#模型评价相关的库
from sklearn.metrics import explained_variance_score,mean_absolute_error,mean_squared_error,median_absolute_error,r2_score

#导入绘图库
import matplotlib.pyplot as plt
from matplotlib import rcParams
rcParams['font.sans-serif']='SimHei'

#加载boston数据 ,sklearn库datasets里自带的函数数据集
boston=load_boston()
x=boston['data']
y=boston['target']
names=boston['feature_names']
####(506, 13) (506,)表示波士顿房价预测的数据集有13个特征,506个样本
print(x.shape, y.shape)

####查看某一列的数据与样本标签的关系
# X[行,列] X[:,[2,3,4]]
def drawScatter(x, y, xlabel):
plt.scatter(x, y)
plt.xlabel(xlabel)
plt.ylabel('房价')
plt.title(f'{xlabel}与房价的散点图')
plt.grid()
plt.show()
drawScatter(x[:, 5], y, "房间数")
drawScatter(x[:, 4], y, "环保指标")

#将数据划分为训练集、测试集
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=125)
#建立线性回归模型
lr=LinearRegression().fit(x_train,y_train)
print('建立的LinarRegression 模型为: \n',lr)
# 训练的本质就是获取权重(13项w)与偏置(b)
print(lr.coef_,lr.intercept_)
##输出权重和偏置信息
# [-1.14077285e-01 4.87165173e-02 -1.20875379e-02 1.59355488e+00
# -1.89792822e+01 3.47313008e+00 3.03276293e-03 -1.60090878e+00
# 2.90563127e-01 -1.27238844e-02 -9.76743908e-01 8.48566379e-03
# -4.87508387e-01] 40.44599864104647
# 训练完毕获取权重和偏置,然后采用测试集的数据获取预测值
y_predict = lr.predict(x_test) # y_predict 就是测试集的预测值
print("预测前20个结果为:",'\n',y_predict[:20])
# #预测前20个结果为:
# [21.16289134 19.67630366 22.02458756 24.61877465 14.44016461 23.32107187
# 16.64386997 14.97085403 33.58043891 17.49079058 25.50429987 36.60653092
# 25.95062329 28.49744469 19.35133847 20.17145783 25.97572083 18.26842082
# 16.52840639 17.08939063]

#回归结果可视化
fig=plt.figure(figsize=(10,6))
plt.plot(range(y_test.shape[0]),y_test,color="blue",linewidth=1.5,linestyle="-")
plt.plot(range(y_test.shape[0]),y_predict,color="red",linewidth=1.5,linestyle="-.")
plt.xlim((0,102))
plt.ylim((0,55))
plt.legend(['真实值','预测值'])
plt.show()

#Boston数据线性回归模型的评价,直接调用sklearn框架中的模型评价相关的API函数,直接用现成的,避免手动编码实现。但前提是需要对相关的库函数有所了解。
# 平均绝对误差为: 3.3775517360082032
print("平均绝对误差为:",mean_absolute_error(y_test,y_predict))
# 均方误差为: 31.150517390315635
print("均方误差为:",mean_squared_error(y_test,y_predict))
# 中值绝对误差为: 1.7788996425420756
print("中值绝对误差为:",median_absolute_error(y_test,y_predict))
# 可解释方差值为: 0.7105475650096659
print("可解释方差值为:",explained_variance_score(y_test,y_predict))
# R2为: 0.7068961686076838
print("R2为:",r2_score(y_test,y_predict))
mae = mean_absolute_error(y_test,y_predict)
print('绝对值平均误差为', mae)# 绝对值平均误差为 3.3775517360082032
# 显示模型的正确率 # 模型预测正确率 0.7068961686076838
print('模型预测正确率',lr.score(x_test,y_test))

回归结果可视化参考下图,

总结

本文通过代码的方式展示了一下使用机器学习框架sklearn 实现线性回归模型的方法和过程,重点不在代码,而是sklearn框架提供的API函数。我们以前通过手动编码完成的复杂功能其实在sklearn中都有已经封装好的接口,只需要学会使用即可。另外在深度学习框架Tensorflow(2.0)的Keras 针对线性回归问题也有封装好的API函数,感兴趣的可以去了解一下。~感谢阅读。

相关推荐

Linux 系统启动完整流程

一、启动系统流程简介如上图,简述系统启动的大概流程:1:硬件引导UEFi或BIOS初始化,运行POST开机自检2:grub2引导阶段系统固件会从MBR中读取启动加载器,然后将控制权交给启动加载器GRU...

超专业解析!10分钟带你搞懂Linux中直接I/O原理

我们先看一张图:这张图大体上描述了Linux系统上,应用程序对磁盘上的文件进行读写时,从上到下经历了哪些事情。这篇文章就以这张图为基础,介绍Linux在I/O上做了哪些事情。文件系统什么是...

linux入门系列12--磁盘管理之分区、格式化与挂载

前面系列文章讲解了VI编辑器、常用命令、防火墙及网络服务管理,本篇将讲解磁盘管理相关知识。本文将会介绍大量的Linux命令,其中有一部分在“linux入门系列5--新手必会的linux命令”一文中已经...

Linux环境下如何设置多个交叉编译工具链?

常见的Linux操作系统都可以通过包管理器安装交叉编译工具链,比如Ubuntu环境下使用如下命令安装gcc交叉编译器:sudoapt-getinstallgcc-arm-linux-gnueab...

可算是有文章,把Linux零拷贝技术讲透彻了

阅读本文大概需要6.0分钟。作者:卡巴拉的树链接:https://dwz.cn/BaQWWtmh本文探讨Linux中主要的几种零拷贝技术以及零拷贝技术适用的场景。为了迅速建立起零拷贝的概念...

linux软链接的创建、删除和更新

大家都知道,有的时候,我们为了省下空间,都会使用链接的方式来进行引用操作。同样的,在系统级别也有。在Windows系列中,我们称其为快捷方式,在Linux中我们称其为链接(基本上都差不多了,其中可能...

Linux 中最容易被黑客动手脚的关键目录

在Linux系统中,黑客攻击后常会针对关键目录和文件进行修改以实现持久化、提权或隐藏恶意活动。本文介绍下黑客最常修改的目录及其手法。一、/etc目录关键文件有:/etc/passwd和/et...

linux之间传文件命令之Rsync傻瓜式教程

1.前言linux之间传文件命令用什么命令?本文介绍一种最常用,也是功能强大的文件同步和传输工具Rsync,本文提供详细傻瓜式教程。在本教程中,我们将通过实际使用案例和最常见的rsync选项的详细说...

Linux下删除目录符号链接的方法

技术背景在Linux系统中,符号链接(symlink)是一种特殊的文件,它指向另一个文件或目录。有时候,我们可能需要删除符号链接,但保留其指向的目标目录。然而,在删除符号链接时可能会遇到一些问题,例如...

阿里云国际站注册教程:aa云服务器怎么远程链接?

在全球化的今天,互联网带给我们无以计数的便利,而云服务器则是其中的重要基础设施之一。这篇文章将围绕阿里云国际站注册、aa云服务器如何远程链接,以及服务器安全防护如Ddos防火墙、网站应用防护waf防火...

Linux 5.16 网络子系统大范围升级 多个新适配器驱动加入

Linux在数据中心中占主导地位,因此每个内核升级周期的网络子系统变化仍然相当活跃。Linux5.16也不例外,周一最新与网络相关的更新加入了大量的驱动和新规范的支持。一个较新硬件的驱动是Realt...

搭建局域网文件共享服务(Samba),手机电脑都能看喜欢的影视剧

作为一名影视爱好者,为了方便地观看自己喜欢的影视作品,在家里搞一个专门用来存放电影的服务器是有必要的。蚁哥选则用一台Ubuntu系统的电脑做为服务器,共享影音文件,其他同一个局域网内的电脑或手机可以...

分享一个实用脚本—centos7系统巡检

概述这周闲得慌,就根据需求写了差不多20个脚本(部分是之前分享过的做了一些改进),今天主要分享一个给平时运维人员用的centos7系统巡检的脚本,或者排查问题检查系统情况也可以用..实用脚本#!/bi...

Linux 中创建符号链接的方法

技术背景在Linux系统里,符号链接(SymbolicLink),也被叫做软链接(SoftLink),是一种特殊的文件,它指向另一个文件或者目录。符号链接为文件和目录的管理带来了极大的便利,比...

一文掌握 Linux 符号链接

符号链接(SymbolicLink),通常被称为“软链接”,是Linux文件系统中一种强大而灵活的工具。它允许用户创建指向文件或目录的“快捷方式”,不仅简化了文件管理,还在系统配置、软件开发和日...