当前位置:首页 > 影视动漫 >

多元线性回归模型计算公式(简单线性回归模型参数估计公式)

来源:原点资讯(www.yd166.com)时间:2023-11-06 03:45:31作者:YD166手机阅读>>

1 问题概述

数据集data.xlsx中包含238行的深度、岩性描述、水饱和度、油饱和度、岩心和毛管等相关参数信息,挑取有较好线性相关性的信息用以拟合水平渗透率。

多元线性回归模型计算公式,简单线性回归模型参数估计公式(1)

图1 数据集信息

任务要求:

1. 将所给数据集进行预处理,优选特征后切分成训练集和测试集(建议按4:1切分);

2. 使用Python或自己熟知的语言对训练数据建模(模型不限);

3. 使用建立的模型对测试集的渗透率进行预测,将预测渗透率值作为最后一列合并到测试集数据表中,并计算平均误差。

下面结合任务要求展开本次回归分析实验的介绍。

2 数据预处理
  • 1 剔除无效数据

首先加载数据集,将'岩性描述'一列剔除(汉字无法被拟合),'油饱和度,%','水饱和度,%'残缺数据过多,故剔除;'孔隙度,%'和'水平渗透率,10-3μm2'中含有空余数据,将空数据所在行整体剔除,实现代码如下:

data = pd.read_excel(r'G:\Loong_2021\bd_fhw\data.xlsx') #加载数据集 data = data.dropna(subset=['孔隙度,%', '水平渗透率,10-3μm2']) #剔除无效行数据 data = data.drop(['岩性描述','水饱和度,%','油饱和度,%']) #剔除无效列数据2 数据分析及选取

利用seaborn包进行数据的可视化呈现。

seaborn是基于Matplotlib的Python数据可视化库。它提供了一个高级界面,用于绘制引人入胜且内容丰富的统计图形,同时对Matplotlib进行了更高级的API封装,从而使作图更加容易;
seaborn是针对统计绘图的,能满足数据分析90%的绘图需求,需要复杂的自定义图形还需要使用到Matplotlib。

seaborn中的相关性热点图,初步发现数据中包含的线性关系。corr(x,y)是相关系数,用来刻画二维随机变量两个分量间相互关联程度。

corr(x,y) 在-1到1之间,也就是说相关系数介于-1到1之间,并可以对它作一下几个说明明:corr(x,y) =0则称X,Y不相关,不相关是指X,Y没有线性关系,但也有可能有其他关系,比如平方关系,立方关系等 。corr(x,y) =1,则称X与Y完全正相关,corr(x,y) =-1,则称X,Y完全负相关。

下面展示相关性热点图实现代码及展示效果解读:

import seaborn as sns plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False #汉字编码 sns.heatmap(data.corr()) #相关性热点图,corr()判断相关性

OUTPUT:

多元线性回归模型计算公式,简单线性回归模型参数估计公式(2)

图2 相关性热点图

上图中横纵坐标对称,颜色越淡代表相关性(正)越强,越深则代表负相关性越强。根据相关性热点图可初步选定正负相关性较好的数据,如孔隙度、总进汞量、最大进汞饱和度、残留汞饱和度、最大饱和度增量、峰态和最大增量对应直径具有较好的正相关性,而退汞效率具有较好的负相关性。故首先选择如上数据进行训练拟合,并划分训练集和测试集。

X

OUTPUT:

多元线性回归模型计算公式,简单线性回归模型参数估计公式(3)

from sklearn.model_selection import train_test_split

#sklearn中包含数据集切分的函数train_test_split,直接调取使用 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2) #random_state #测试集参数设0.2,及1:4切分3 线性回归模型

sklearn库中有很多线性回归的模型,本次作业选取其中的LinearRegression, Lasso以及最小二乘法进行数据测试。

  • LinearRegression

线性回归算法模型很简单,每条数据有n个特征,每个特征对应着一个自己的权重值,与权重的乘积再加上一个偏置值,这个就是线性回归模型,公式如下(n代表特征数目,m代表样本数目):

y=w1∗x1 w2∗x2 ... wnxn b

假设有m个样本,写成矩阵的形式就是:

多元线性回归模型计算公式,简单线性回归模型参数估计公式(4)

首页 123下一页

栏目热文

简单线性回归模型怎么解题(线性回归模型公式怎么算)

简单线性回归模型怎么解题(线性回归模型公式怎么算)

作者丨Pradeep Menon原文丨https://towardsdatascience.com/data-scien...

2023-11-06 03:35:13查看全文 >>

线性回归的计算公式(线性回归预测股票)

线性回归的计算公式(线性回归预测股票)

各位同学好,今天我和大家分享一下python机器学习中线性回归算法的实例应用,并介绍正则化、岭回归方法。在上一篇文章中我...

2023-11-06 03:26:54查看全文 >>

奥特曼出大招动作(奥特曼精彩大招场面)

奥特曼出大招动作(奥特曼精彩大招场面)

作为一个奥特迷,每当和小伙伴干架的时候总会摆出一副奥特曼释放大招的姿势,就好像自己真的能发出激光一样,下面我们来盘点一些...

2023-11-06 03:34:30查看全文 >>

奥特曼的大招哪个最强(奥特曼大招动作都有哪个)

奥特曼的大招哪个最强(奥特曼大招动作都有哪个)

动漫不吐不快,文章新颖不赖。大家好,我是筱头。奥特曼这位荧屏英雄相信大家并不陌生,像大家熟知的迪迦奥特曼,泰罗奥特曼,佐...

2023-11-06 03:55:27查看全文 >>

奥特曼最强必杀技巧(奥特曼最强的五个绝招)

奥特曼最强必杀技巧(奥特曼最强的五个绝招)

第一名 诺亚奥特曼诺亚·奥特曼,“存在于传说中的奥特曼”,是从太古时代起便守护着宇宙的传说中的光之救世主,是奈克斯特·奥...

2023-11-06 03:30:44查看全文 >>

线性回归计算步骤(线性回归计算举例)

线性回归计算步骤(线性回归计算举例)

什么是线性回归?你是否有过这样的经历,当你看到一组数据时,你会想知道它们之间有没有什么规律?比如,当你看到一些房屋的面积...

2023-11-06 04:02:36查看全文 >>

多元线性回归模型计算(多元线性回归模型怎么计算)

多元线性回归模型计算(多元线性回归模型怎么计算)

1. 线性回归线性回归是一种统计方法,用于检查两个连续变量之间的关系:一个自变量和一个因变量。线性回归的目标是通过一组数...

2023-11-06 03:27:14查看全文 >>

简单线性回归模型公式(多重线性回归模型的公式)

简单线性回归模型公式(多重线性回归模型的公式)

简单线性回归也称为一元线性回归,也就是回归模型中只含一个自变量,否则称为多重线性回归。简单线性回归模型为:Y= a ...

2023-11-06 03:28:57查看全文 >>

线性回归数学模型(线性回归模型的计算)

线性回归数学模型(线性回归模型的计算)

编辑导语:在日常工作中,很多时候都会用到数据分析的方法,线性回归模型看起来非常简单,但实际上它的十分重要;本文作者分享了...

2023-11-06 04:03:51查看全文 >>

线性回归模型公式怎么写(简单线性回归模型怎么解题)

线性回归模型公式怎么写(简单线性回归模型怎么解题)

线性回归,试图学得f(x(i))=wx(i) b,使得f(x(i))~y(i),那么如何确定参数w,b呢?根据上篇我...

2023-11-06 03:27:21查看全文 >>

文档排行