各位同学好,今天我和大家分享一下python机器学习中的线性回归算法。内容有:
(1) 线性回归方程、(2) 损失函数推导、(3) 似然函数、(4) 三种梯度下降方法
1. 概念简述线性回归是通过一个或多个自变量与因变量之间进行建模的回归分析,其特点为一个或多个称为回归系数的模型参数的线性组合。如下图所示,样本点为历史数据,回归曲线要能最贴切的模拟样本点的趋势,将误差降到最小。
线形回归方程,就是有 n 个特征,然后每个特征 Xi 都有相应的系数 Wi ,并且在所有特征值为0的情况下,目标值有一个默认值 W0 ,因此:
线性回归方程为:
整合后的公式为:
损失函数是一个贯穿整个机器学习的一个重要概念,大部分机器学习算法都有误差,我们需要通过显性的公式来描述这个误差,并将这个误差优化到最小值。假设现在真实的值为 y,预测的值为 h 。
损失函数公式为: