立即注册 登录
炼数成金 返回首页

szy2010214517的个人空间 http://www.dataguru.cn/?248794 [收藏] [复制] [分享] [RSS]

日志

Lesson1、线性回归与Logistic

已有 3649 次阅读2017-5-31 21:05 |个人分类:机器学习

回归分析就是利用样本(已知数据),产生拟合方程,从而(对未知数据)迚行预测

用途:预测,判别合理性

例子:利用身高预测体重;利用广告费用预测商品销售额;等等.

线性回归分析:一元线性;多元线性;广义线性

非线性回归分析

困难:选定变量(多元),避免多重共线性,观察拟合方程,避免过度拟合,检验模型是否合理

一元线性:我们可以看成一元一次方程组。同理多元线性也是。

广义线性:比如Logistic是非线性的,是种曲线。我们把非线性的问题通过线性处理。我们可以称为广义线性模型。

 

示例:

一元线性回归分析:

回归分析就是利用样本(已知数据),产生拟合方程,从而(对未知数据)迚行预测。

比如如下示例(身高和体重),我们称之为学习集:

H 171  168  181  190  153

W 63   50   75   87   42

H代表身高,W代表体重,我们可以在二维上画出如下,我们选择直线去拟合这些点,直线为线性:

我们通过直线拟合他,可能会得出W=a + bh 这个模型。

得到的这个模型我们能做什么呢? 比如预测。身高为xx的体重可以计算出来。

 

然后我们有一个问题:

比如上面的示例身高和体重,两者之间是否存在关系,关系有两种:

1、  函数关系:w = a + bh  是可以代入身高的值,获取到体重

2、  相关关系:非确定性关系

对于第二种关系可以通过如下公式来确定线性相关性。


对于公式计算我们暂且不证明。他的系数永远不会超过1,他的范围[ -1 , 1 ]

他的绝对值越接近于1 表示他的相关系数越高,越适合用直线去拟合他。通过下图来加深我们的理解

其中正和负相关系数分别代表什么,

正: 两者是同增,XY增, XY

两者是相反,XY跌, XY

 

结论:因此我们计算样本是否符合线性回归,我们就可以通过相关系数的值来判断。


路过

鸡蛋

鲜花

握手

雷人

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 立即注册

 

GMT+8, 2019-6-21 00:27 , Processed in 0.199730 second(s), 20 queries .