数极客首页

小白学统计(69)一元(简单线性)相关分析与回归分析

基础

准备

相关与回归剖析

基础

中论述

了相关剖析

与回归剖析

的区别与联络
,以及分类等基础

概念,扼要
回想

回归剖析

央求

研讨
者依据

因果关系(或假定
存在因果关系)将两个变量,一个定义为自变量(X),由实验
者设定,一个定义为因变量(Y),是随机变量。目的是给出描画

两个变量关系的数学方程,这个方程能够

用来预测相应因变量的值。例如,某品牌矿泉水的定价与其销售量之间的关系。

相关剖析

的两个变量都是自变量,研讨
的是两个自变量的相关水平

,两个自变量均为随机变量。例如,矿泉水(不同品牌)价钱
与销售量之间的关系。

简单线性回归

简单线性回归模型

假定

自变量X与因变量Y是直线型关系,则能够

经过
树立
一元线性模型来描画

它们之间的关系。而将所树立
的一元线性模型称为一元回归模型或简单线性回归模型,能够

表示为:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

回归模型是从总体的角度描画

自变量X与因变量Y的关系。因而

,β0,β1就是从总体上阐明

X与Y变量关系的系数,称为回归系数,他们的数值在理论

中是不可能得到的,只能经过
样本数据得到它们的估量
值,所以经过
它们得到的Y与理论

的Y之间存在随机误差εi。回归模型分红
两部分

:一部分

是由线性函数β01Xi构成的确

定性数值;另一部分

就是随机误差εi。E(Yi)=β01Xi称为回归函数。

回归系数的估量

回归剖析

的任务就是用恰当的办法

估量
出参数β0和β1。经过
n对样本数据(Xi,Yi)能够

得到回归函数E(Yi)=β01Xi的估量
,即:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

上式称为Y关于X的一元线性回归方程。

β0和β1的估量
值b0,b1能够

经过
最小二乘法计算得到。用Excel,SPSS中止

一元线性拟合就是经过
最小二乘法计算出b0和b1数值的。

最小二乘法

最小二乘法(又称最小平办法

)是一种数学优化技术。简单的说,就是经过
误差平方和的最小化,寻觅
数据的最佳函数匹配。

现有回归函数:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

小白学统计(69)一元(简单线性)相关剖析与回归剖析

假定n对样本数据(x1,y1),(x2,y2)……(x,y)为已知,往常

需求
肯定
经过
这些点的哪一条直线描画

X与Y最好。

依据

最小二乘法树立
回归直线的准绳
就是:使Yi的估量
值与其离差平方和最小。因而

设:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

某市欲对货运总量与工业总产值的数据量
关系中止

研讨
,以便经过
工业总产值预测货运总量。现将1991-2000年的数据,列入表8-1中,依据

这些数据树立
回归方程。

货运总量2.82.93.23.23.43.23.33.73.94.2
工业总值25272932343635394245

单位:货运总量(亿吨);工业总产值(10亿元);

解:剖析

步骤如下:

1、肯定
因变量和自变量,经过
散点图察看

它们之间的关系。从下图能够

看出,两者之间有线性关系。

小白学统计(69)一元(简单线性)相关剖析与回归剖析

2、中止

数据计算

数据计算表
年份货运总量(X)工业总值(Y)XYX平方Y平方
19912.82570.06257.84
19922.92778.37298.41
19933.22992.884110.24
19943.232102.4102410.24
19953.434115.6115611.56
19963.236115.2129610.24
19973.335115.5122510.89
19983.739144.3152113.69
19993.942163.8170415.21
20004.245189.0202517.64
合计33.83441186.912206115.96

3、带入公式计算

小白学统计(69)一元(简单线性)相关剖析与回归剖析

用Excel添加渐近线及回归方程,结果与上面计算结果分歧

小白学统计(69)一元(简单线性)相关剖析与回归剖析

简单线性相关

关于
简单线性回归,变量X是固定的(由实验
者设定),而Y是随机变量,如上所述。关于
简单线性相关,X与Y均为随机变量,目的是肯定
他们之间线性相关的水平

散点图

两个随机变量之间的关系可由散点图看出:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

协方差

协方差描写
了两个随机变量相关于
它们均值的同时倾向

,它反映了两个变量共同变化的水平

,假定

结果是负数,阐明

两个变量可能是负相关;结果为正,它们可能是正相关。例如,对随机变量X和Y的相关水平

感兴味
,得到一些样本点(如下图),对每个样本点,求它们与各自均值的倾向

,然后相乘,除以自由

度即可得到样本协方差。

小白学统计(69)一元(简单线性)相关剖析与回归剖析

小白学统计(69)一元(简单线性)相关剖析与回归剖析

但是,协方差不能直接用来度量两个变量的相关水平

,由于
它的值与丈量
单位相关,当两个变量的丈量
单位不同时会带来一些问题。因而

,需求
将协方差规范

化,以消弭
丈量
单位的影响,这就引出了相关系数r。

相关系数r

为了消弭
丈量
单位对协方差的影响,引出相关系数r,计算公式如下:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

相关系数r有以下性质:

小白学统计(69)一元(简单线性)相关剖析与回归剖析

当|r|≥0.8时,可视为高度相关;当0.5≤|r|<0.8时,可视为中度相关;当0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,阐明

两个变量之间的相关水平

极弱。

发表评论

评论已关闭。

相关文章