试题题库
选择题:
1. 下面是产品的单位成本与产量的散点图,由此可以得出单位成本与产量之间存在( )
     
A. 正线性相关关系
B. 负线性相关关系
C. 非线性关系
D. 函数关系
知识点:一元线性回归
难易度:1
 正确答案是( )
2. 相面是对四组样本数据计算的相关系数,你认为哪一个是错误的( )
A. -0.86
B. 1
C. 0
D. 1.25
知识点:一元线性回归
难易度:1
 正确答案是( )
3. 如果变量x与y之间存在负的线性相关关系,对两个变量建立一元线性回归方程,回归系数 的取值( )
A. 等于0
B. 大于0
C. 小于0
D. 小于1
知识点:方差分析与实验设计
难易度:2
 正确答案是( )
4. 如果相关系数r=0,则表明两个变量之间( )
A. 相关程度很低
B. 不存在线性相关关系
C. 不存在任何关系
D. 存在非线性相关关系
知识点:一元线性回归
难易度:1
 正确答案是( )
5. 设产品产量与产品单位成本之间的线性相关系数为-0.82,且具有统计上的显著性,这说明二者之间存在着( )
A. 较强的线性相关关系
B. 较强的非线性相关关系
C. 较弱的线性相关关系一元秒杀汽车
D. 较弱的非线性相关关系
知识点:一元线性回归
难易度:2
 正确答案是( )
6. 出租汽车的行驶里程(单位:公里)与出租车司机的收入(单位:元)有一定的线性关系。设收入为因变量,行驶里程为自变量,对两个变量进行回归得到的回归系数 ,其含义是( )
A. 行驶里程每增加1公里,总收入就增加1.5元
B. 行驶里程每增加1公里,收入平均增加1.5元
C. 行驶里程每增加1.5公里,收入平均增加1元
D. 要增加1元的收入,需要行驶1.5公里
知识点:一元线性回归
难易度:2
 正确答案是( )
7. 在计算两个变量之间的线性相关系数时,假定( )
A. 两个变量都是随机变量
B. 两个变量都是非随机变量
C. 一个变量是随机的,一个变量是非随机的
D. 自变量是随机的,因变量是非随机的
知识点:一元线性回归
难易度:1
 正确答案是( )
8. 在建立一元线性回归模型时,假定( )
A. 两个变量都是随机变量
B. 两个变量都是非随机变量
C. 一个变量是随机的,一个变量是非随机的
D. 自变量是事先给定的,因变量是随机的
知识点:一元线性回归
难易度:1
 正确答案是( )
9. 在一元线性回归模型 中,对 有三个基本假定,即正态性、方差齐性和独立性。其中的方差齐性是指( )
A. 对于所有的x值,的方差 都相同
B. 对于所有的y值,的方差都相同
C. 对于所有的x值,的方差都等于0
D. 对于所有的x值,的方差都等于1
知识点:一元线性回归
难易度:1
 正确答案是( )
10. 在回归分析中,F检验主要是用来检验( )
A. 相关系数的显著性
B. 回归系数的显著性
C. 线性关系的显著性
D. 估计标准误差的显著性
知识点:一元线性回归
难易度:1
 正确答案是( )
11. 下面的哪一个统计量不能用于评价回归方程的拟合优度( )
A. 相关系数
B. 回归系数
C. 判定系数
D. 估计标准误差
知识点:一元线性回归
难易度:2
 正确答案是( )
12. 在回归分析中,回归平方和是指( )
A. 各实际观测值 与其均值 的离差平方和
B. 各实际观测值与回归值 的离差平方和
C. 回归预测值 与因变量均值的离差平方和
D. 因变量与自变量 的平方和
知识点:一元线性回归
难易度:2
 正确答案是( )
13. 在一元线性回归方程 中,若回归系数 =0,则表示( )
A. x对y的影响是显著的
B. x对y的影响是不显著的
C. y对x的影响是显著的
D. y对x的影响是不显著的
知识点:一元线性回归
难易度:2
 正确答案是( )
14. 若两个变量之间存在完全线性相关关系,在以下结论中不正确的是( )
A. 相关系数|r|=1
B. 判定系数 =1
C. 回归系数 =1
D. 估计标准误差 =0
知识点:一元线性回归
难易度:2
 正确答案是( )
15. 下面关于判定系数的陈述中不正确的是( )
A. 取值范围是[0,1]
B. 取值范围是[-1,1]
C. 回归平方和占总平方和的比例
D. 评价回归方程拟合优度的一个统计量
知识点:一元线性回归
难易度:1
 正确答案是( )
16. 在一元线性回归分析中,利用所求得的一元线性回归方程,对于自变量x的一个给定值 ,求出因变量y的个别值的区间,这一区间称为( )
A. 因变量平均值的置信区间
B. 因变量个别值的预测区间
C. 自变量平均值的置信区间
D. 自变量个别值的预测区间
知识点:一元线性回归
难易度:1
 正确答案是( )
17. 根据两个变量之间的一元线性回归,得到的回归平方和SSR=2650,残差平方和SSE=358。则相关系数r=( )
A. 0.9386
B. 0.3450
C. 0.3676
D. 0.8675
知识点:一元线性回归
难易度:3
 正确答案是( )
18. 如果两个变量之间不存在显著的线性相关关系,所建立的线性回归方程 中,回归系数 的取值( )
A. 会接近于0
B. 会等于1
C. 只能是正数
D. 只能是负数
知识点:一元线性回归
难易度:3
 正确答案是( )
19. 利用回归方程进行预测时,对于给定自变量的取值 ,y的平均值的置信区间和个别值的预测区间相比( )
A. 二者的区间宽度是一样的
B. 置信区间比预测区间宽
C. 预测区间比置信区间宽
D. 置信区间有时比预测区间宽,有时比预测预区间窄
知识点:一元线性回归
难易度:2
 正确答案是( )
20. 利用回归方程进行预测时,自变量的取值越接近其平均值 ,求得的y的预测区间( )
A. 越宽
B. 越窄
C. 越接近实际值
D. 误差越大
知识点:一元线性回归
难易度:1
 正确答案是( )
21. 回归平方和SSR反映了y的总变差中( )
A. 由于x与y之间的线性关系引起的y的变化部分
B. 由于x与y之间的非线性关系引起的y的变化部分
C. 由于x与y之间的函数关系引起的y的变化部分
D. 除了x对y的线性影响之外的其他因素对y变差的影响
知识点:一元线性回归
难易度:2
 正确答案是( )
22. 残差平方和SSE反映了y的总变差中( )
A. 由于x与y之间的线性关系引起的y的变化部分
B. 由于x与y之间的非线性关系引起的y的变化部分
C. 除了x对y的线性影响之外的其他因素对y变差的影响
D. 由于x与y之间的函数关系引起的y的变化部分
知识点:一元线性回归
难易度:2
 正确答案是( )
23. 根据居民收入x与家庭储蓄额y计算的相关系数r=0.8,则回归方程的判定系数 ( )
A. 0.8
B. 0.89
C. 0.40
D. 0.64
知识点:一元线性回归
难易度:2
 正确答案是( )
24. 设某地区的人均生产总值为x,人均消费水平为y,建立二者的一元线性回归方程,得到的判定系数 ,则人均生产总值x与人均消费水平y之间的相关系数r等于( )
A. 0.41
B. 0.81
C. 0.90
D. 0.95
知识点:一元线性回归
难易度:2
 正确答案是( )
25. 随机抽取10家企业,根据产品产量(x)与生产费用(y)的数据进行回归,得到下面的方差分析表。据此计算的相关系数为( )
 
df
SS
MS
F
回归
1
1711.3
1711.3
B
残差
8
281.1
A
 
总计
9
1992.4
 
 
A. 23.53%
B. 25.49%
C. 76.47%
D. 92.86%
知识点:一元线性回归
难易度:3
 正确答案是( )
26. 为研究学生在期末考试之前用于复习的时间(x)和考试分数(y)之间的有关系,随机抽取了由8名学生构成的一个随机样本,由回归分析得到的方差分析表如下。据此计算的估计标准误差为( )
 
df
SS
MS
F
回归
1
658.5
658.5
17.4
残差
6
227.5
37.9
 
总计
7
886.0
 
 
A. 25.7
B. 37.9
C. 6.2
D. 29.8
知识点:一元线性回归
难易度:3
 正确答案是( )
27. 为研究学生在期末考试之前用于复习的时间(x)和考试分数(y)之间的有关系,随机抽取了由8名学生构成的一个随机样本,由回归分析得到的方差分析表如下。据此计算的判定系数 为( )
 
df
SS
MS
F
回归
1
658.5
658.5
17.4
残差
6
227.5
37.9
 
总计
7
886.0
 
 
A. 74.32%
B. 25.68%
C. 5.76%
D. 16.66
知识点:一元线性回归
难易度:2
 正确答案是( )
28. 根据两个变量的18对观测值进行回归,得到的有关结果为:SSR=36,SSE=4。计算的判定系数为( )
A. 0.6
B. 0.7
C. 0.8
D. 0.9
知识点:一元线性回归
难易度:2
 正确答案是( )
29. 因变量的实际观测值 与回归预测值 之差称为( )
A. 估计标准误差
B. 回归平方和
C. 残差
D. 标准化残差
知识点:一元线性回归
难易度:1
 正确答案是( )
30. 如果误差项 服从正态分布的假定成立,那么在标准化残差图中,标准化残差在-2到+2之间的比例大约为( )
A. 68%
B. 90%
C. 95%
D. 99%
知识点:一元线性回归
难易度:1
 正确答案是( )
简要回答题:
1. 简述相关分析的内容和基本假定。
答案:
(1)相关分析的内容包括:①分析变量之间是否存在关系;②分析变量之间的关系形态;③测度变量之间的关系强度;④对相关关系进行显著性检验。
(2)相关分析中,假定两个变量之间是线性关系,而且两个变量都是随机变量,且服从一个联合的双变量正态分布。
知识点:一元线性回归
难易度:1
2. 相关系数具有哪些性质?
答案:
(1)相关系数r的取值范围在-1和+1之间。 表明r>0与x之y间存在正线性相关关系; 表明r<0与x之y间存在负线性相关关系;|r|=1表明x与 y之间为完全相关关系(实际上就是函数关系),其中r=+1表示x与y之间为完全正线性相关关系,r=-1表示x与y之间为完全负线性相关关系;r=0表明x与y之间不存在线性相关关系。
(2)r具有对称性。x与y之间的相关系数 和y与x之间的相关系数 相等。
(3)r数值大小与x和y原点及尺度无关。改变x和y的数据原点或计量尺度,并不改变r数值大小。
(4)r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。
(5)r是两个变量之间线性关系的一个度量,不一定意味着x与y一定有因果关系。
知识点:一元线性回归
难易度:3
3. 简述回归分析中的总平方和、回归平方和、残差平方的含义和及其关系。
答案:
(1)总平方和SST是因变量的观测值与其均值的利差平方和,它反映的是因变量取值的总误差。回归平方和SSR是回归预测值与因变量的均值的利差平方和,它反映的是y的总变差中由于x与y之间的线性关系引起的y的变化部分。残差平方和SSE是因变量的实际观测值与回归预测值之间的利差平方和,它反映的是除了x对y的线性影响之外的其他随机因素对 的影响。
(2)三个平方和的关系为:总平方和= 回归平方和+ 残差平方和
知识点:一元线性回归
难易度:2
4. 什么是判定系数?它在回归分析中的主要作用是什么?
答案:
(1)判定系数是回归平方和占总平方和的比例,记为 ,其计算公式为:=SSR/SST 。
(2)在回归分析中,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。越接近于1,回归直线的拟合程度就越好;越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,=1,拟合是完全的;如果=0,回归直线对数据完全没有拟合。
知识点:一元线性回归
难易度:2
5. 什么是回归中的置信区间估计和预测区间估计?两个区间的宽度是否一样?x取何值时两个区间宽度最窄?
答案:
(1)置信区间估计是对x的一个给定值 ,求出的y的平均值的估计区间;预测区间是对x的一个给定值,求出的y的一个个别值的估计区间。
(2)两个区间的宽度是不一样,预测区间要比置信区间宽一些。当x取 时,两个区间的宽度都最窄。
知识点:一元线性回归
难易度:1
计算分析题:
1. 某汽车制造公司想了解广告费用(x)对销售量(y)的影响,收集了过去10年有关广告费用(单位:万元)和销售量(单位:辆)的数据,希望建立二者之间的线性回归方程,并通过广告费用来预测汽车的销售量。通过计算得到下面的部分结果:
回归平方和(SSR
755456
残差平方和(SSE
37504
回归方程的截距
348.94
回归方程的斜率
14.41
(1) 写出销售量与广告费用的直线回归方程,并解释回归系数的实际意义。
(2) 计算判定系数 ,说明汽车销售量的变差中有多少是由于广告费用的变动引起的?
(3) 计算估计标准误差 ,并解释其实际意义。
(4) 根据回归方程预测当广告费用为100万元时汽车的销售量。
答案:
(1)销售量与广告费用的直线回归方程为: 。回归系数 表示:广告费用每增加1万元,汽车销售量平均增加14.41辆。
(2) 。它表示,在汽车销售量的总变差中,有95.27%是由销售量与广告费用之间的线性关系引起的。
(3) 。它表示,用广告费用预测汽车销售量时,平均的预测误差为68.47辆。
(4) 辆。
知识点:一元线性回归
难易度:2
2. 随机抽取的6家电子产品生产企业,收集到产量和总成本的有关数据如下:
产量(台) 总成本(万元)
产量(台)
总成本(万元)
33
6
50
8
88
13
97
18
64
12
76
15
根据上表数据计算得:
(1) 绘制散点图,说明产量与总成本之间的关系。
(2) 以产量为自变量,总成本为因变量,求线性回归方程,并解释回归系数的实际意义。
(3) 计算当产量为100件时总成本的点估计值。
答案:
(1)散点图如下:
从散点图可以看出,产量与总成本之间存在较强的正线性关系,即随着产量的增加,总生产成本也随之增加。
(2)由最小二乘法可得:
总成本与产量的一元线性回归方程为: 。回归系数 表示:产量每增加1台,总生产成本平均增加0.1742万元。
(3) 万元。
知识点:一元线性回归
难易度:3
3. 为研究人均国内生产总值(GDP)与人均消费水平之间的关系,在全国范围内随机抽取7个地区,得到2008年的人均国内生产总值(单位:元)和人均消费水平(单位:元)的统计数据,设人均GDP作自变量(x),人均消费水平作因变量(y),经初步计算,用最小二乘法得到下面的回归结果(a=0.05):
方程的截距:
回归平方和:
回归系数:
残差平方和:
(1) 写出人均GDP与人均消费水平的线性回归方程,并解释回归系数的实际意义。
(2) 计算判定系数 ,并说明它的实际意义。
(3) 计算估计标准误差 ,并说明它的实际意义。
(4) 计算相关系数,说明人均GDP与人均消费水平之间的关系强度。
答案:
(1)人均GDP与人均消费水平的线性回归方程为: 。回归系数 表示:人均GDP每增加1元,人均消费水平平均增加0.31元。
(2) 。它表示,在人均消费水平的总变差中,有96.41%是由人均GDP与人均消费水平之间的线性关系引起的。
(3) 。它表示,用人均GDP预测人均消费水平时,平均的预测误差为2.46元。
(4) ,表明人均GDP与人均消费水平之间存在较强的正线性关系。
知识点:一元线性回归
难易度:2
4. 研究结果表明受教育时间与个人的年收入之间呈正相关关系。研究人员搜集了不同行业的12名在职人员的受教育年限(单位:年)和年薪(单位:万元)的数据。将受教育年限作为自变量(x),年收入作为因变量(y),经计算得到下面的有关结果(a=0.05):
方程的截距:
回归平方和:
回归系数:
总平方和:
(1) 解释回归系数 的实际意义。
(2) 计算判定系数 ,并说明它的实际意义。
(3) 计算估计标准误差 ,并说明它的实际意义。
(4) 计算相关系数,说明人均受教育年限与年收入之间的关系强度。
答案:
(1)回归系数 表示:受教育年限每增加1年,年收入平均增加0.73万元。
(2) 。它表示,在总收入的总变差中,有92.31%是由总收入与受教育年限之间的线性关系引起的。
(3) 。它表示,用受教育年限预测总收入时,平均的预测误差为0.7348万元。
(4) ,表明人均GDP与人均消费水平之间存在较强的正线性关系。
知识点:一元线性回归
难易度:2
5. 农科院为研究降雨量对玉米产量的影响,调查了我国北方十个地区的夏季平均日降雨量(单位:毫米)和玉米亩产量(单位:公斤)数据,以日平均降水量为自变量( ),玉米亩产量为因名变量( ),经回归得到下面的有关结果( ):
方差分析表
 
df
SS
MS
F
Significance F
回归
1
35527.6
35527.6
C
0.000
残差
8
A
B
 
 
总计
9
36754.8
 
 
 
回归参数的拟合值
 
Coefficients
标准误差
t Stat
P-value
Intercept
192.212
8.887
21.627
0.000
X Variable 1
9.191
0.604
15.218
0.000
(1) 将方差分析表中的A、B、C单元格中的数值补齐。
(2) 写出回归方程,并解释回归系数的实际意义。
(3) 写出回归方程线性关系检验的原假设和备择假设,并对线性关系进行显著性检验(a=0.05)。
(4) 求日平均降水量为20毫米时,玉米亩产量的预测值。
答案:
(1)A=36754.8-35527.6=1227.2;B=1227.2÷8153.4;C=35527.6÷153.4=231.6。
(2)玉米产量与日平均降水量的线性回归方程为: 。回归系数 表示:日平均降水量每增加1毫米,玉米亩产量平均增加9.191公斤。
(3) 。由于 ,拒绝原假设,日平均降水量与玉米亩产量之间的线性关系显著。
(4) 公斤。
知识点:一元线性回归
难易度:3
6. 一家汽车销售公司的管理者认为,汽车的销售量与销售人员的数量有一定关系。为此,他随机抽取了五家销售公司,得到汽车日销售量和销售人员数的有关数据如下:
日销售量(辆)
77
64
49
23
52
销售人员数(人)
6
5
4
2
3
以销售人员数为自变量(x),日销售量为因变量(y)。根据上表数据计算得:
(1) 利用最小二乘法,求出回归方程,并解释回归系数的含义。
(2) 已知回归平方和SSR=1440,残差平方和SSE=174。计算判定系数 ,并解释其意义。
(3) 计算相关系数,说明日销售量与销售人员数之间的关系强度。
答案:
(1)由最小二乘法可得:
日销售量与销售人员数的一元线性回归方程为: 。回归系数 表示:产量每增加1人,日销售量平均增加12辆。
(2) 。它表示,在日销售量的总变差中,有89.22%是由于销售量与销售人员数之间的线性关系引起的。
(3) ,表明日销售量与销售人员数之间存在较强的正线性关系。
知识点:一元线性回归
难易度:3
7. 一家集团公司有用多家分公司,为研究销售收入(单位:万元)与销售利润(单位:万元)之间的关系,集团公司抽取12家分公司,得到年销售收入和销售利润的数据。集团公司想建立销售收入与销售利润之间的一元线性回归模型,并通过销售收入预测销售利润。经回归得到下面的有关结果( ):
回归统计
Multiple R
R Square
标准误差
0.9735
0.9477
4.0571
方差分析
df
SS
MS
F
Significance F
回归
1
1192.993
1192.993
72.478
0.001
残差
4
65.840
16.460
 
 
总计
5
1258.833
 
 
 
参数估计和检验
 
Coefficients
标准误差
t Stat
P-value
Intercept
6.604
5.044
1.309
0.261
X Variable 1
0.070
0.008
8.513
0.001
(1) 指出上述回归中的自变量和因变量。
(2) 根据上述回归结果,对所建立的回归模型进行分析。
答案:
(1)自变量是销售收入,因变量是销售利润。
(2)从拟合优度来看,判定系数 ,表明销售利润变差的97.35%可由销售收入与销售利润之间的线性关系来解释,说明回归方程的拟合效果十分理想。估计标准误差 ,表示用销售收入预测销售利润的平均误差。
从方差分析表可以看出, ,销售收入与销售利润之间的线性模型是显著的。
从回归参数的估计中可得销售收入与销售利润的线性回归方程为 ,这表明,销售收入每增加1万元,销售利润平均增加0.70万元。
综合来看,所建立的回归模型十分理想,可用销售收入来预测销售利润。
知识点:一元线性回归
难易度:3