《数据模型与决策》复习(附参考答案)
2018.9
一、填空题(五题共15分)
  1. 已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是    
    解:N(167.48,0.609)
    考查知识点已知总体服从正态分布,求样本均值的分布。
    2. 某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为     
    解:[1040,1936]
      考查知识点:区间估计的求法。正态总体均值的区间估计是[,]
其中是样本平均数,s是样本的标准差,n是样本数。
    详解:直接带公式得:区间估计是
        [,]= [,]
                              =[1040,1936]
    3. 遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。假设某人前一胎是女孩那么她的下一胎也是女孩的概率为0.55;如果某人一胎是男孩那么她的下一胎还是男孩的概率为0.48。已知小李第一胎是女孩,那么她的第三胎生男孩的概率是  ③
      解 p=0.4653
      考查知识点:离散概率计算方法
      详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩
                G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩
        P(B3)=P(B3B2)+P(B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P(B3))
            = P(B3|B2)P(B2)+P(B3|G2)P(G2)
            =0.48×(1-0.55)+(1-0.55) ×0.55
            =0.4653
    4. 调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是   ④ 
    p=0.5
    考查知识点:了解正态分布概率含义。
    5. 结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是      。(请在0.3、0.6和0.9中选一个)
  考查知识点:了解相关系数。
    本题答案:孩子与父母平均身高的相关性比较高,应该选0.9
    6. 简述模拟仿真的关键步骤。
  考查知识点:模拟仿真的思想
二、单项选择题(五题共15分)
  1. 下列事件中,属于小概率事件的随机事件是(    )
    A. 抛一枚均匀的硬币2次,结果全是正面   
      B. 抛一枚均匀的硬币3次,结果全是正面
      C. 抛一枚均匀的硬币4次,结果全是正面   
      D. 小王某天上班路上捡到10元钱
  : D
  考查知识点:认识哪些事件是小概率事件?
  2. 关于假设检验,下列说法正确的是(      )。
A. P值<0.05,拒绝原假设      B. P值<0.05,接受原假设
C. P值>0.05,拒绝原假设        D. P值>0.05,接受原假设
  : A
  考查知识点:假设检验的思想
  3. 天气预报常常用区间表示一天温度的变化,比如明天温度在[a,b]之间,这种预                                                                                                                                                    报其实是一个置信度为95%的区间。描述置信度与精确度的关系。
  4. 不确定型决策方法。
  5. 检验两个变量之间是否有关系,如“吸烟与患肺病有关系吗?”应采用(    )。
A. U检验  B. t检验    C.  2检验    D. F检验
解 C
考查知识点:分组数据检验方法。
三、简答题(两题共40分)
1. 货车的行驶时间与行驶距离的远近及运送货物的次数有关,表2给出的资料是从上海市某运输队收集来的:
表2 货车的行驶时间与行驶距离的远近及运送货物的次数统计
Y:小时
7.3
4.8
9.5
5.2
7.2
6.2
7.4
6.6
7.6
6.3
X1100公里
1
0.6
1.5
0.7
0.5
0.8
0.75
0.75
0.9
0.9
X2:次数
4
2
4
2
4
2
3
4
4
2
利用Excel,得到下列输出结果,回答后面的三个问题。
回归统计
 
Multiple R
0.913
R Square
0.833
Adjusted R Square
0.785
标准误差
0.616
观测值
10
方差分析
 
df
SS
MS
F
Sig  F
回归分析
2
13.253
6.626
17.464
0.002
残差
7
2.656
0.379
总计
9
15.909
 
 
 
 
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
A
0.802
2.762
0.028
0.318
4.110
X Variable 1
2.688
0.792
3.395
0.012
0.816
4.560
X Variable 2
0.377
0.109
3.449
0.011
0.119
0.635
(1) 从上述输出结果看,这个模型拟合效果如何?
(2) 上表中的截距A为多少?
(3) 写出货车的行驶时间与行驶距离的远近及运送货物的回归方程。
(4) 倘若某次行驶距离为50公里,跑4次,估计花费多少时间?
解:(1) 从模型检验的F值为17.464对应的p值等于0.002小于5%看模型拟合效果很好,另外,R2=0.833也表明模型的解释能力达到83.3%,说明模型拟合效果不错。
  (2) 上表中的截距A=(0.318+4.11)/2=2.214.
    (3)货车的行驶时间与行驶距离的远近及运送货物的回归方程为:
    (4) 将x1=0.5,x2=4次带入回归方程花费时间约为5.07小时。
考查知识点:回归方法的操作、模型选择、估计和预测。
  2.(10分) Westdata公司正在考虑如何管理其数据处理操作系统,它有两种方案选择,一是继续让自己的员工管理(自营),二是聘请供应商管理(外包)。管理数据处理操作系统的费用取决于未来的需求,市场部经理预测未来需求有高、中、低三个等级,并且预测当未来的需求高时,自营的费用是1300,外包的费用1800,当未来的需求中时,自营的费用是1300,外包的费用1200,当未来的需求低时,自营的费用是1200,外包的费用600,请回答问题:
(1)给出Westdata公司决策问题的支付矩阵(收益表); 
 
自营
-1300
-1300
-1200
外包
-1800
-1200
-600
(2)请您利用最大风险最大化方法(乐观法)、最大风险最小化方法(悲观法)和最小最大后悔值法给Westdata决策者推荐方案。
解:
乐观法:
 
自营
-1300
-1300
-1200
外包
-1800
-1200
-600
决策:选择外包。
悲观法:
 
自营
-1300
-1300
-1200
外包
-1800
-1200
-600
决策:选择自营。
最小最大后悔值法:
               
 
全国汽车租赁底
自营
0
100
600
外包
500
0
0
决策:选择外包。
考查知识点:不同决策准则下的决策方法
四、计算题(三题共30分)
  1. (10分)某开发商面临有两种选择,投资建设百货商场(T),放弃建设百货商场(Q)。但建设百货商场可能面临未来人流量太少(X),也可能面临未来人流量大(D)。利润矩阵见下表(单位:万元)。开发商现在犹豫是否需要进行市场调研。调研成本是5万元。咨询将产生两种结果,认为人流量大(Y)和人流量小(N)。相关概率如下所示:P(X)=0.4,P(D)=0.6,P(Y)=0.8,P(N)=0.2,P(X|Y)=0.1,P(D|Y)=0.9,P(X|N)=0.8,P(D|N)=0.2