第一章 描述性统计
1. 某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe下画直方图,并分析数据特征。
下一次油价调整时间
117
122
124
129
139
107东风雪铁龙新世嘉怎么样
117
130
122
125
108
131
125
117
122
133
126
122
118
108
110
118
123
126
133
134
127
123
118
沃尔沃v60保养费用112
112
134
127
123
119
113
120
123
127
135
137
114
120
128
124
115
139
128
124
121
1.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。
数据特征:大多数人的日加工零件数在120到125之间。
2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析
原材料供应商
员工编号
1
2
3
4
5
6
7
由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱
线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。
呼家楼地铁3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
江铃全顺7座商务车
考试成绩
人数
甲班
乙班
3
6
6
15
18
9
及格
9
8
不及格
4
2
  (1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图和图饼图。
(2)比较两个班考试成绩分布的特点。
3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。
 
(1)
   
   
(2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。
(3)
从上图可知,甲乙两班考试成绩的分布不相似。
4.    随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如下:
网民年龄
15
16
17
18
19
19
兰博基尼高速自燃
19
20
20
21
22
22
23
23
23
24
24
25
27
29
30
31
34
38
(1)    计算众数、中位数。(exlce数据分析:众数19,中位数)
(2)    根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=,所以上四分位数是下四分位数的位置是(24+1)/4=,所以下四分位数是19)。
(3)    计算平均数和标准差(平均数是,标准差是)。
(4)    计算偏态系数和峰态系数(偏态系数是,峰度系数是)。
(5)    对网民年龄的分布特征进行综合分析。(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占
绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。)
5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为分钟,标准差为,分钟,第二种排队方式的等待时间(单位:min)如下:
 
排队时间
(1)    计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是)。
(2)    比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数,第二种
排队方式的离散系数是,所以第一种排队方式等待时间的离散程度大于第二种排队方式)。
(3)     如果让你选择一种排队方式,你会选择哪一种?试说明理由(选择第二种,因为平均等待时间短,而且离散程度小)。
6. 在某地区抽取的120家企业按利润额进行分组,结果如下
 
按利润额分组
企业数
200300
19
300400
30
400500
42
500600
18
600以上
11
合计
120
  1)计算120家企业利润额的均值和标准差;