4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。
解:
Statistics | ||
汽车销售数量 | ||
N | Valid | 10 |
Missing | 0 | |
Mean | 9.60 | |
Median | 10.00 | |
Mode | 10 | |
Std. Deviation | 4.169 | |
Percentiles | 25 | 6.25 |
50 | 10.00 | |
75 | 12.50 | |
4.2 随机抽取25个网络用户,得到他们的年龄数据如下:
19 | 15 | 29 | 25 | 24 |
23 | 21 | 38 | 22 | 18 |
30 卡罗拉2020款价格 | 20 | 19 | 19 | 16 |
23 | 27 | 22 | 34gmc商务车 | 24 |
41 | 20 | 31 | 17 | 23 |
迈巴赫为什么挂黄牌 |
要求;(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄 | |||||
Frequency | Percent | Cumulative Frequency | Cumulative Percent | ||
Valid | 15 | 1 | 4.0 | 1 | 4.0 |
16 | 1 | 4.0 | 2 | 8.0 | |
17 | 1 | 4.0 | 3 | 12.0 | |
18 | 1 | 4.0 | 4 | 16.0 | |
19 | 3 | 12.0 | 7 | 28.0 | |
20 | 2 | 8.0 | 9 | 36.0 | |
21 | 1 | 4.0 | 10 | 40.0 | |
22 | 2 | 8.0 | 12 | 48.0 | |
23 | 3 | 12.0 | 15 | 60.0 | |
24 | 2 | 8.0 | 17 | 68.0 | |
25 | 1 | 4.0 | 18 | 72.0 | |
27 | 1 | 4.0 | 19 | 76.0 | |
29 | 1 | 4.0 | 20 | 80.0 | |
东风轿跑车30 | 1 | 4.0 | 21 | 84.0 | |
31 | 1 | 4.0 | 22 | 88.0 | |
34 | 1 | 4.0 | 23 | 92.0 | |
38 | 1 | 4.0 | 24 | 96.0 | |
41 | 1 | 4.0 | 25 | 100.0 | |
Total | 25 | 100.0 | |||
从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25
和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652
(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:
分组:
1、确定组数:,取k=6
2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned) | |||||
Frequency | Percent | Cumulative Frequency | Cumulative Percent | ||
Valid | <= 15 | 1 | 4.0 | 1 | 4.0 |
16 - 20 | 8 | 32.0 | 9 | 36.0 | |
21 - 25 | 9 | 36.0 | 18 | 72.0 | |
26 - 30 | 3 | 12.0 | 21 | 84.0 | |
31 - 35 | 2 济南银座汽车 | 8.0 | 23 | 92.0 | |
36 - 40 | 1 | 4.0 | 24 | 96.0 | |
41+ | 1 | 4.0 | 25 | 100.0 | |
Total | 25 | 100.0 | |||
特斯拉将抛售50亿美元股票 |
分组后的均值与方差:
Mean | 23.3000 |
Std. Deviation | 7.02377 |
Variance | 49.333 |
Skewness | 1.163 |
Kurtosis | 1.302 |
分组后的直方图:
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元) | 企业数(个) |
200~300 300~400 400~500 500~600 600以上 | 19 30 42 18 11 |
合 计 | 120 |
要求:(1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。
解:
Statistics | ||
企业利润组中值Mi(万元) | ||
N | Valid | 120 |
Missing | 0 | |
Mean | 426.6667 | |
Std. Deviation | 116.48445 | |
Skewness | 0.208 | |
Std. Error of Skewness | 0.221 | |
Kurtosis | -0.625 | |
Std. Error of Kurtosis | 0.438 | |
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA===1;ZB===0.5 因此,A项测试结果理想。
4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:
成年组 | 166 169 l72 177 180 170 172 174 168 173 |
幼儿组 | 68 69 68 70 7l 73 72 73 74 75 |
要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?
均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大?
成年组 | 幼儿组 | ||
平均 | 172.1 | 平均 | 71.3 |
标准差 | 4.201851 | 标准差 | 2.496664 |
离散系数 | 0.024415 | 离散系数 | 0.035016 |
幼儿组的身高差异大。
7.3从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差σ=86414,构建总体均值μ的95%的置信区间。解: 已知n =100, =104560,σ = 85414,1-α=95% ,
由于是正态总体,且总体标准差已知。总体均值μ在1-α置信水平下的置信区间为
104560 ± 1.96×85414÷√100= 104560 ±16741.144
发布评论