统计软件SPSS、SAS结课实验报告
课程名称:《统计软件SPSS、SAS及实践》
实验编号
及实验名称
实验报告(结课)系别数据科学系姓名学号班级应用统计
实验地点实验日期2020年6月实验时数
指导教师同组其他
成员
成绩
一、实验目的及要求
1、掌握SPSS的操作流程。
2、掌握SAS的编程方法,包括数据集、循环语句、数组、条件语句、统计图形、回归分
析、方差分析等。
3、要求:通过SPSS操作和SAS编程实现。
二、实验环境及相关情况(包含使用软件、实验设备、主要仪器及材料等)
1、实验设备:微型计算机;
2、软件系统:Windows10;统计软件:SPSS、SAS
三、实验内容
基础题
J1
一种汽车配件的长度要求为12厘米,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购买。现对一个配件提供商提供的10个样本进行检验,得到的长度(单位:厘米)的数据(J1.sav,见data文件夹)。
实验要求:使用SPSS操作完成
(1)检验配件的长度是否服从正态分布;
(2)在0.05的显著性水平下,检验该供货商的配件是否符合要求。
J2
为研究上市公司对其股价波动的关注程度,一家研究机构对在主板,中小板和创业板上市的190家公司进行了调查,得到了信息数据(J2.sav,见data文件夹)。
实验要求:使用SPSS操作完成
(1)给出上市公司的类型与对其股价波动的关注度的交叉表;
(2)在0.05的显著性水平下,检验上市公司的类型与对其股价波动的关注度是否有关。J3
下面的每一行数据代表纸箱子的length,width,和height,单位是厘米。计算每一个箱子的体积、需要的纸板的面积(假定顶部和底部的纸板对折到中间,即:顶部和底部的厚度是两层纸板)。假定纸板的价格为$0.20/平方米。
161524
481232
153045
203036
252040
实验要求:编写SAS程序
(1)建立一个SAS数据集j31读入数据,变量为length,width和height;
(2)使用set语句,利用数据集j31建立一个新SAS数据集j32,它包括j31的所有数据,并建立三个新变量:每个箱子的体积(volume),制造费用(cost),以及每立方米体积的造价y(公式为:y=cost/volume);
(3)使用建立的数据集j32建立一个新SAS数据集j3,只包括其中的volume和cost两个变量。
J4
现有统计3,4班的部分同学在某次测验中的答案,该测验共有10个单项选择题,每个单项选择题设置A,B,C,D四个选项,只有一个选项是正确答案,要求统计出单项选择题的答案都正确的同学。数据集中的变量id,name,gender,class分别表示“学号,姓名,性别,班级”,变量q1-q10分别表示“同学做出的问题1-问题10的答案”。(J4.xls,见data文件夹)
实验要求:编写SAS程序
(1)导入数据集J4.xls,在SAS中的数据集命名为class;
(2)如果10个单项选择题的正确答案是:ACBDBCADCA。统计出单项选择题的答案都正确的同学,并将其id,name,gender,class输出到新的名为j4的SAS数据集中。
J5
采购经理人指数即PMI指数,PMI指数的英文全称为:Purchasing Managers'Index,中文含义为采购经理人指数。PMI指数50为荣枯分水线。当PMI大于50时,说明经济在发展,当PMI小于50时,说明经济在衰退。PMI是一套月度发布的、综合性的经济监测指标体系。SAS数据集J5:我国2008年1月至2020年5月,制造业PMI(变量名为PMI_M)的数据。(J5.sas7bdat,见data文件夹)
实验要求:编写SAS程序
(1)当PMI大于50时的制造业PMI(PMI_M)指数数据输出到名为pmim的SAS数据集中;(2)使用intnx命令加入时间变量month,输出格式为monyy7.,更新得到新SAS数据集j5;
(3)基于第二步得到的新数据集j5,使用gplot过程作制造业PMI(PMI_M)对month
的时序图(以时间作为横轴,数据点用红的小圆圈标记,连接曲线用蓝光滑的曲线标记)。
J6
一家房地产评估公司想对某城市房地产的销售价格y与地产估价x1,房产估价x2和使用面积x3建立一个模型,以便对销售价格做出合理预测。为此,收集了20栋住宅的房地产评估数据。(J6.sav,见data文件夹)
实验要求:编写SAS程序
(1)建立销售价格y对地产估价x1,房产估价x2和使用面积x3的多元线性回归方程;(2)对回归模型的线性关系和回归系数进行检验(显著性水平为0.05);
(3)对模型进行多重共线性检验。
(4)若存在多重共线性,则选择合适的岭参数,建立岭回归方程。
J7
一家牛奶公司有4台机器填装牛奶,每桶的容量为4升。下面是从4台机器中抽取的装填量(单位:升)样本数据
从图中可以看出根据直方图绘出得曲线很像正态分布的曲线。
Step3:进一步检验(Q-Q图检验):在SPSS中执行“分析→描述统计→Q-Q图”见下图:
>汽车lsd