CSV格式D导入一定要用INSHEET USIN G
use "D:\Stata9\auto.dta", clear
edit
1.5.1 进行四则运算
. di 5+9 . di 5-9 . di 5*9 . di 10/2 . di 10^2 . di exp(0) . di ln(1) . di sqrt(4)
上述运算分别为加、减、乘、除、幂、指、对和开方,其中di 为display 的
1.5.2 描述统计:求五数概略
任务:求价格和重量的观察值个数、平均值、标准差、最小值和最大值
. use auto, clear
. sumprice
. sum weight
这两步命令也可以一步完成
. sum price weight
1.5.3 绘图
任务:绘出价格和重量的散点图和折线图
. scatter price weight
. line price weight, sort
1.5.4 生成新的数据
任务:生成新的数据x, (x=1,2,…1000); y=x+100.
. clear
网红店用路虎当招牌不惜长期违停 . set obs 1000
. gen x=_n
. gen y=x+100
1.5.5 控制结果输出显示
. list n
显示完一屏后会停住,此时按回车键和”l(list的缩写)”会显示下一行;按”q”会终止命令, 或者使用ctrl+break;按其他键会显示下一页。
1.6.1 设置屏幕滚动
在列示 1 到 1000 之前,若先设置 set more off,则屏幕不停止;反之set more on 会使显示停止。
养车费用计算 . set more off
. list
. set more on
. list
. q
1.6.2 清除内存中原有内容
. clear
1.6.3 设置内存大小
查看内存使用情况
. memory
设置内存
. set memory 10m
1.6.4 设置文件存取路径
在打开数据之前,先要定位数据的位置,其命令为
. cd d:/stata9
如果想知道当前路径下有哪些文件,可以用dir 命令来列示
福特领界论坛 . dir
假设你想在 D 盘的根目录下创建一个新的文件夹 mydata 来存放数据文件,
命令为mkdir 。
mkdir d:/mydata
然后,进入该目录,命令为cd
. cd d:/mydata
1.8.1 附录1:本章命令的程序文件 (只需输入下文的英文字母而不用管汉字的说明)
宝莱clear //清除内存
set memory 10m //设置内存大小
cd d:/stata8 //在打开数据之前,先要定位数据的位置
use auto //打开数据文件auto.dta
*计算汽车的平均价格
sumprice //该步计算汽车的平均价格
sum price weight //求价格和重量的观察值个数、平均值、标准差、最小值和最大值
use /*使用系统中的数据*/ auto, clear
sum weight ///
price ///
length //求重量、价格、长度的平均值
scatterprice weight // 绘价格和重量的散点图
clear //清除内存
set obs 1000 //将数据指针定位到1000处
gen x=_n //生成一个1到1000的边疆自然数,变量名为x
gen y=x+100 // 生成一个新的变量y,y从101到1100
/*从上面的例子可见:
(1) 在最前面加上“*”号表示该行为注释语句,STATA 将只显示不执行;
(2) 在一个命令的中间加入注释,要用: /*注释内容*/
(3) 对较长的命令或者为便于阅读,将一行命令写成几行时,用///来分开
(4 ) 在命令行的后面加入注释: //注释语句
1.8.2 附录2:常用命令
需求帮助
* help 帮助
* search 网络寻求帮助
进入某路径
* cd
设定内存
* set memory 20m 设置 STATA 的内存空间为20m
打开和保存数据
* clear 清空内存数据
* use 打开 STATA 格式的数据文件
* save 保存内存中的数据
导入数据
* input 录入数据
* edit 编辑数据
* infile 导入数据
汽车价钱 * insheet 导入数据
重整数据
* append 将有相同结果的数据纵向拼接(观察值拼接)
* merge 将两个数据文件横向拼接
* xpose 数据转置
* reshape
* generate 生成新的数据
* egen 生成新的数据
* rename 变量重命令
* drop 删除变量或观察值
* keep 保留变量或观察值
* sort 对观察值按从小到大顺序重新排列
* encode 数值型数据转换为字符型数据
* decode 字符型数据转换为数值型数据
* order 变量顺序的重新排列
* by 分类操作
报告数据
* describe 总体展示数据情况
* codebook 展示数据库中的每个变量情况
* list 列示内存中的数据
* count 报告共有多少观察值
* inspect 报告变量的分布
* table 数据列表
* tabulate 联列表
显示和保存输出结果
* display 显示计算结果
* log 将输出结果存放入结果文件
2 命令语句
2.1 掌握命令语句的格式
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
注:[ ]表示可有可无的项,显然只有 command 是必不可少的,下面结合例子分
项来讲解命令的各个组成部分。
command:例如sum(也可以简写成su) 、list(也可以简写成l)等。
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
2.4 分类操作 by varlist
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
先看下面的例子,在汽车数据集中,有一个变量foreign,该变量表示某个车是
进口车(1 Foreign)还是国产车(0 Domestic)。如果我们需要知道车的平均价
格和重量,则
. cd d:/stata9
. use auto, clear
. sumprice weight
涡轮增压和自然吸气哪个好*如果需要分别知道国产车和进口车的价格和重量,可以采用分类操作来求得,
. byforeign : sumprice weight // 分别计算国产车和进口车的价格和重量
但如果执行下面两个命令,将出现错误*/
. sortprice //按价格从低到高重新排序
. byforeign : sumprice weight
*not sorted
/* 系统提示没有排序,这是因为by varlist在执行时要求内存中的数据是按照
发布评论