stata整理

CSV格式D导入一定要用INSHEET USIN G

use "D:\Stata9\auto.dta", clear

edit

1.5.1 进行四则运算

. di 5+9 . di 5-9 . di 5*9 . di 10/2 . di 10^2 . di exp(0) . di ln(1) . di sqrt(4)

上述运算分别为加、减、乘、除、幂、指、对和开方，其中di 为display 的

1.5.2 描述统计：求五数概略

任务：求价格和重量的观察值个数、平均值、标准差、最小值和最大值

. use auto, clear

. sumprice

. sum weight

这两步命令也可以一步完成

. sum price weight

1.5.3 绘图

任务：绘出价格和重量的散点图和折线图

. scatter price weight

. line price weight, sort

1.5.4 生成新的数据

任务：生成新的数据x, (x=1,2,…1000); y=x+100.

. clear

网红店用路虎当招牌不惜长期违停 . set obs 1000

. gen x=_n

. gen y=x+100

1.5.5 控制结果输出显示

. list n

显示完一屏后会停住，此时按回车键和”l(list的缩写)”会显示下一行；按”q”会终止命令，或者使用ctrl+break；按其他键会显示下一页。

1.6.1 设置屏幕滚动

在列示 1 到 1000 之前，若先设置 set more off，则屏幕不停止；反之set more on 会使显示停止。

养车费用计算

. set more off

. list

. set more on

. list

. q

1.6.2 清除内存中原有内容

. clear

1.6.3 设置内存大小

查看内存使用情况

. memory

设置内存

. set memory 10m

1.6.4 设置文件存取路径

在打开数据之前，先要定位数据的位置，其命令为

. cd d:/stata9

如果想知道当前路径下有哪些文件，可以用dir 命令来列示

福特领界论坛 . dir

假设你想在 D 盘的根目录下创建一个新的文件夹 mydata 来存放数据文件，

命令为mkdir 。

mkdir d:/mydata

然后，进入该目录，命令为cd

. cd d:/mydata

1.8.1 附录1：本章命令的程序文件（只需输入下文的英文字母而不用管汉字的说明）

宝莱clear //清除内存

set memory 10m //设置内存大小

cd d:/stata8 //在打开数据之前，先要定位数据的位置

use auto //打开数据文件auto.dta

*计算汽车的平均价格

sumprice //该步计算汽车的平均价格

sum price weight //求价格和重量的观察值个数、平均值、标准差、最小值和最大值

use /*使用系统中的数据*/ auto, clear

sum weight ///

price ///

length //求重量、价格、长度的平均值

scatterprice weight // 绘价格和重量的散点图

clear //清除内存

set obs 1000 //将数据指针定位到1000处

gen x=_n //生成一个1到1000的边疆自然数，变量名为x

gen y=x+100 // 生成一个新的变量y,y从101到1100

/*从上面的例子可见：

（1）在最前面加上“*”号表示该行为注释语句，STATA 将只显示不执行；

（2）在一个命令的中间加入注释，要用： /*注释内容*/

（3）对较长的命令或者为便于阅读，将一行命令写成几行时，用///来分开

（4 ）在命令行的后面加入注释： //注释语句

1.8.2 附录2：常用命令

需求帮助

* help 帮助

* search 网络寻求帮助

进入某路径

* cd

设定内存

* set memory 20m 设置 STATA 的内存空间为20m

打开和保存数据

* clear 清空内存数据

* use 打开 STATA 格式的数据文件

* save 保存内存中的数据

导入数据

* input 录入数据

* edit 编辑数据

* infile 导入数据

汽车价钱 * insheet 导入数据

重整数据

* append 将有相同结果的数据纵向拼接（观察值拼接）

* merge 将两个数据文件横向拼接

* xpose 数据转置

* reshape

* generate 生成新的数据

* egen 生成新的数据

* rename 变量重命令

* drop 删除变量或观察值

* keep 保留变量或观察值

* sort 对观察值按从小到大顺序重新排列

* encode 数值型数据转换为字符型数据

* decode 字符型数据转换为数值型数据

* order 变量顺序的重新排列

* by 分类操作

报告数据

* describe 总体展示数据情况

* codebook 展示数据库中的每个变量情况

* list 列示内存中的数据

* count 报告共有多少观察值

* inspect 报告变量的分布

* table 数据列表

* tabulate 联列表

显示和保存输出结果

* display 显示计算结果

* log 将输出结果存放入结果文件

2 命令语句

2.1 掌握命令语句的格式

[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]

注：[ ]表示可有可无的项,显然只有 command 是必不可少的，下面结合例子分

项来讲解命令的各个组成部分。

command:例如sum(也可以简写成su) 、list（也可以简写成l）等。

[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]

2.4 分类操作 by varlist

[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]

先看下面的例子,在汽车数据集中，有一个变量foreign，该变量表示某个车是

进口车（1 Foreign）还是国产车（0 Domestic）。如果我们需要知道车的平均价

格和重量，则

. cd d:/stata9

. use auto, clear

. sumprice weight

涡轮增压和自然吸气哪个好

*如果需要分别知道国产车和进口车的价格和重量，可以采用分类操作来求得，

. byforeign : sumprice weight // 分别计算国产车和进口车的价格和重量

但如果执行下面两个命令，将出现错误*/

. sortprice //按价格从低到高重新排序

. byforeign : sumprice weight

*not sorted

/* 系统提示没有排序，这是因为by varlist在执行时要求内存中的数据是按照

stata整理

发布评论取消回复

最近发表

热门文章

标签列表