Stata是一款专业级别的统计学软件,专用于各类数据统计、分析、汇总,可以说跟数据库关系甚密,导入数据的方法都五花八门,下面自由互联小编就为你带带来全面的数据导入教程。
数据导入方法一:直接复制粘贴
绝对简单明了,不需要任何技术,缺点就在于当数据比较多的时候,拉框选择还是一件很麻烦的事情,有些数据在excel中可能是显示小数点后两位,但实际储存的并不止这么多。如果是复制粘贴了,可能只粘贴过去小数点后两位,这样就损失了一部分精度。最不推荐。
数据导入方法二:命令:use
1.insheet using filename, [option]
这个命令是专门用来导入像excel之类的以电子表格形式存储的数据。在导入之前,首先要把excel文件转存为STATA可以识别的格式。其中我最常用的就是另存为csv逗号分隔符格式。
然后在STATA中使用insheet读取csv文件,在option中指定为comma告诉STATA你读取的是csv文件。
这种方法有个不足在于如果你的数据中包含中文而且里面含有逗号时无法识别,解决的办法是不要用逗号标示分隔符了,在excel中另存为txt(制表符分隔),这样就不会与逗号相混淆了。然后再在insheet命令中在option里指定是tab,就完事了。
2.infile using filename
这个infile命令分两类,一种是处理固定格式(fixed format)的txt或raw,另一种是处理自由格式(free format),当然你在用这个命令里还需要定义一个dictionary,这个dictionary是用来描述数据的组织方式的,需要自己根据要导入的数据文件自己编写代码,然后嵌套到数据文件txt的前面去,或者是单独地存为一个dct文件,并且告诉STATA你要导入的数据在保存在哪里。
3.xmluse
这个命令首先要把xls文件另存为xml格式,然后用xmluse命令去读取,当然在读取时你也要在option中声明你的xml文件是excel保存的而不是STATA保存的,这样就不会弄错。
如果你的xls文件中如果有汉字的话,STATA读取后对应的变量会出现乱码,这一点用insheet就不会有这个问题。
4.odbc
这个命令是专门读取数据库文件的,并且支持SQL命令,这样如果你的数据比较多的话,可以先用SQL语句进行筛选,然后而导入。当然这个命令也能导向excel文件。
数据导入方法三:点击“File”→“Open”,找到文件“.dta”,局限比较大,主要是表格类型只支持.dta格式。
数据导入方法四:点击“File”→“import”,可以导入xls,txt等其他格式的数据,同样是对于导入文件的格式有要求。
以上就是自由互联小编为你带来的Stata数据导入方法教程,自由互联小编个人比较建议的是调用STATA的内部数据导入命令,到时考虑新手用户的使用难度,可以选择更为简单的导入操作。