LESSON1
1.数据录入和获取
手动录入:以行和列为单位输入
第一行变量名不能输入
每一行称为个案case
行列交叉为数据
每列的数据类型必须一致
录入原则:
步骤:
LESSON2 变量类型
1.数值型:
包括年龄/逗号(英美国家货币以千为识别单位)/点(欧洲货币识别单位)等
总长度为:宽度+小数位
数值:eg001—受限数值
2.字符串:
一个汉字3个字符的宽度(字符宽度尽量多)
有限分类型字符可转换为数值类型(编码),需在值标签中标注----数据视图(值标签)查看
3.日期类型:
特殊性数值型变量
多用于时间序列分析;在较为简单的分析问题中可转换为数据类型:eg201610
输入日期时要连带/符号输入,否则数值会错乱
可接受的最早日期为1582/10/15
LESSON3 变量尺度
- 标签:解释名称或者字段名
- 缺失值:
字符串缺失–空白/数值缺失–点
LESSON4 导入数据:
1.录入
- 技巧:
- 冻结
- 调查问卷录入
1.单选:
Q1或Q_1 注意不为Q-1
标签—列出问题和所有的选项
值—相应的数字对应相应的选择
2.多选
3.排序
1113待补充
4.开放式
您在网上购物时采用什么样的支付方式?(不定项多选)
A.网上银行B.第三方支付C.信用卡支付D.货到付款E.其他
2.导入
方法一:
打开—导入Excel等—查看变量是否需要更改
方法二:
文件–打开–TXT格式–文本导入向导(根据需要更改)–变量视图检查–保存
LESSON5 数据准备
一 转换菜单介绍
二 数据的清洗
1.标识重复个案并删除
方法一:
数据—标识重复个案–选定(最后/第一个为基本个案)—选定—清除
方法二:
数据—选择个案
三 数据的抽取
1.随机抽样
- 目的:按随机原则进行样本抽取
- 步骤:数据–选择个案–随机个案样本–样本尺寸–选择输出(过滤或者保留)
2.选择个案
- 目的:筛选出符合要求的个案
- 步骤:数据–识别重复个案–选定字段–创建变量–选定位置
- 注意:输出的选项为新数据集时,表格不会有变化,会生成新的表格
- 不要个案,恢复原数据:删除$新字段
- 标识&删除重复列组合
![]()
3.字段拆分
转换–计算变量–标签–类型与长度–函数
4.字段合并
转换—计算变量—标签–字段类型/长度选择–计算公式
- 注意:字段的类型/长度/展示形式(是否需要特殊符号,eg"/")
5.多表记录合并(多表相同字段(结构/数据类型/字段名称一致)合并)
数据–数据合并–选择个案–选择所要合并的表格–选择所需字段
6.多表变量合并(多表不同字段匹配合并)
数据–数据合并–选择个案–选择合并的表格–选择共有关键字段–选择其他所需字段
- 注意:表格关键字段进行升/降序排列