手机浏览器扫描二维码访问
二、数据的初步整理
banner"
>
任何数据资料在进行分析前都需要进行无效数据的筛选和剔除。
判断无效数据的标准有以下几点。
第一,录入错误。
数据录入过程中的错误不可避免,有些错误通过检查是可以得到发现并更正的,如图12-2与图12-3中列出的第6条数据的性别,在数据中录入的值是3,明显是录入错误,这种情况下可以根据编号找回原始问卷进行修改。
第二,数据漏答、错答比较多。
一般情况下,错漏答问题数超过全部问题数的5%可以认为被调查者并没有认真完成调查,该条数据无效,需要剔除。
第三,回答呈现出某种机械的规律性。
如果被调查者的选择集中于某个选项或者规律性地在几个选项之间循环,如“111111”
“555555”
或者“1234554321”
“1234512345”
等,都表明被调查者并没有真正地回答问题,数据无效,需要剔除。
第四,测谎题超标。
如果调查问卷含有测谎题,被调查者在测谎题上面的回答显示其说谎,则说明被调查者并没有真实地回答问题,数据无效,需要剔除。
第五,异常数据。
异常数据有两类,一类是明显的逻辑错误题,比如被调查者在回答是否是独生子女时选择“是”
,在回答父母是否偏心时也选择“是”
,则说明至少一个问题上的回答是虚假的,反映被调查者的配合度比较低,可以考虑剔除数据。
另一类是指在总体数据中,个别数据的数值极端大或者极端小。
比如心理学实验中被试的反应时如果低于100毫秒,说明被试没有看到刺激就按键反应,属于无效数据。
另外也可根据三个标准差的原则剔除极端数据,即删除平均数加减三个标准差以外的数据。
例如,在分析两个班级的语文成绩是否有差异时,可能会存在一些极端成绩,并不能代表班级的一般水平,就需要按三个标准差的原则剔除极高分与极低分。
具体做法为:假设A班平均分为80分,标准差为6分,则A班98分以上和62分以下的成绩属于三个标准差以外的极端数据,需要删除。
根据以上标准经过无效数据删除后的数据才是最后用于统计分析的有效数据。
请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。