请教:统计学里处理outlier(偏值)的方法有哪些?

来源:百度知道 编辑:UC知道 时间:2024/06/27 03:17:56
在一项客户调查中,让100个客户对公司售后服务打了分(满分10分)。大部分人给分在6--8分,少数人少于4分。在处理数据时,对一些偏离大部分人意见的值要减少它们的影响,所以不能一味的把全部数加起来除以100。请问如何定义哪些是偏值?有什么方法处理这些偏值?

注:希望结果是用区间表示这些数字。谢谢!

我觉得这个可能使用Boxplot(箱线图)来分析,例如如下28个数据.
进行做箱线图,此组数据的outlier值是-2,15
-2, 1, 2, 3, 3, 4, 4, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 9, 12, 15

Boxplot里会显示出outlier的值,及四分位数区间,95%置信区间,那您可以使用去掉outlier点的数据进行分析,也可使用1,3分位数区间里的,也可使用95%置信区间里的数据进行分析,具体用哪部份数据还要自已把握,或者三种都分析后比较之间的差异,然后做出不同的解释.