四分位差(QuartileDeviation)
目录
什么是四分位差
四分位差又称内距、也称四分间距(inter-quartilerange),是指将各个变量值按大小顺序排列,然后将此数列分成四等份,所得第三个四分位上的值与第一个四分位上的值的差。
四分位差的公式
四分位差用公式表示:
其中:
四分位差若图所示:
四分位差的特点
四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。与极差(最大值与最小值之差)相比,四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。
四分位差的适用范围
四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。
四分位差的计算
四分位差的计算方法
如果所给的数据资料不同,四分位差的具体计算方法也不同:
- 1.未分组数据
首先对数据进行排序,求出
- 2.单项式数列
先计算各组的累计次数,然后确定分位点位置。
对于上面的两种情况,若(n+1)或
假设样本容量为50时,=12.75,=38.25,则按插值法可得:
整理得:
同样可得:
- 3.组距式数列
先计算上、下四分位的值,然后再计算四分位差。此时计算四分位数的基本原理与中位数相类似。计算公式如下:
×
×
式中,,,分别代表下四分位和上四分位数所在组的下限;,分别代表下四分位和上四分位数所在组以下的累计次数;,分别代表下四分位和上四分位数所在组的次数。
四分位差的计算案例
例1:由7人组成的旅游小团队年龄分别为:17、19、22、24、25、28、34,求其年龄的四分位差。计算步骤为:
①计算
即
②确定
即第2位和第6位对应年龄分别为19岁和28岁。
③计算四分位差。
Q.D.=
④含义。说明该旅游小团队有50%的人年龄集中在19~28岁之间,最大差异为9岁。
例2:由8人组成的旅游小团队年龄分别为:17、19、22、24、25、28、34、38,求其年龄的四分位差。计算步骤为:
①计算
即
②确定
③计算四分位差。
Q.D.=
④含义。说明该旅游小团队有50%的人年龄集中在19.75岁至32.5岁之间,最大差异为12.75岁。
(2)分组资料计算的四分位差。
例3:根据某车间工人日产量分组资料,如表1所示,计算四分位差。
计算步骤为:
①确定
根据向上累计工人数可知
根据向上累计工人数可知,
②计算
(个)
(个)
③计算四分位差。
Q.D.=
④含义。计算结果表明,有50%(一半)工人的日产量分布在11.4~17.4之间,且最大差异为6个。
四分位差的优点表现为不受两端各25%数值的影响,能对开口组数列的差异程度进行测度,可以衡量中位数代表性高低。缺点为不能反映所有标志值的差异程度。
发表评论