蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 13718|回复: 25
收起左侧

[统计应用] 离群值的判断和应用

  [复制链接]
药徒
发表于 2015-5-22 08:59:39 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 药窕淑女 于 2015-5-22 09:01 编辑

1. 何为离群值
离群值(outlier),也叫异常值,指样本中的一个或几个观测值,它们离开其他观测值较远,暗示可能来自不同的总体。
2.
离群值判断的简易方法
1
4d
   4d
法即4倍于平均偏差法,适用于4~6个重复测定数据的取舍。具体做法如下:
   ①除了离群值外,将其余的数据相加求出算术平均值及平均偏差d
   ②将离群值与平均值相减,若离群值—平均值》4d,则为离群值,反之,不属于离群值。
    例子:
    实验室测得5组数据,30.18,30.5630.2330.3530.32,问其中最大值30.56是否是离群值
    解:平均值=30.27
    d=0.065
离群值—平均值=30.56-30.27=0.29>4xd
因此30.56为离群值
23σ原则检验法
   根据正态分布的原理,在一定条件下,重复测定其得到的测定值,落在(μ±3σ)范围内的概率为99.73%,若有个别数据超出    这个标准,根据小概率事件的原理,测有理由认为属于异常数据,应予以剔除。
   例子:
   如一组数据7.972,7.969,7.964,7.975,7.972,7.968,7.970,,7.967,7.969,7.974.这组数据中是否有离群值
   解:平均值=7.970,S=0.003
      平均值 -3s=7.961,   平均值+3s=7.979
   上述数据均在(7.961,7.979)范围内,无离群值。
   上述两种方法为比较建议的判断方法,其他的方法还可以参考GB4883-2008.
3. 离群值一般的处理方法
  异常值保留在样本中参加后面的数据分析
  允许剔除
  允许剔除,并追加适宜的观测值计入样本
  找到实际原因后修订异常值
4.工作中的应用
   当判断一个数据是否是OOE,或者是判断一个数据是否异常时,可以应用该方法。

上述是对离群值的简单理解,欢迎拍砖讨论。
@大呆子 @蜗牛98




GB4883-2008.pdf

1.07 MB, 下载次数: 232, 下载积分: 金币 -1

回复

使用道具 举报

大师
发表于 2015-5-22 10:27:42 | 显示全部楼层
感谢淑女版主,离群值其实在实践中还是很有重要意义的,对于我们处理那些难以找到原因的偏差能起到一个指导作用。当然舍弃并不是不关注不重视
回复

使用道具 举报

药士
发表于 2015-5-22 09:00:51 | 显示全部楼层
在统计学中广泛应用
但在药检中如果没有证据一般不被认可
回复

使用道具 举报

药士
发表于 2015-5-22 09:18:35 | 显示全部楼层
一般认为超3个西格玛,就认为异常或者是离群,或者是其他什么。但是剔除一般都很难了。
回复

使用道具 举报

药士
发表于 2015-5-22 09:18:50 | 显示全部楼层
离群值用于连续变量判断。非连续变量剔除所谓离群值反倒是丧失了机会。
回复

使用道具 举报

大师
发表于 2015-5-22 10:00:51 | 显示全部楼层
感谢分享!
回复

使用道具 举报

药生
发表于 2015-5-22 10:29:41 | 显示全部楼层
一般在检验中出现的异常值,就不能轻易剔除的
同样的,在过程分析里面的异常值也不随意剔除
不过在使用历史数据制定控制限度的时候,可以使使用各种判异规则,来剔除离群值,来得到一个更符合实际的控制限度
回复

使用道具 举报

药士
发表于 2015-5-22 11:09:30 | 显示全部楼层
蜗牛98 发表于 2015-5-22 10:29
一般在检验中出现的异常值,就不能轻易剔除的
同样的,在过程分析里面的异常值也不随意剔除
不过在使用历 ...

多看点悲剧有什么不好呢,七仙女、嫦娥奔月、李尔王。。。。。。。。。。。。。名著都是悲剧的。

点评

悲剧也都是正常人给衬托出来的,要是没有正常的,悲剧也就悲不起来了  详情 回复 发表于 2015-5-22 11:40
回复

使用道具 举报

药徒
发表于 2015-5-22 11:31:30 | 显示全部楼层
学习,数学是我的弱项

点评

只要有强项就可以  详情 回复 发表于 2015-5-22 11:41
回复

使用道具 举报

药徒
 楼主| 发表于 2015-5-22 11:32:23 | 显示全部楼层
大呆子 发表于 2015-5-22 10:27
感谢淑女版主,离群值其实在实践中还是很有重要意义的,对于我们处理那些难以找到原因的偏差能起到一个指导 ...

这个工具可以确定是否是离群值,如果涉及到剔除,就需要考虑很多因素了
回复

使用道具 举报

药生
发表于 2015-5-22 11:40:46 | 显示全部楼层
yuansoul 发表于 2015-5-22 11:09
多看点悲剧有什么不好呢,七仙女、嫦娥奔月、李尔王。。。。。。。。。。。。。名著都是悲剧的。

悲剧也都是正常人给衬托出来的,要是没有正常的,悲剧也就悲不起来了
回复

使用道具 举报

药生
发表于 2015-5-22 11:41:17 | 显示全部楼层
林琳 发表于 2015-5-22 11:31
学习,数学是我的弱项

只要有强项就可以
回复

使用道具 举报

药士
发表于 2015-5-22 11:42:58 | 显示全部楼层
蜗牛98 发表于 2015-5-22 11:40
悲剧也都是正常人给衬托出来的,要是没有正常的,悲剧也就悲不起来了

对啊。所以踢谁都不对。

点评

不是,你只有先知道什么是正常,才能凸显出悲剧来 不能让悲剧的来影响正常的  详情 回复 发表于 2015-5-22 12:40
回复

使用道具 举报

药士
发表于 2015-5-22 11:55:39 | 显示全部楼层
回复

使用道具 举报

大师
发表于 2015-5-22 12:36:11 | 显示全部楼层
回复

使用道具 举报

大师
发表于 2015-5-22 12:38:16 | 显示全部楼层
蜗牛98 发表于 2015-5-22 11:40
悲剧也都是正常人给衬托出来的,要是没有正常的,悲剧也就悲不起来了

合理利用统计学至少比拍脑袋要来的科学
回复

使用道具 举报

药生
发表于 2015-5-22 12:40:13 | 显示全部楼层
yuansoul 发表于 2015-5-22 11:42
对啊。所以踢谁都不对。

不是,你只有先知道什么是正常,才能凸显出悲剧来
不能让悲剧的来影响正常的
回复

使用道具 举报

大师
发表于 2015-6-5 14:08:46 | 显示全部楼层
淑女,能否再讲讲离群值的Q检验法?

点评

好的,回去整理一下,也边学边和大家分享  详情 回复 发表于 2015-6-5 16:15
回复

使用道具 举报

药徒
 楼主| 发表于 2015-6-5 16:15:51 | 显示全部楼层
大呆子 发表于 2015-6-5 14:08
淑女,能否再讲讲离群值的Q检验法?

好的,回去整理一下,也边学边和大家分享
回复

使用道具 举报

药徒
发表于 2016-3-10 14:56:57 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( (京)-非经营性-2014-0058 京ICP证150354号 京ICP备14042168号-1 )

GMT+8, 2024-3-29 07:08

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表