雪峰之巅
科研小白,初次做孟德尔随机化,但做出来的森林图和漏斗图有明显离群值,统计出来倒方差法也没有统计意义,怎么找出来这个离群值,或者怎么找到导致异常的这些数据进行剔除,或者怎么进行分析,谢谢
loveliufudan
对于初次进行随机对照试验得到的结果存在明显的离群值,可以从以下几个方面进行处理:
1. 检查实验过程是否有问题,确认离群值不是由实验操作错误造成的。
2. 绘制箱型图观察每个组别的离群值情况,参考四分位距判断明显离群值。
3. 计算每个数据点的 Cook distance,判断其影响大小。Cook distance越大表示对模型影响越大。
4. 进行敏感性分析,将疑似离群值暂时剔除后重新建模,观察结果变化。
5. 如果离群值对结果影响很大,则考虑剔除该数据。如果影响不大,则保留该数据。
6. 对剔除后的数据集再次进行统计分析,报告剔除过程及结果变化。
7. 如果剔除明显离群值后结果仍无统计学意义,则需要考虑样本量是否足够,变量选择是否合理等。
8. 在报告中详细描述数据处理过程及对结果的影响。处理不当可能引入统计学偏差。
综合运用上述方法,寻找合理的解决方案,妥善处理离群值,进行稳健的统计分析。
此用户已注销
孟德尔随机化的原理可以参考G. Davey Smith and Ebrahim 2003; George Davey Smith and Hemani 2014, 统计方法可以参考Pierce and Burgess 2013; Bowden, Davey Smith, and Burgess 2015等。
土井挞克树
可以做一个离群图,然后排除离群值。