juyue2010
此用户已注销
蛋白归一化的方法主要包括两种:内标法和总蛋白法
loveliufudan
在蛋白质组学数据分析中,常用的归一化方法主要有:
1. 总量归一化(Total abundance normalization):通过对所有蛋白丰度值求和,然后归一化到同一水平。
2. 中位数归一化(Median normalization):用所有蛋白丰度值的中位数进行归一化。
3. 四分位归一化(Quantile normalization):将不同样本的丰度值分布调整到相同的分布。
4. Z-score归一化:对每个蛋白的丰度值进行Z-score转换,得到标准化表达式数据。
5. 小数定标归一化(Decimal scaling normalization):通过一个小数因子(如10^6)归一化所有蛋白丰度值。
6. 方差稳定归一化(VSN):通过假设数据对数变换后符合正态分布,估计变换后方差,进行归一化。
7. 基准化(Housekeeping normalization):用参考基准蛋白进行归一化。
8. 全局中位值归一化(Global median normalization) :对所有蛋白用中位蛋白强度归一化。
选择合适的归一化方法,能校正技术误差,提高定量可靠性,是蛋白质组学数据分析的关键步骤。需考虑数据特点,选用适当的归一化策略。
土井挞克树
有四种方法:
中值归一化:即每列数据除以该列数据的中位数。中位数不受该列的大值或小值影响。
共有蛋白中值归一化:即每列数据除以共有蛋白的中位数。
线性函数归一化:是对原始数据的线性变换,使结果值映射到[0-1]之间,保留源数据存在的关系,消除取值范围简单的方法,不过,受个别离群值影响,如果数据集中某个数值很大,其他各值归一化后会接近0。
Z Score 归一化:经过处理的数据符合标准正态分布,即均值为0,标准差为1。