科技小数据|机器学习中如何使用校正的异方差算法？

在回归分析过程中，同方差(Homoscedasticity)和异方差(Heteroscedasticity)是非常普遍的问题，这正是需要研究统计学的最大证据。
概念解释
同方差
当随机变量都有相同的方差时就是同方差，此时随机变量就是具有相同结构的情况。

本文插图

本文插图

同方差图
同方差
异方差是非同方差，即随机变量具有不同的结构/分布。
【科技小数据|机器学习中如何使用校正的异方差算法？】

本文插图

本文插图

异方差图
检测异方差
当我们处理回归任务时，异方差会给我们带来一个问题。因为线性回归中使用的最小二乘法有一个前提假设，就是变量是同方差的，否则，异方差会导致p值小于应有p的值，这将导致对数据进行处理时产生误解，并且导致错误的统计结论。
在实际数据处理中，首先，我们可能需要检查数据集中是否存在异方差。
有两种不同的统计检验方法。第一个是ush Breush-Pegan测验，另一个是white test 。借助这两个测试，我们可以确定数据中的异方差。
如何将异方差转换为同方差？
我想告诉你如何摆脱异方差问题。有两种方法可用。
其中之一是根据数据集的分布定义我们的因变量和自变量。在这里，注意变量之间的关系有多normal是很有用的。因为非常普通的关系不会给我们带来足够启发性的结果。
另一种方法是加权回归。通过对观察到异方差性的数据中的每个数据赋予权重，可以将该方法称为同方性。这里的目标是通过为高方差值分配较小的权重以减少平方来实现同质性结构。本节中最有问题的情况是确定当前权重。最准确的权重对应于误差的方差，这很难计算。
经过这些解决方法之后，我们将摆脱异方差问题。简而言之，在ML中使用异方差是这样的。

科技小数据|机器学习中如何使用校正的异方差算法？

推荐阅读

【】需求释放旅游业复苏提速

澎湃新闻|腾讯回应员工每天在岗不足8小时被辞退前因后果谁有理？

南极|科学家在南极发现100多年前的胶卷，底片冲洗后，曾震惊全世界

孩子|杜月笙说到胆大的人不容易成事，胆小的孩子能成大事，正确吗

学学|烂掉的桃子“半点”都别扔，用途太厉害了，好多人都不懂，快学学

『青岛』青岛新增1例境外输入确诊病例详情：22岁李某某确诊，199人隔离观察

法院判了！银行柜员错将4千取成4万，客户拒归还，离柜概不负责

薏米+皮肤干燥

古代女子用什么画眉

100公里海岸，6大主题生活，今夏一起GO烟台

『资讯早知道』女儿称与新冠无关，配音影片票房超10亿美元，布莱恩·丹内利去世

#互联先知道#互联网+课程摆脱空间限制

小奶猫樱桃苹果也要对云计算下手了？，从亚马逊谷歌疯狂挖角

cnBeta：谷歌前CEO施密特在成为美国国防部科技顾问后都做了些什么？

湘潭@长沙地铁3号线将通到湘潭，厉害了长株潭

法兰西铁骑后疫情世界：我们是不是永远不能握手了？

苗草娱乐无名指上鸽子蛋瞩目，老夫老妻了还暗戳戳发糖，昆凌微博晒自拍

极限挑战|原创《极限挑战》收官之战缺点一箩筐！THE9队内的关系也太复杂了

小象加油在互联网能源行业的潜质不可小觑

|“我不要谁也别想要”瓜农怒摔西瓜，城管回应：给了他们半天时间