[算法]收藏!机器学习算法优缺点综述( 三 )
缺点:
- 非常难以训练
- 很难解释
本文插图
和集簇方法类似 , 降维追求并利用数据的内在结构 , 目的在于使用较少的信息总结或描述数据 。
这一算法可用于可视化高维数据或简化接下来可用于监督学习中的数据 。 许多这样的方法可针对分类和回归的使用进行调整 。
例子:
- 主成分分析(Principal Component Analysis (PCA))
- 主成分回归(Principal Component Regression (PCR))
- 偏最小二乘回归(Partial Least Squares Regression (PLSR))
- Sammon 映射(Sammon Mapping)
- 多维尺度变换(Multidimensional Scaling (MDS))
- 投影寻踪(Projection Pursuit)
- 线性判别分析(Linear Discriminant Analysis (LDA))
- 混合判别分析(Mixture Discriminant Analysis (MDA))
- 二次判别分析(Quadratic Discriminant Analysis (QDA))
- 灵活判别分析(Flexible Discriminant Analysis (FDA))
- 可处理大规模数据集
- 无需在数据上进行假设
- 难以搞定非线性数据
- 难以理解结果的意义
本文插图
聚类算法是指对一组目标进行分类 , 属于同一组(亦即一个类 , cluster)的目标被划分在一组中 , 与其他组目标相比 , 同一组目标更加彼此相似(在某种意义上) 。
例子:
- K-均值(k-Means)
- k-Medians 算法
- Expectation Maximi 封层 ation (EM)
- 最大期望算法(EM)
- 分层集群(Hierarchical Clstering)
- 让数据变得有意义
- 结果难以解读 , 针对不寻常的数据组 , 结果可能无用 。
本文插图
基于实例的算法(有时也称为基于记忆的学习)是这样学 习算法 , 不是明确归纳 , 而是将新的问题例子与训练过程中见过的例子进行对比 , 这些见过的例子就在存储器中 。
之所以叫基于实例的算法是因为它直接从训练实例中建构出假设 。 这意味这 , 假设的复杂度能随着数据的增长而变化:最糟的情况是 , 假设是一个训练项目列表 , 分类一个单独新实例计算复杂度为 O(n)
例子:
- K 最近邻(k-Nearest Neighbor (kNN))
- 学习向量量化(Learning Vector Quantization (LVQ))
- 自组织映射(Self-Organizing Map (SOM))
- 局部加权学习(Locally Weighted Learning (LWL))
- 算法简单、结果易于解读
- 内存使用非常高
- 计算成本高
- 不可能用于高维特征空间
本文插图
贝叶斯方法是指明确应用了贝叶斯定理来解决如分类和回归等问题的方法 。
例子:
- 朴素贝叶斯(Naive Bayes)
- 高斯朴素贝叶斯(Gaussian Naive Bayes)
- 多项式朴素贝叶斯(Multinomial Naive Bayes)
推荐阅读
- 机器人|深圳机器人产业产值1257亿元
- |《5G技术助力国产机器人完成全球首场骨科实时远程手术》公示材料
- 美军事进行时|五角大楼研制挖隧道的蚯蚓机器人为地面部队提供安全补给
- cnBetaTB|看机器人如何制作出既有颜值又美味的蛋饼
- 山东伟豪思|袋料全自动拆垛机器人的使用给企业带来了哪些益处
- 无人机这两项机器人发明,就是东京大学进军外卖界的野心!?
- SpaceXSpaceX载人火箭发射成功,马斯克离火星又近一步(收藏版)
- 搜狐新闻|【复材资讯】碳纤维机器人手臂设计需要考虑的要素
- SILVER六足龙虾机器人成海底“清洁工”,可下潜200米续航16小时
- 新智元|机器学习团队常用工具总结,人生苦短,我用Python!
