指南|生成模型和判定模型的内部指南( 二 )
生成式机器学习则是通过训练学习使联合概率P(X , Y)最大化的模型参数 。 通常可以由P(Y)和P(X | Y)得到联合概率 , 当前前提是P(Y)和P(X | Y)条件独立 。
本文插图
图源:Markus Spiske , Unsplash
判别式模型
- 逻辑回归
- 随机森林
- 支持向量机
- 经典神经网络
- 最近邻
- 隐马尔科夫模型
- 朴素贝叶斯
- 贝叶斯网络
- 混合高斯模型
本文插图
图源:Jon Tyson , Unsplash
为更好的理解 , 试着以下几个问题:(1 判别式;2 生成式)
- 哪种模型需要较少的训练数据?1
- 哪种模型能够生成数据?2
- 什么时候使用某类模型?
- 哪种模型对异常值更敏感?2
- 哪种模型容易过拟合?1
- 哪种模型训练时间短?1
- 哪种模型直接学习条件概率?1
在不确定情况下 , 哪种模型更好?2
本文插图
图源:Photos Hobby , Unsplash
GAN生成对抗网络(GAN)同时训练生成器和判别器 , 具体而言 , 生成器生成一批样本 , 这些样本与真实数据集一起提供给判别器进行分类 。
本文插图
判别式分类器的缺陷
- 它缺乏先验性 , 结构性和不确定性
- 黑盒子 , 变量之间的关系无法观测
本文插图
【指南|生成模型和判定模型的内部指南】
<ahelp_7" name="help_7">
图源:Austin Distel , Unsplash
结论
机器学习模型一般分为生成式和判别式两类 , 其中 , 生成式模型主要涉及建模操作 , 判别式模型一般用于分类问题 。 一般而言 , 生成式模型更具有解释力 。
模型并不是越大越好、参数越多越好 。 更新更多参数意味着更长的训练时间、内存和计算量 。 一般而言 , 判别式模型有更好的正则性 。
生成式模型所需的数据一般要比判别式模型更少 。
参考文献
· Yogatama, D., Dyer, C., Ling, W., and Blunsom, P., 2017. Generative and discriminative text classification with recurrent neural networks. arXiv preprint arXiv:1703.01898.
· Lasserre, J.A., Bishop, C.M. and Minka, T.P., 2006, June. Principled hybrids of generative and discriminative models. In 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06) (Vol. 1, pp. 87–94). IEEE.
· Wang, K., Zong, C., and Su, K.Y., 2012. Integrating generative and discriminative character-based models for Chinese word segmentation. ACM Transactions on Asian Language Information Processing (TALIP), 11(2), pp.1–41.
推荐阅读
- 微生物|生物工程师的致富之路:微生物细胞工厂打造指南
- 行业互联网|英国运输技术论坛发布网络安全标准和指南摘要
- 富前程社群裂变|富船长:Persona用户角色模型——一个找痛点神器
- 交易|腾讯回应《反垄断指南》影响:平台开放 欢迎各类竞争
- |近期必读 ICLR 2021 模型压缩&预训练相关论文
- 交易|腾讯回应《反垄断指南》影响:平台开放,欢迎各类竞争
- |新模型揭示:餐馆是感染新冠“热点”场所
- 询盘云|外贸人必看:2020谷歌广告投放进阶指南
- 平台|平台经济领域反垄断重磅指南来袭 “大数据杀熟”面临严监管
- |“增长”成娱乐营销必考题,酷营销-CBD模型为最佳选项?
