「人人都是产品经理」如何用数学函数去理解机器学习？( 二 )

2. 算法选取
在机器学习的过程中，找到接近理想模型（函数）的方法即算法。机器学习的常用算法很多，不同的算法，解决的问题不同，适用的场景也不同。
如下图，比如解决聚类问题，一般使用无监督学习算法，分类问题，一般使用有监督学习算法：支持向量机SVM、神经网络等，目前神经网络依然是研究热点之一。

本文插图
（1）神经网络原理
神经网络是一种模仿人类思考方式的模型，就像飞机模仿鸟的形态一样，神经网络也借鉴了生物学的神经元结构。神经元细胞主要由树突、轴突和细胞体构成，树突用于接收信号并传递给细胞体，细胞体处理信号，轴突输出信号。神经网络结构与此类似，一个典型的单隐含层神经网络架构如下图：

本文插图
图片来源：网络输入层：接收输入数据，如图片、语音特征等；隐藏层：承载数据特征运算；输出层：输出计算的结果；
其本质是，通过调整内部大量处理单元的连接关系、激励函数和权重值，实现对理想函数的逼近。
（2）深度学习
深度学习是神经网络的一种算法，目前在计算机视觉等领域应用十分广泛，相比单隐藏层神经网络结构，深度学习神经网络是一种多隐藏层、多层感知器的学习结构。如下图所示，增加更多的隐藏层后，网络能更深入得表示特征，以及具有更强的函数模拟能力，能获得更好的分类能力。

本文插图
图片来源：网络
深度学习三类经典的神经网络分别是：深度神经网络DNN、卷积神经网络CNN、和循环神经网络RNN 。其中DNN、CNN一般解决计算机视觉、图像识别等分类问题， RNN适用于自然语言处理等问题。
基于大量的样本、选取合适的算法进行模型训练后，下一步则是对模型的预测效果进行评估。
3. 模型评估
模型评估一般可分为两个阶段：实验阶段和上线阶段，在实验阶段能达到一定的使用标准指标，才能进入实际上线使用阶段。
（1）实验阶段
为了评估模型的可用性，需要对模型的预测能力进行评价，其中很重要的一个评价指标就是准确率，即模型预测和标签一致的样本占所有样本的比例。即选择不同于训练数据的，有标签数据的测试集，输入模型进行运算，计算预测的准确率，评估模型对于测试集的预测效果是否能模型可用指标。
（2）上线阶段
在模型投入使用后，基于上线后的真实数据反馈，评估模型的能力，并基于新的反馈数据，持续迭代优化模型，提高或保持模型的泛化能力。
三、总结与思考
作为产品赋能的一个“工具” ，产品化的整个流程可总结为：业务需求->转化为业务函数>样本数据获取->选择合适的算法->模型训练->内部评估->上线验证迭代。
其实这个过程，最底层的逻辑还是基于数学建模原理的思路来解决问题，也可用来指导一些日常产品工作中的问题。比如，《增长黑客》中的增长杠杆、北极星指标等方法，其本质也是数据建模的原理。定义业务函数、确定影响因素、权重成本分析、判断最优解决方案，评估上线反馈形成闭环。
所有，很多问题表面看起来各式各样、各不相同，但抽象出来可能就是一些学科问题，比如数学、物理、经济学等，联想到我前段时间分享的一篇文章《透过《奇葩说》论点，看背后的多元思维模型》中提到的多元思维模型核心观点——越往深层次思考，越能挖掘事物本质，越接近学科原理。

「人人都是产品经理」如何用数学函数去理解机器学习？( 二 )

推荐阅读

中国警察网|警方公开拍卖！苹果手机最低275元起拍

Redmi|1699元良心小金刚！Redmi Note 11T Pro发布：天玑8100+5080mAh电池

如何使用截图功能，ps要咋滴才可以截图

怎么连接热点到另一台手机怎么连接热点

朋友值得的句子?形容友情不值得的句子

吉娜·爱丽丝|吉娜怀孕后首现身蛮腰细腿，郎朗全程十指紧扣，小心翼翼呵护

消化疾病|口臭、胃酸的人会有这些症状，自我对照自己有几条

英仙座流星雨刷屏流星雨的形成还有这些“小秘密”

炎帝|“三皇五帝”现在人们都只记得黄帝，炎帝，其他人是谁呢？

日本|看到有钱赚就来示好？中国狂赚4665亿后日本眼红，示好政策正酝酿

生活和生存有啥区别

苍鹰：武汉中心城区首次观测到苍鹰和游隼

在解析微藻脂质合成关键酶功能分化研究中取得最新进展

你对办公室装修的设计要点了解多少

三吏三别原文及翻译赏析杜甫的三吏三别

会搭配的萌面人|赚足路人回头率，夏天不知道穿什么？这四套ins穿搭

是菠萝油啊|关晓彤登陆男人装封面，风格火辣变身女汉子，高调转型回应质疑！

鸡汤不宜

黄渤|柳岩：你有钱咋还喜欢买二手车？黄渤：汽车嘛，老婆孩子一手就行

在北上广等地办个户口真有这个教授说的那么难吗