「基础」奇异值分解的原理与应用( 三 ) 选自machinelearningmastery

运行这个示例，首先显示定义的矩阵，然后显示计算出的伪逆。
文章插图
我们可以通过 SVD 采用人工的方式计算伪逆，并将结果与 pinv 函数的结果进行比较。
首先我们必须计算 SVD 。然后我们必须计算 s 数组中每个值的倒数。然后将这个 s 数组转换成一个对角矩阵，它额外增加了一行 0 以使其变成矩形形式。最后，我们可以根据这些元素计算伪逆。
具体实现方式为：
文章插图
下面列出了完整的示例。
文章插图
运行这个示例，首先显示定义的矩形矩阵，然后显示其伪逆，结果与上面 pinv 函数的结果一致。
文章插图
用于降维的 SVD
SVD 的一大常见应用是降维。
【「基础」奇异值分解的原理与应用】具有大量特征的数据（比如特征数（列数）多于观察数（行数））也许可以被归约成与所涉预测问题最相关的更小特征子集。
其结果是一个秩更低的矩阵，据说接近原始矩阵。
为了做到这一点，我们可以在原来的数据上执行一次 SVD 操作并选择 Sigma 中前 k 个最大的奇异值。这些列可以从 Sigma 中选择得到，行可以从 V^T 中选择得到。
然后可以重建原始向量 A 的近似 B 。
文章插图
在自然语言处理中，这种方法可以被用在文档中词出现情况或词频的矩阵上，并被称为隐含语义分析（Latent Semantic Analysis）或隐含语义索引（Latent Semantic Indexing）。
在实践中，我们可以保留和使用被称为 T 的描述性数据子集。这是矩阵的密集总结或投射。
文章插图
此外，这种变换既可以在原来的矩阵 A 上计算和应用，也可以在其它类似的矩阵上计算和应用。
文章插图
下面的示例是使用 SVD 的数据归约。
首先定义一个 3×10 的矩阵，其列数多于行数。然后计算 SVD 并且只选取其前两个特征。这些元素再重新结合起来，得到原始矩阵的准确再现。最后计算转换的方式有两种。
文章插图
运行这个示例，首先显示定义的矩阵，然后是重建的近似矩阵，然后是原始矩阵的两个同样的变换结果。
文章插图
scikit-learn 提供了直接实现这种功能的 TruncatedSVD 类。
TruncatedSVD 的创建必须指定所需的特征数或所要选择的成分数，比如 2 。一旦创建完成，你就可以通过调用 fit 函数来拟合该变换（比如：计算 V^Tk），然后再通过调用 transform 函数将其应用于原始矩阵。结果得到上面被称为 T 的 A 的变换。
下面的示例演示了 TruncatedSVD 类。
文章插图
运行这个示例，首先显示定义的矩阵，然后是该矩阵变换后的版本。

「基础」奇异值分解的原理与应用( 三 )

推荐阅读

文娱马后炮炉石快攻卡组真的无脑？慢速卡组真的很难吗？

博古架的选购博古架的清洁与保养

江西|姚威与田静去不成江西，田弟：我姐现在不去九江，不代表以后不去

东北网小记者松花江上赏冰玩雪感受冰雪文化魅力

您信了吗？淝水之战前夕，谢安昏庸颟顸，毫无作为，只知饮酒作乐

大理|我国最没存在感的王朝，史书都懒得记载，皇帝的名字却世人皆知

民航局：波音737飞机恢复运行前，安全问题必须解决

【鹿鸣财经】罗敏消失的270天

小哥哥说事|吃1次，抵得上吃2斤枸杞，1斤5元超好吃，“它”对眼睛特别好

光明网|演员谢园去世享年61岁

怎样评价《米其林指南2020北京》?

尸骨|山西高平发现疑似长平之战尸骨坑当地文物部门：已上报省里

广州日报|“云”健身盼AI技术“加持”

科比|美媒公布夺冠赔率，湖人赔率足以证明其夺冠大热

『本田』两厢版思域国产申报！搭1.5T涡轮动力，将于7月份上市

星座运势解读者|怎么将网易内容同时发到东方号

疯狂搞笑每一天妹子我这孩有一箱，跟我走吧，搞笑GIF趣图：一个棒棒糖就搭讪成功了

飞机外部清洗流程飞机清洗方法

梨状肌萎缩是怎么回事

英政府削减公共卫生营销支出遭批破坏禁烟运动