推荐技术面对千万级推荐，如何压缩模型最高效？这是腾讯看点新框架( 二 ) |腾讯|技术|人工

本文插图

分解为两个低阶矩阵
【推荐技术面对千万级推荐，如何压缩模型最高效？这是腾讯看点新框架】

本文插图

，其中

本文插图

d_j是第j个块的因式分解维度（也称为秩）。由于高频率的推荐项应具有更高的表达能力，因此随着簇的索引增加，减小对应的d_j 。相应地，每个推荐项的嵌入表示与通过原始的 look-up 操作的嵌入表示是不同的。给定推荐项标签 ID x ，用下列的等式来表示其嵌入向量为：

本文插图

其中

本文插图

表示第j个块的第g行的嵌入向量，

本文插图

。通过这种因式分解，能将输入嵌入层的参数量从

本文插图

减少到

本文插图

。当

本文插图

，输入嵌入层的参数量会明显减少。上图 (c) 阐述了这个分解过程。
基于分块自适应分解的输出 softmax 层
在输出 softmax 层，文中指出直接的在输出 softmax 层运用与输入层相同的策略会造成模型性能降低的问题。为了解决这些问题，通过二层树结构来构造这些块，其中每个树节点代表一个簇。上图 (d) 显示了输出 softmax 层的分块嵌入的范例。文中在输出 softmax 层中使用与输入嵌入层类似的分块嵌入的聚簇配置。一个主要的不同是输出层的第一个块矩阵被扩展为

本文插图

, 其中n-1表示叶子节点所属的父类的数量。第一个簇的标签集合被扩展为

本文插图

, 其中k_1+1到

本文插图

对应于第 2 个到第 n 个簇的父类标签。在输出 softmax 层的其它的块矩阵为

本文插图

, 其中

本文插图

。对比于原始的 softmax 层，该方法能将输出 softmax 层的参数量从

本文插图

减少到

本文插图

。
论文中提到，在训练过程中，对于给定上下文向量

推荐技术面对千万级推荐，如何压缩模型最高效？这是腾讯看点新框架( 二 )

推荐阅读

|世体：拉尔森可能将作为科曼教练组成员回归巴萨

海蜇皮怎么处理海蜇皮怎么处理咸味

扬子晚报|搬家公司员工坐地起价不成竟耍赖不走还威胁当事人

家里可以做的小实验家里可以做的小实验滴水成冰

『海宝君传奇』行程太过巧合，网友纷纷留言祝福，杨幂魏大勋酒店密会上热搜

饺子皮用冷水还是热水和面饺子皮怎么和面

古人讲“五花八门”，是哪五花和哪八门？被孩子问到可别答不上来

北青网综合|新疆克孜勒苏州乌恰县发生3.0级地震震源深度10千米

今日亚洲|王晓鹏：美国再度高调介入南海问题的九重企图

汽车之家|低油耗，瑞虎8的这两点让我满意，高颜值

94三国演义日本反响(新三国在日本有多火)

草字头加吕字念什么草字头加吕

保温杯制冷多长时间保温杯制冷初次使用方法

战略先锋▲这次全部搭载实弹，终于动真格了！我军一支舰艇编队紧急赶赴南海

这些地方最好玩：一年进账超5亿，历时15年跻身全球第二，被低估的中国芯片巨头

上市公司|29家创业板公司进入减持区间，20%涨跌停下股东是否趁机套现？

车晓前夫|车晓前夫李兆会22亿资产四度流拍曾是山西首富

草莓可以放冰箱冷藏吗草莓可以放冰箱冷藏吗

『综艺节目』美国劲爆综艺，禁欲一个月可拿10万美金，网友：单身20年想参赛

【解放网】学习中国经验！总台记者独家探访伊朗版“方舱医院”