「万微科技2016」从落地产品看NLP商业化突破,6.2万字报告剖析「智能写作」全貌( 三 )


2)商户文案生成:文案生成和标题生成能够通用整体的生成模型框架 , 最大区别是由文案的载体''商户''所决定 。 为了保证产出的文本的准确性和质量 , 在输出端需要进行解码控制 。 一是通过构建机制来让模型自己学习到目标 , 二是在Decoder的BeamSearch阶段动态地加入所需的控制目标 。 主要有卖点控制、风格控制、多样性控制控制等控制方法 。
卖点控制:在HardConstrained方面 , 整理了重要的卖点和实体如地域、品类等 , 在目标理解过程中直接加入Context 。 对于SoftConstrained , 通过卖点的共现计算一个简单的条件概率 , 并将卖点依此条件概率随机添加进Context中 , 从而让模型通过注意力学习到受限关系 。 最后在Decoderfuction部分 , 新增了一个Hard&SoftConstrained的匹配打分项 , 参与最终的概率计算 。
风格控制:实现方法和卖点控制非常相似 , 只是风格其实是通过不同内容之间的差异来间接进行实现的 。 比如大众点评头条、PGC类的内容与UGC类的的写作风格 , 就存在极大的差异 。 内容属性的差异可作为一个Context的控制信号 , 让模型捕获 。
多样性控制:自然语言生成模型选取输出文本时通常优先考虑概率最大的序列 , 并不考虑多样性 , 而多样性又是自动生成营销性文本最需要解决的问题 。 对此 , 大众点评直接对全局结果进行优化 , 在预测时把一个聚合页Context放到同一个batch中 , batch_size即为文案条数 , 对已经生成序列上进行实体重复检测和n-gram重复检测 , 将检测判重的加一个惩罚性打分 , 这个简单的思想已经能非常好的解决多样性问题 。
其他同类产品概述(营销行业):
营销行业的人工智能写作产品主要应用在SEO广告、信息流广告、邮件广告及电商产品介绍中 , 相比资讯类产品而言 , 营销类产品更需要解决的是内容个性化的问题 , 实现根据地点、用户特点、品牌形象的个性化 , 以及对文章进行多种风格的改写就成了主要的方向 。 对这一领域的探索集中爆发在2018年 , 但是国内对营销类写作产品展开研发的主要是与电商相关的上市互联网公司如阿里、京东、大众点评 , 百度 。 百度最先开始结合人工智能技术与大数据 , 开发生成方案的工具 , 但是在两年的尝试后转向了辅助资讯写作 。 而国外对营销广告工具开展研发的则主要是第三方广告及技术服务商 , 这类公司大多都获得了投资并有了比较完善的盈利模式 。
SEO广告领域 , Articoolo的产品使用户能针对一个主题生成多篇不同风格的文章 , 主要模式是进行原创撰写或改写 , 除了能为有SEO广告和内容营销需求的客户定制服务之外 , 还针对个人用户提供按篇销售的收费模式 。 DentsuAegisNetwork的项目Leo专门根据谷歌广告系统针对性地生成SEO文案 , 在具体案例中 , 可以实现单次点击成本降低30%-42%的情况下 , 广告点击率提高3到10个百分点 。 2018年创立的微思写作除了基础的纠错、预测写作功能 , 也针对网站SEO优化、软文推广、自媒体创作等领域研发了智能仿写工具 , 对文章进行重写 。 蓝色光标子公司捷报数据研发的妙笔机器人 , 可以在1秒内改编出数千篇新闻稿 , 保证中心内容不变并且根据不同传播渠道特性变换风格 , 自动插入相关图片、商品链接、名词解释和延伸阅读 。 通过搜索引擎的审核标准和评判原则对内容和结构进行改进、改编出内容标题与原文相似度极低的seo稿件 , 提高稿件在搜索结果中的排名 , 从而提高发布稿件的访问量 。 并且能监督品牌传播效果 , 针对内容阅读互动、网站流量、粉丝量的增长 , 以及用户关注或流失的原因、促成留存转化的关键点等等进行分析 , 不断调整策略 。 除此之外 , 该机器人还能「蹭热点」 , 由舆情机器人判断新闻的调性是正面还是负面 , 从而选择采纳与否 , 再对分析主体、匹配图片、名词解释、定义标签等常用传播点进行分析 , 在这之后 , 妙笔推荐出关键信息点匹配的热点新闻 , 并对原文内容的每个段落匹配进行分析 , 在合适位置插入热点新闻信息 , 从而成功「蹭」到热度 。


推荐阅读