AI生成的假新闻难以识别,那就用神经网络来对抗吧(11)
2.特征能否被捕捉取决于对判别器的选择
对每一个时间步 , 从整体上来说 , 仅有生成器使用了top-p超参数 。 因此 , 如果一个判别器使用别的方式对文本进行建模 , 这个生成器需要更多的时间去定位被截断的1-p分布长尾 。 这可能能够解释为什么Bert在作为判别器时表现较Grover更差 。
3.方差缩减时需要谨慎避开的「甜蜜陷阱」(sweetspot)
不缩减模型方差和强力缩减模型方差都会带来问题 。 在缩减的参数中可能存在一个「甜蜜陷阱」(sweetspot)区域 , 去决定多大程度上需要截断分布 , 使判别变得困难 。 在图7中 , 研究人员展示了在不同采样阈值下的Grover-Mega判别器的表现 。 结果确实显示出了一个「甜蜜陷阱」 。 对于判别器 , 当p介于0.92和0.98之间时 , 判别工作是最困难的 。
有趣的是 , 研究人员注意到攻击方top-p阈值在Bert-Large模型远低于这一阈值在Grover-Large中的值 , 即使两个模型有着同样的结构 。 这一结果支持了研究人员的猜测 , 即Bert对语言的建模方式和Grover非常不同 。 使用低top-p阈值似乎不能帮助模型获得丢失的长尾信息 。
----AI生成的假新闻难以识别 , 那就用神经网络来对抗吧//----江苏龙网 http://www.jiangsulong.com //
图6:Grover-Mega的困惑度 , 取自每个位置的平均值(以元数据为条件) 。 研究人员选取了p=1(随机采样)和p=0.96时Grover-Mega生成的文本以及人工书写的文本 。 随机采样的文本有着比人工书写的文本更高的困惑度 , 而且这个差距随着序列长度的增加而加大 。 这表明 , 不减少方差的抽样通常会导致生成结果落在真实分布以外 。
推荐阅读
- 王若麟|从帅气新闻主播变肿胀油腻男,这个男演员把一手王炸牌打得稀烂
- 明星|瘦等于美?这些骨瘦如柴的女明星,有的瘦到没眼看,有的难以生育
- 杨幂|杨幂穿性感内衣的新闻又上了热搜,网友却怒批她只会宣传身材美貌
- 林正英|林正英死后,用这样的方式下葬,知道内幕后,网友大呼:难以置信
- Angelababy|《中国新闻社》点名肖战,肖战直言有一点不自信,会积极承担责任
- 影帝|37岁影帝突然去世!半个娱乐圈哭了:难以置信
- 新闻记者|日剧《新闻记者》剧评:超写实讽刺真实事件,米仓凉子最催泪的震撼演出
- 豆瓣|总局收视排行:雪中悍刀行第25,王牌部队没上榜,榜首难以超越
- 央视|央视春节晚会即将开始,《新闻联播》主持人泄露了节目的制作过程
- 肖战|王力宏事件再次发酵,前妻称他有前科,设局想要陷害她,难以想象
