AI生成的假新闻难以识别,那就用神经网络来对抗吧( 七 )

Grover生成的宣传文本轻易地骗过了人类

图4中的结果显示了一个惊人的趋势:尽管Grover生成的新闻质量没有达到人类的高度 , 但它擅长改写宣传文本 。 Grover改写后 , 宣传文本的总体可信度从2.19增至2.42 。

AI生成的假新闻难以识别,那就用神经网络来对抗吧

----AI生成的假新闻难以识别 , 那就用神经网络来对抗吧//----江苏龙网 http://www.jiangsulong.com //

本文原始标题为:AI生成的假新闻难以识别 , 那就用神经网络来对抗吧---来源是:

本文原始标题为:AI生成的假新闻难以识别 , 那就用神经网络来对抗吧---来源是:

图4:人工评估结果 。 对于Grover生成的文本 , 三个人类评分者从风格、内容和整体可信度方面进行评估;每种类别的文章取样100篇 。 结果显示 , Grover生成的宣传文本比人类书写的原始宣传文本的可信度更高 。

假新闻检测

假新闻检测中的半监督假设

虽然网上有大量人类书写的文本 , 但大部分都时间久远 。 因此对于文本的检测应当设定在近一段时间 。 同样 , 由攻击方生成的AI假新闻数量可能十分少 。 因此 , 研究人员将假新闻检测问题当做半监督问题 。 假新闻判别器可以使用从2016年12月到2019年3月的大量人工写成的新闻 , 即整个RealNews训练集 。

但是 , 判别器被限制获取近期新闻和AI生成的假新闻 。 研究者使用2019年4月的10000条新闻生成文章主体文本 , 使用另外10000条新闻作为人类写成的新闻文章 。 研究人员将这些文章进行分割 , 其中10000条用于训练(每个标签5000) , 2000用作验证集 , 8000用作测试集 。


推荐阅读