对话清华沈阳:新冠大幅压缩矛盾爆发时间,评估未来考虑疫情变数( 三 )


第三个是“新冠复演论” 。 新冠疫情以来各种矛盾冲突不断加剧 , 把原来需要很长时间积累才会爆发的矛盾压缩到短时间内出现 。 例如 , 美国的种族主义矛盾大面积激发 。 历史上 , 1929年的大萧条、1960年代的黑人平权运动、2008年的次贷危机等 , 都能看到在很短的时间内出现了一系列危机 。
这说明 , 传统上的事件线性发展规律 , 在新冠疫情的背景下不完全适用了 。 我们要把疫情带来的变量加入到预测模型当中 , 这样才能对未来有比较有效的判断 。

4
挖掘风险弱信号的边界:尚处研究初期 , 过早设定边界可能画地为牢
南都:从初步具备一定预测能力 , 到真正落地应用还有哪些路要走?
沈阳:我第一个想做的是 , 进一步丰富理论框架、丰满研究范式 , 这可能要经历很多年 。 第二个要做的是将理论研究和民生服务工作结合起来 , 为政府机构、企业、社会团体提供内部咨询服务 , 如果适合公开发布 , 也会考虑公开传播 。
第三个就是完善我们的风险弱信号大数据平台的整体性 。 我们团队有各种子平台 , 包括舆论大数据、情绪大数据、8个语种的大数据等平台 , 但没有一个单独的风险弱信号发现和预测平台 。 未来要在这方面发力 , 进一步提高效率 , 优化发现和预测模式 。
南都:你觉得对风险弱信号的挖掘 , 其应用边界在哪?
沈阳:作为一门学科 , 我个人不太喜欢画地为牢 。 研究早期应当是开放性的 , 在多个领域尝试应用风险弱信号探索边界在哪 。 如果过早划定边界 , 也会限制你的很多灵感 。 显然 , 一个高度数据化 , 真实数据较多的领域可能更为有效 。 如果一个领域假数据太多 , 数据污染严重 , 且难以通过数学模型剔除 , 我们可能就会放弃 。
南都:现在基于公开数据的项目很多 , 很多企业、个人、政府机构都在做这方面的应用和研究 , 怎么保证公开数据不被滥用?
沈阳:大数据使用确实需要平衡 , 既要促进产业发展、促进技术进步 , 也要保护好产权和隐私权 。 有的国家对数据过分保护 , 对隐私权过分强调 , 带来的问题就是产业发展停滞 。 不过 , 我们使用数据时 , 也要严格限制使用隐私数据 , 这样才不会发生次生灾害 。
南都:在这方面 , 你的原则是什么呢?
沈阳:我们要在合理、合法、合规的情况下开展工作 , 要遵循基本的学术伦理 。 比如 , 我们做数据分析的时候 , 不能针对具体的个人分析他的喜好、兴趣、隐私并予以公布 , 这样是会出问题的 。 我们需要做数据脱敏、透明化 。 发布信息时也只针对一个群体 , 比如研究高校教师在网上的特征 , 针对某个个体肯定不行 。 这是一个最基本的逻辑 。
南都:从事风险弱信号研究 , 对团队成员有什么要求吗?
沈阳:我们是一个交叉学科团队 , 欢迎不同专业方向的成员 。 我们的博士后中 , 有社会心理学的 , 有研究地理信息系统的 , 也有中文、传播学方向的 。 我自己还很喜欢法学或历史学的学生 , 如果有这些人加入 , 对我们的研究也会有帮助 。
我们对历史的理解和别的团队还不太一样 , 我们把历史也看做是人工智能的大语料库 。 人类历史发展到现在 , 通过学习史书中记载的所有内容 , 可以学习到人类社会运行的基本规则 , 了解人性最好的时候和最差的时候 。 人工智能把这些都学习到后 , 就可以针对性的做预测 。
南都:有观点认为 , 跨学科做预测的话 , 其可靠性是存在疑问的 , 你怎么看?
沈阳:我觉得可靠性确实有疑问 , 但学术研究就是要在多元思路中碰撞 。 最上层的研究成果肯定是真理:有发现、有结论、有事实、有观点、有数据、有工具 , 所有东西都是对的 。
但我们不可能每次都做到最好 , 那次好的研究就可能存在一些谬误 , 但基本结论是对的 。 甚至我们的研究方法、思路还有创新 , 也可以给别人借鉴和启发 。
第三种情况就更差一些 , 我的方法有问题 , 结论也有问题 , 但研究中也可能有可取之点 。 只要严格按照学术规范 , 没有故意造假 , 我觉得至少是可以供他人借鉴的 。
学术研究要较真也要包容 。 你能指出他的错误时 , 一般来说他往往也有改正的机会 。 比如我们从传播学的角度研究疫情 , 我们可以组成一个跨学科团队 , 让传染病学的人员参与进来 。 舆论如何影响人的行为?社交媒体的信息如何影响我们戴口罩?戴口罩又会如何影响病毒传播?其实这些是高度关联的 。

南都采访人员 宋承翰 发自北京
编辑:程姝雯


推荐阅读