如何通过1亿条微博、文章、短视频,提前预测到汛情?( 二 )
沈阳向南都采访人员解释其原理 , 灰犀牛是大概率事件 , 黑天鹅是小概率事件 。 若要预测小概率事件的发生 , 就要先找到“黑天鹅蛋” , 再判断是否符合孵化蛋条件 , 包括环境判断、条件判断、变量判断等 。
“从本质上讲 , 我们要发现案例 , 提炼规则 , 抓住一个我们想预测的事儿 , 把这个规则加进原来的分析框架和逻辑里 , 再来分析 。 ”
他举例 , 此前英国、巴西等国家的领导人感染了新冠病毒 , 若能找到其感染后国家政策的调整规律 , 再有国家元首感染新冠时 , 就可据此建模推测这个国家的政策走向 。
这套逻辑也用在了对疫情走势的预测上 。
【如何通过1亿条微博、文章、短视频,提前预测到汛情?】早在2、3月份 , 沈阳团队就开始对武汉疫情走势做预测 , 但他很快发现 , 如果单纯基于传染病的数学模型计算 , 其结果不一定准确——疫情防控往往还涉及到当地的人文情况 。 “由此我们认为 , 针对具体事件做预测时 , 还要有具体的逻辑支撑 。 ”
6月初 , 新冠疫情在北京复燃 , 沈阳团队也做了自己的预测 。 在计算一期感染规模时 , 他沿用了严格的传染病数学模型做推算 。 而在计算社区传播规模时 , 则借鉴了日本和韩国的病毒传播情况做推算 。
他向南都解释 , 中日韩三国均受到儒家文化熏陶 , 老百姓危机意识较强 , 也愿意为公共利益让渡一部分私人权利 。 三个国家具体的感染模式也呈现了相似的周期性 , 当疫情暴发后 , 隔离措施严格化 , 感染人数马上就会得到控制 。 随后为了恢复经济 , 市场重新开放 , 疫情又会零散发生 。
“所以在疫情防控常态化的情况下 , 我们认为预测模型可以参考他们的疫情走势 。 ”沈阳说 。
总体上看 , 这次预测的结果比较精准 。 北京第二轮疫情在暴发26天后进入0新增确诊病例阶段 , 目前累计确诊335例 。 “非常幸运 , 北京的疫情防控措施比日本和韩国严格很多 , 最后结果是比较乐观的 , 也较为符合我们的预期 。 ”他说 。
沈阳把对疫情的一些预测和分析 , 包括疫情周期和感染人数提交给有关部门做决策参考 。 同时 , 对其他主题的分析和预测也得到了有关部门的回应 。
显然 , 从每天1亿多条网络信息中挖掘并预测可能的“爆点”并不容易 。 沈阳也总结出一套自己的方法论 。
他告诉南都 , 通过热点发现系统 , 可以监测中国近3000个县的热点信息 , 再从出筛选出可能存在的风险 。 “研究团队会定期关注对大多数人有影响的风险 , 根据数据变化情况去发现风险 。 ”他解释 。
除了对固定地区的监测外 , 沈阳表示 , 在研究舆论的10多年中 , 他们定义了超过10万风险敏感者 。 这些人往往能发现潜在的风险事件 , “如果他们说的一件事不在热搜里 , 且这件事可能有指数级的增长 , 就纳入我们的观测范围 。 ”
虽然已有部分预测成功的案例 , 但沈阳也坦言 , 对“基于网络公开数据的风险弱信号发现与预测”的研究还刚刚起步 , 并未对各个预测项目做准确度评估 。 事实上 , 他也认为 , 不可能什么事都预测准确 , 但目前至少可以形成类似于天气预报的风险预报 。
“做预测最好玩的地方在哪?你可以对明天做一个预测 , 如果这件事明天没有发生 , 你当时就能看到预测的对错 。 ”沈阳强调 , 风险预测现阶段还是以人为主、机器为辅做发现和预警 , 随着时间、经验的积累 , 未来也有希望过渡到人机并用或机器为主的时代 。
“这个时间可能会很长 , 悲观的情况下 , 我这代人可能会止步于此 , 需要我们的学生继续沿着这条路走下去 。 ”他总结道 。
南都采访人员 宋承翰 发自北京
编辑:程姝雯
推荐阅读
- 教育考试院|江苏高考改革:江苏2021高考文化总成绩如何组成?官方答疑来了!
- Final|疫情期间留学生如何高效复习备战Final?
- 热水器|热水器哪个牌子好 从舒适到健康如何转变你知道吗
- 接种疫苗|希腊或2021年1月接种新冠疫苗:谁先打?如何申请?
- 华勤|崇达技术:在手机HDI客户导入方面,公司已通过华勤的认证
- 虎牙|解读虎牙Q3财报:净利同比增长75%至3.61亿元,移动端MAU达到7420万
- 掌上社会|如何将一手烂牌打出“王炸”的效果?昔日落榜北电的谭松韵告诉你!
- 国际|变局中的技术创新:如何形成良好国际合作生态?
- |大选僵局依然未破,“老好人”拜登如何修复美国?
- 云监工|天猫双11首次直播快递 1亿人次云监工见证数字物流进步
