数字职业人,“入列”( 二 )


大数据分析师:数据会说话
【数字职业人,“入列”】“在这里,上一秒还是创意火花,下一秒可能变成应用产品 。”11月28日上午9:30,夏龙龙准时到工位上,他按下电源键,戴上耳机,手指不停敲着键盘,伴随着清脆的“噼里啪啦”声,一连串算法语言向上滚动 。“10:30有个线上会议 。”夏龙龙说着,换上另一副专门开会的耳机,和同事们聊起项目进度 。“聚类分析”“模糊逻辑”等专业术语不断输出,一排排矩阵、代码、公式布满了屏幕……
夏龙龙是小视科技江苏股份有限公司的一名大数据工程师,95后的他已经在这个行业干了5年,有着超越同龄人的成熟 。从大学开始,夏龙龙就习惯了与数据打交道,如今工作中的数据采集、数据分析对他来说,早已轻车熟路 。
对于大数据分析师而言,数据处理是基本功,夏龙龙介绍说,“初始数据量大,价值密度低,先要对这些数据进行清洗,然后构建模型,在目前的算力条件下,尽可能提升建模准确度,常常要进行上百次测试 。”他告诉采访人员,这就像用“数据”剪裁一件衣服,工程师要选择合适的数据做“布料”,最优的模型出“设计图”,再比照现实修改尺寸 。
“核验通过,请通行!”智能语音响起,南京市江宁区小里新寓门禁闸机自动开启 。今年5月份起,该小区的出入口就布设了防疫“数字哨兵”,居民刷身份证、刷人脸,能直接看到健康情况,人员流动的信息,清晰地呈现在物业管理办公室的监控大屏上 。
“小里新寓常住居民有2000多人,平均每天通行数据达2万多条 。”夏龙龙说,这些通行数据会说话,根据通行时间、频率以及习惯,能生成个人通行模型曲线,一旦发现严重的偏差,系统会告警 。他们利用这种方式实现对社区“重点人群”的关注 。
11月26日,在小视科技ITAS智慧物联应用系统上,跳出了一条告警信息,住在江宁小里新寓3幢77岁的独居老人黎宇已连续三天没有出入信息,“黎大爷出行向来规律,最近三个月他平均每天出行两次,分别在上午8点左右、下午5点左右 。”夏龙龙将这一情况反馈给社区,网格员上门查看后,发现原来是黎大爷在家不小心摔倒了,不想打扰儿子,便忍了两天没有出门,最终在社区人员的帮助下,黎大爷顺利就医 。
“独居老人是社区重点关注的对象,如果他们的出行频次或者习惯突然改变,就有可能存在安全隐患 。”通过分析通行大数据,夏龙龙还发现过传销组织的苗头,“这部分群体喜欢在非上班时间尤其是半夜结伴出行”,夏龙龙说,两年多以来,仅在小里新寓,发生类似的告警事件就有30多起 。
由数据推演出的模型,在海量数据中反复验证,模型也随之调整 。智慧社区项目实施之初,闹了很多乌龙,有一次,夏龙龙注意到,一位独居老人连续两天没有出行数据,调查发现,原来老人的儿子就住在隔壁楼栋,不需要经过门闸通行 。还有一次,一个房间注册了20多人,以为是群租房或传销组织,后来发现是物业保洁人员的公共休息室 。这些乌龙事件,也督促夏龙龙在数据模型中要考虑得更谨慎更周到 。
通过数据建模,敲下的一行行代码不断演变成智能化应用场景,这是夏龙龙最有成就感的事情 。“我们最新的研究主要集中在智慧社区 。比如,高空抛物摄像机,能记录下高空抛物全过程,直接锁定楼层和户主;智能监控设备,能识别可疑人员翻墙‘入侵’小区,识别道路上是否有老人和孩子跌倒,查看车辆停放占用消防通道和居民遛狗不牵绳的情况 。如有异常,系统会第一时间发出预警 。”夏龙龙说 。
写代码、改方案、赶进度、修Bug......大数据应用模式的迭代速度非常快,考验着大数据分析师知识结构的更新能力 。海量级别数据怎么处理?数据并行如何优化操作?夏龙龙经常要利用下班时间充电,他的工位看起来,更像是学生的课桌,《精益数据分析》《利用Python/ target=_blank class=infotextkey>Python进行数据分析》《Python大数据分析与机器学习商业案例实战》《数据分析:企业的贤内助》等书堆成一摞摞,便于他随时查阅,找补知识盲点 。
大数据行业不以经验为王,每个人都如同闯关者,处在同一起跑线上,只有不停“深度学习”,才能把未来牢牢抓在自己手里,夏龙龙说,“不断提高的实力,就是对抗焦虑、迎接未来最强劲的底气 。”


推荐阅读