新闻生产中的算法风险:成因、类型与对策( 四 )

  1.算法缺陷:技术本身的不完美

  算法并不完美 , 有优劣和适用性之分 , 世界上只有更好的算法 , 没有完美的算法 。 算法运行系统包括输入数据(input data)、算法设计(algorithm design)、输出结果(output decisions)三个环节 。 任何一个环节存在问题都将导致算法风险的产生 。

  (1)输入数据存在问题

  设计算法时 , 设计者需要用数据对算法进行训练 。 训练时采用的数据和实际输入的数据在数据质量上重合度愈高 , 愈能得出符合预期目标的结论数据 。 如果用于训练算法的数据存在缺陷(如不完整、陈旧、不相关) , 无论算法设计得多么完美 , 最后的数据输出也是错误的 。 如果训练算法的数据本身包含偏见 , 就会导致“偏见进 , 偏见出” 。


推荐阅读