|MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续( 二 )
本文插图
论文的质量究竟如何 , 我们需要仔细研读才能得出结论 。 但有一点可以肯定 , 搬出种族歧视大旗似乎并不是解决学术问题的合理方法 。
「我认为你应该用科学的方式来证明自己的观点 , 写一篇博客来告诉大家为什么你的论文应该被引用 。 」
本文插图
这个话题引起了谷歌研究科学家、Yoshua Bengio 的兄弟 Samy Bengio 的注意 。 他认为 , 要从根本上改善弱势群体在学界的地位 , 应该从改变引用习惯做起 。
Samy Bengio:建议大家多引用少数群体的论文
Samy Bengio 在自己的 Facebook 主页发帖表达了自己的看法 。
本文插图
坚持科学理性的学术立场虽然不易 , 但很有必要 , 这是提升机器学习社区质量和多样性的必由之路 。 我们大家每一小步的正确举动都将累积成社区长远发展的一大步 。 Adji Dieng 这件事令我萌生了一种想法:我们所有人在引用彼此的文献时 , 可以有意识地选择那些关注度较低的作者的论文 , 而不是选择名人作者的论文;引用那些每天受系统性问题之害的作者 , 而不是那些已经受益颇多的作者 。 我们都清楚论文引用在机器学习领域至关重要 , 我的这个想法实施起来简单有效 。 大家觉得呢?有其他好的建议也请分享 。
对此 , 有人在 reddit 上发帖提问:学术引用真的已经只看作者 , 而不重论文实际内容了吗?
本文插图
对于 Samy Bengio 博客中提出的「多引用关注度较低的作者的论文」 , 网友也纷纷表达了自己的看法 。
下面这位网友表示 , ta 完全赞成引用关注度较低学者的论文 , 但绝不应该因为种族或者名气等外部原因而做出不理性客观的引用 , 要以论文相关性为引用基准 。
本文插图
而对于「学术引用已经基于作者 , 而非论文实际内容」的提问 , 下面这位网友表示 , 这似乎就是我们经常在做的事情 。 每篇论文都以「计算机视觉已经成功地应用于 xx 任务」开头 , 并且像完成任务般列举出与论文主题相关性甚小却由名人撰写的论文 。
本文插图
但也有人表示 , 虽然 ta 也认为不应该基于作者来引用论文 , 并且赞成支持少数群体论文的观点 。 但 Samy Bengio 的建议是否正确仍待商榷 。
本文插图
盲目的学术崇拜肯定不利于新研究、新观点和新技术的推广 , 也不利于构建一个健康理性的社区 。 但如果真的按照 Samy Bengio 的建议而有意识地多引用关注度较低的作者的论文 , 这是否又会走入另一个极端呢?
MIT 删除 Tiny Images 数据集
不止学者陆续发声表达自己的观点 , 学术机构也在行动 。
近日 , 为了营造健康的学术氛围 , 反对并遏制种族歧视等各类偏见 , MIT 也采取了相应的行动:将存在种族歧视和性别偏见内容的 Tiny Images 数据集永久移除 。
本文插图
Tiny Images 数据集中包含大量冒犯性标签的图像 。
该数据集创建于 2006 年 , 删除它的原因是这个有八千万张图像的数据集中含有大量的带有种族歧视等偏见的内容 。 比如 , 该数据集中有这样的照片:黑人和猴子的照片被贴上 Nigger 标签;穿着比基尼的妇女被贴上妓女的标签等 , 将毫无关系的图像内容和一些侮辱性词汇牵扯在一起 。 更糟糕的是 , 那些使用该数据集训练的 AI 模型也会带有这样的有害偏见 。
推荐阅读
- 技术编程|Mitch for Twitch Mac版(Twitch客户端工具)v1.8.1
- 青年|ICML 2020论文贡献榜排名出炉:Google单挑斯坦福、MIT、伯克利;清华进TOP 20
- AI人工智能|惨遭下架后,MIT再爆知名数据集ImageNet存在系统性Bug,祸端还是WordNet
- 南国今报|部分“黑心”毛巾已在柳州下架
- 中年|美团饿了么等平台下架汉堡王涉事门店外卖服务
- 新智元|MIT发出“算力”警告:深度学习正在逼近计算极限
- AI财经社|遭3.15晚会央视点名批评虚假广告后,趣头条疑似被各安卓平台下架
- 头条|安卓商店普遍下架趣头条 回应称已安装用户不影响使用
- 毛巾|蓝鲸315丨京东、淘宝、拼多多已下架永亮毛巾,后者遭央视点名
- 观察者网|趣头条回应3.15晚会报道:诚挚道歉,正在彻查 安卓商店已下架
