OpenAI宣布允许网站拦截网络爬虫，保障数据隐私 _OpenAI

【ITBEAR科技资讯】8月8日消息，随着人工智能技术的迅猛发展，大型语言模型成为AI领域的一大热点。OpenAI旗下的GPT模型在自然语言处理方面取得了显著的进展，但在训练过程中却涉及到一系列问题，如数据隐私和版权等。
据了解，为了训练GPT模型， OpenAI需要大量的网络数据，而互联网上的数据成为主要的获取来源。然而，这种数据获取方式引发了许多争议。一方面，网站运营者担心其网站内容被GPTBot这样的网络爬虫获取，可能涉及隐私信息或侵犯版权。为此， OpenAI近日推出了一个新功能，允许网站运营者通过Robots.txt文件或屏蔽IP地址的方式，阻止GPTBot访问其网站，以保护数据的隐私和版权。

文章插图
然而，这并不意味着之前从网站上抓取的内容会追溯性地从ChatGPT的训练数据中删除。这也引发了一些网站和创作者的担忧，他们担心其内容未经授权或未付费就被用于训练GPT模型，进而用于商业用途。一些网站已经采取措施限制AI公司免费使用其用户内容的行为，以维护用户的隐私和版权权益。
【OpenAI宣布允许网站拦截网络爬虫，保障数据隐私】对于OpenAI而言，确保数据使用的合法性和透明性显得尤为重要。他们在博客文章中表示，使用GPTBot用户代理抓取的网页内容将会被筛选，过滤掉那些需要付费访问、包含个人身份信息(PII)或违反其政策的文本来源。这样的做法旨在提高AI模型的准确性、通用能力和安全性，从而更好地服务用户。
来源：http://www.itbear.com.cn/html/2023-08/467780.html

OpenAI宣布允许网站拦截网络爬虫，保障数据隐私

推荐阅读

【腾讯】“有图有真相”未必靠谱？看腾讯如何告赢这起侵权案

解气！接到过“95”开头电话的速看！

2023美妆口碑榜深度解读从裸妆美拉德卷出的彩妆潮流

给高三儿子成人礼祝福有哪些？

茶叶品牌三江春产值超亿元

制造业|8月财新制造业PMI创新高，经济复苏向好动力强劲

相亲,余磊,约会|相亲宴中，女人“拖家带口”去蹭饭，男人逃单：走为上计绝不扶贫

张庭|张庭夫妇相关传销案听证会排期中，所涉金额或逾100亿元

鲫鱼怎么吃最有营养？

蓝思科技：华为P40产业链（附股）

#特朗普#新冠确诊150万，美国再遇突发重大紧急事件，洛杉矶爆炸腾蘑菇云

好喜欢这个“爹”！钟汉良藏海传造型，留了胡子，权谋感满满！

讯美传媒柏康|十款便宜又好用的面膜排行榜，面膜哪个牌子好用不贵

视线|画面触目惊心！女子惨遭货车碾压身亡，事发时她正在……

偷税漏税？离婚？被诈骗？小虎队，全军覆没？

[软件]联合国突然宣布，马云始料未及，腾讯也猝不及防！

3DMGAME|纪念碑谷团队新作《阿尔芭：野生动物冒险》12月12日登陆iOS/PC

直观视界|12在5000元以下，在5G的加持下，还能再创辉煌吗？，如果iPhone

回忆传奇那些青春@热血传奇176复古金币武器喝幸运7的小技巧

充电头网 PD快充移动电源上市，打造国潮数码精品，故宫元素30W