金磊 发自 凹非寺
量子位 | 公众号 QbitAI
我们有超过65000种产品,每种产品都有一个页面,然后每个页面还都有至少三张图片。
OpenAI正在发送数以万计的服务器请求,试图下载所有内容,包括数十万张照片及其详细描述。
这基本上就是一场DDoS攻击。
如果一个网站没有正确配置robots.txt文件,那么OpenAI和其它公司会认为他们可以随心所欲地抓取内容。
这不是一个可选的系统。
如果不是GPTBot“贪婪”到让我们的网站宕机,我们可能不知道它一直在爬取我们的数据。
这个过程是有bug的,即便你们AI大公司说了可以配置robots.txt来防止爬虫,但你们把责任推到了我们身上。
通信人家园 (https://test.txrjy.com/) | Powered by C114 |