Reddit加强对AI机器人的打击力度 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

Reddit加强对AI机器人的打击力度

2024年06月26日由 samoyed 发表 151 0

在接下来的几周内，Reddit将开始阻止大多数自动机器人访问其公共数据。你将需要达成许可协议，就像谷歌和OpenAI所做的那样，才能使用Reddit内容进行模型训练和其他商业用途。

Command_Line_Site_Post_Reddit

虽然这在技术上已经是Reddit的政策，但该公司现在通过更新其robots.txt文件来执行这一政策，robots.txt文件是互联网的核心部分，规定了网络爬虫如何被允许访问一个网站。“这是对那些没有与我们达成协议的人的信号，他们不应该访问Reddit数据，”该公司的首席法律官本·李（Ben Lee）告诉我。“这也是对不良行为者的一个信号，robots.txt中的‘允许’一词并不意味着，也从未意味着他们可以按自己的意愿使用数据。”

robots.txt最近被称为“运行互联网的文本文件”。自从它在网络早期被构想出来以来，该文件主要决定了像谷歌这样的搜索引擎是否可以爬取一个网站来为其结果编制索引。在过去的20年左右的时间里，谷歌通过发送流量来换取爬取权限的“互惠互利”模式对所有人都适用。然后，AI公司开始收集他们能在网上找到的所有数据来训练他们的模型。

文章来源：https://www.theverge.com/2024/6/25/24185984/reddit-robots-txt-fight-ai-bots-scraping-crawlers

标签：

人工智能

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇如何在AI时代保护人类创作者的利益

下一篇钉钉开放AI生态，六大千亿级大模型厂商率先接入

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

本周热门

更多资讯 »

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消