谷歌发布Google-Extended，网站发布者可选择拒绝数据训练

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2023年09月30日由 daydream 发表 585 0

谷歌刚刚宣布为网站发布者提供了一种选择，可以选择不让谷歌使用他们的数据来训练公司的AI模型，同时仍然可以使用谷歌搜索。这个名为Google-Extended的新工具允许网站继续被像Googlebot这样的网络爬虫抓取和索引，同时避免其数据在AI模型在不断发展的过程中被用来进行训练。

微信截图_20230930133105

公司表示，Google-Extended将允许发布者"管理他们的网站是否帮助改进Bard和Vertex AI生成API"，并补充说网站发布者可以使用切换按钮来"控制对站点内容的访问"。谷歌在7月份确认，它正使用从互联网上公开可用的数据对其AI聊天机器人Bard进行训练。

Google-Extended可以通过robots.txt文件进行配置，这个文件告知网络爬虫是否可以访问特定的网站。谷歌指出，"随着AI应用的扩大"，他们将继续探索"供网站发布者进行选择和控制的其他可机读方法"，并表示将很快有更多信息分享。

已经有很多网站开始封锁OpenAI用于抓取数据和训练ChatGPT的网络爬虫，其中包括《纽约时报》、CNN、路透社和Medium。然而，如何封锁谷歌一直存在争议。毕竟，网站不能完全封锁谷歌的网络爬虫，否则它们将无法在搜索中被索引。这导致一些网站，如《纽约时报》，通过更新其服务条款以禁止公司使用其内容进行AI训练，从而通过法律手段封锁谷歌。

文章来源：https://www.theverge.com/2023/9/28/23894779/google-ai-extended-training-data-toggle-bard-vertex

标签：

谷歌 Google-Extended 模型

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇视觉类比研究：揭示人工智能的视觉智能差距

下一篇解决生成式AI中版权和补偿问题的新进展

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来