Perplexity用AI打破互联网的规则

2024年06月21日 由 samoyed 发表 157 0

Perplexity 想要改变我们使用互联网的方式,但这家由杰夫·贝索斯支持的 AI 搜索初创公司可能正在打破规则来实现这一目标。根据开发者 Robb Knight 本周发布并得到《连线》杂志确认的一份报告,该公司似乎正在无视一项被广泛接受的网络标准——机器人排除协议(Robots Exclusion Protocol),以抓取网站运营者不希望被机器人访问的网页部分。


65ba71e201ae86784a2c78b5d626c4e0


Perplexity 的服务会总结网络上的文章,声称能“无需点击不同链接”即可提供“可靠的答案”,正如一篇博客文章所述。为了实现这一点,据《连线》杂志和 Knight 的发现,Perplexity 忽略了故意编写的阻止网络爬虫的代码(robots.txt 文件)。这两份报告发现,Perplexity 使用未列出的 IP 地址来绕过这些robots.txt 文件,并无论如何都抓取网站。据《连线》杂志称,其网站在 2024 年早些时候就阻止了 Perplexity 的网络爬虫,但这款 AI 搜索引擎仍然能够详细地总结其文章。


尽管如此,Perplexity在其网站上的文档中声称尊重机器人排除协议。Perplexity的CEO Aravind Srinivas 表示,他们对“Perplexity 和互联网的工作原理存在深刻且基本的误解”,但没有直接反驳这些发现。


此外,Perplexity 目前还因违反其他一些互联网规则而面临法律威胁:版权侵权。据报道,福布斯本周威胁要对 Perplexity 采取法律行动,指控这家 AI 初创公司抄袭福布斯的报道而没有适当的署名。福布斯对前谷歌 CEO Eric Schmidt 的 AI 无人机项目进行了原创报道,而 Perplexity 利用福布斯的文本和图片制作了 AI 生成的文章、播客和视频。福布斯的执行主编在本月初在X上点名批评了Perplexity。


尽管 Perplexity 的产品很有用,但它重新定向了互联网上的流量。谷歌也会为网页编制索引并提供简短的 AI 摘要,但它会直接将流量指向信息来源的网页。Perplexity 实际上是在编写详细的 AI 文章,使得用户无需点击访问网站,这打破了数字媒体的业务模式。

文章来源:https://gizmodo.com/perplexity-ai-internet-rule-robots-exclusion-protocol-1851551095
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消