OpenAI通过更广泛的训练数据改进AI

2023年11月13日由 samoyed 发表 408 0

人工智能研究公司OpenAI宣布了一项新举措，旨在多样化和扩大用于训练AI模型的数据，这个计划被称为“数据伙伴关系”。通过该计划，OpenAI计划与第三方组织合作，为人工智能培训构建新的公共和私人数据集。

OpenAI-training-825x500

OpenAI希望呈现更好的数据

根据OpenAI的说法，这一计划的目标是通过将模型暴露在更广泛的数据中，以更好地反映不同的语言、文化和主题，来创建更公平、准确和有益的模型。当前的人工智能数据集往往存在西方中心主义、缺乏多样性以及包含有毒或有偏见的内容等问题。

OpenAI在宣布该项目的博客文章中表示：“为了最终制造出对全人类安全有益的人工智能，我们希望人工智能模型能够深入了解所有主题、行业、文化和语言，这需要尽可能广泛的训练数据集。”

跨平台的模型和理解

OpenAI希望通过与伙伴合作收集涵盖文本、图像、音频和视频在内的大规模数据集，从而提高模型的理解能力。该公司表示，将努力删除任何敏感或个人信息，并提供保持数据集隐私的选项。

OpenAI已经与冰岛政府、自由法律项目和Miğeind ehf等组织合作开发了该计划的早期版本。然而，一些专家对这项努力是否能成功地将迄今为止影响人工智能模型的根深蒂固的偏见降至最低表示怀疑。

OpenAI表示：“总的来说，我们正在寻找愿意帮助我们教会人工智能了解我们的世界的合作伙伴，以便最大限度地帮助每个人。”

GPT-4人工智能训练数据的多样化

虽然多样化的人工智能训练数据至关重要，但该计划显然也有利于GPT-4等OpenAI模型的商业化。这种双重动机，加上OpenAI对数据合作伙伴缺乏补偿，引起了一些关于该公司未经许可使用数据的批评。

OpenAI数据集收集、偏见缓解工作和商业利益的更大透明度将是衡量数据合作伙伴关系对整个人工智能格局影响的关键。该项目意味着人们意识到，改善未来的人工智能需要从更好、更具代表性的数据开始。

文章来源：https://readwrite.com/openai-seeks-to-improve-ai-with-broader-training-data/

标签：

OpenAI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌计划投资人工智能初创公司Character.AI

下一篇宝莱坞的深度伪造技术问题

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市