谷歌发布Gemma 2 2B模型及安全工具

2024年08月01日 由 daydream 发表 99 0

谷歌近期在人工智能(AI)领域取得了一系列重大进展,通过扩充其Gemma 2系列,引入了一款功能强大的小型模型,并配套推出了旨在提升安全与透明度的全新工具套件。


微信截图_20240801095840


此次发布的亮点无疑是Gemma 2 2B,这款仅含20亿参数的模型,在性能上却远超同类小型AI模型,展现出非凡实力。尽管体型轻量,Gemma 2 2B在LMSYS Chatbot Arena的对话任务评测中,竟然力压包括Mixtral、GPT-3.5以及Llama 2 70B在内的众多大型模型,成绩斐然。


微信截图_20240801095900


尤为值得一提的是Gemma 2 2B的高效性,它能够轻松驾驭从边缘设备、笔记本电脑到云端部署的各类硬件环境,展现出极强的适应性和灵活性。谷歌还特别针对NVIDIA的TensorRT-LLM库进行了优化,确保该模型能够在从大型数据中心到个人电脑的广泛场景中流畅运行。


对于广大开发者而言,Gemma 2 2B的兼容性同样令人欣喜。它与Keras、JAX及Hugging Face等热门框架无缝对接,甚至在Google Colab的免费层级中即可使用,极大地降低了开发者接触并应用前沿AI技术的门槛。


然而,谷歌并未止步于技术层面的突破,更在推动负责任AI的发展上迈出了坚实步伐。他们基于Gemma 2推出了ShieldGemma安全分类器套件,旨在检测和过滤模型输入输出中的不良内容,如仇恨言论、骚扰信息和色情内容等,为AI应用筑起一道安全防线。


微信截图_20240801095916


ShieldGemma提供了多种规模版本,以满足不同场景下的需求。其中,2B版本专注于实时分类,确保快速响应;而更大的9B和27B版本则针对时间要求不高的任务,提供更高的分类准确性。


此外,谷歌还推出了Gemma Scope工具集,旨在打破AI的“黑箱”困局。该工具集包含超过400个稀疏自编码器,为研究人员提供了深入探索Gemma 2内部工作原理的窗口,有望推动构建更加可解释、更加负责任的AI系统。


即日起,开发者和研究人员即可访问这些新工具,通过Hugging Face等平台轻松获取模型权重,开启AI创新与应用的新篇章。

文章来源:https://www.maginative.com/article/google-expands-gemma-2-family-with-new-2b-model-safety-classifiers-and-interpretability-tools/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消