近日,DeepSeek发布了其新型推理模型DeepSeek-R1-Lite-Preview的预览版本。该模型据称在性能上能够与OpenAI的o1模型相抗衡,并且提供了一项独特功能——向用户展示模型的具体推理步骤。这项透明度是市场上其他同类产品所不具备的。
尽管如此,DeepSeek目前尚未公布关于R1-Lite-Preview的详细技术文档,包括模型卡片、性能基准测试结果或训练架构等关键信息。不过,有兴趣的用户可以通过DeepSeek提供的在线聊天界面DeepSeek Chat体验该模型的功能,每日消息发送量限制为50条。
此款模型的推出,距离OpenAI发布其o1-preview推理模型仅过去了两个月的时间。与Claude 3.5或Llama 3等主流模型不同,“推理模型”通过应用推理时的扩展法则来解决更为复杂的任务,并给出更加精确的答案。DeepSeek在R1-Lite-Preview中成功实现了这一特性。
展望未来,DeepSeek计划将R1系列模型及其相关API以开源形式发布,继续支持开源人工智能社区的发展。