近日,阿里巴巴的Qwen团队推出了一款名为QwQ-32B-Preview的新一代推理型人工智能模型。这款模型拥有325亿参数,支持处理长达32,000词的输入提示,其性能在某些基准测试中超越了OpenAI的o1-preview及o1-mini两款推理模型。尽管参数数量通常与模型的问题解决能力成正比,但OpenAI并未公开其模型的具体参数量。
经过测试,QwQ-32B-Preview在AIME和MATH测试中表现优异,这些测试分别通过其他AI模型评估性能和解决文字问题的能力。该模型能够处理逻辑谜题并解答具有一定难度的数学问题。然而,它也存在一些局限性,如可能无故切换语言、陷入循环或在需要常识推理的任务上表现不佳。
值得注意的是,QwQ-32B-Preview具备自我事实核查的功能,这有助于减少错误,但也导致求解过程更加耗时。与OpenAI的o1类似,QwQ-32B-Preview通过预先规划并执行一系列动作来解决问题。
QwQ-32B-Preview可在Hugging Face平台上下载和运行,采用Apache 2.0许可协议发布,适用于商业用途。不过,仅部分组件对外公开。