7月31日,通義千問團隊在公眾平臺發布消息,Qwen3-30B實現重大升級,全新推理模型Qwen3-30B-A3B-Thinking-2507正式發布。新模型拓展了思考能力,提升了推理的質量和深度,是一個更睿智、更敏捷、更全能的新推理模型。
新模型在推理能力、通用能力及上下文長度上有了顯著提升,新模型在聚焦數學能力的AIME25評測中獲85.0分,在代碼能力測試LiveCodeBench v6中得分66.0,兩項核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知識水平(GPQA、MMLU-Pro)也較上一版本進步顯著;在寫作(WritingBench)、Agent能力(BFCL-v3)、多輪對話和多語言指令遵循(MultiIF)等通用能力評測中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可擴展至1M tokens。
值得一提的是,新模型的思考長度增加,團隊建議在處理高度復雜的推理任務時,設置更長的思考預算,可以充分發揮新模型潛力。
目前Qwen3-30B-A3B-Thinking-2507已在魔搭社區、HuggingFace上開源,Qwen Chat同步上線。