7 月 28 日消息,今天有消息稱,智譜 GLM-4.5 今晚將發(fā)布新的開源模型。據(jù)新浪科技援引知情人士消息,“今晚會發(fā)布,是有這個事情的。”
就在本月 25 日,modelscope / ms-swift 代碼庫顯示的 commit 記錄顯示,智譜即將發(fā)布 GLM-4.5 系列模型,預估采用全新的混合專家(MoE)結(jié)構(gòu),是一款多模態(tài)可擴展大模型。
根據(jù) commit 上顯示的代碼,GLM-4.5 系列模型預估會有 GLM-4.5(355B-A32B)和 GLM-4.5-Air(106B-A12B)兩款模型。
Linux DO 論壇網(wǎng)友 @驚魚 分析稱,GLM-4.5 是基于混合專家(MoE)結(jié)構(gòu)的多模態(tài)可擴展大模型,具備高吞吐推理、結(jié)構(gòu)化工具調(diào)用、可解釋推理追蹤、分布式負載均衡等特性。
支持多專家分組、負載均衡、分布式推理和多 token 預測(MTP)推理。
添加了新的推理解析器和工具調(diào)用解析器,允許模型輸出嚴格的… 推理內(nèi)容和 <tool_call>…</tool_call> 工具調(diào)用內(nèi)容,便于工具增強推理與函數(shù)調(diào)用。
文檔顯示 GLM-4.5 支持 T(文本)、I(圖像)、E+(可擴展)、V+(視覺擴展),表明模型定位為多模態(tài)增強大模型。