青云科技旗下 AI 算力云服務(wù)——基石智算Coreshub?上線全新大模型?Qwen3-30B-A3B-Instruct-2507。該模型基于 Qwen3-30B 模型微調(diào),采用?A3B 分離推理優(yōu)化機(jī)制(Attention-Acting-As-Batch),在推理性能與響應(yīng)時(shí)延上大幅提升。目前,用戶可通過(guò)基石智算大模型服務(wù),通過(guò) API 快速調(diào)用該模型,滿足不同場(chǎng)景下的業(yè)務(wù)需求。
新模型主要提升指令跟隨、邏輯推理、文本理解,以及數(shù)學(xué)、科學(xué)、編程和工具使用等通用能力,官方表示在激活 3B 參數(shù)的情況下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。
新版模型特點(diǎn)包括:
性能升級(jí)。相比傳統(tǒng) Qwen3-30B-Instruct,A3B 版本在 H100 GPU 上推理速度提升最高可達(dá) 2 倍,延遲下降約 30%。
更強(qiáng)泛化能力。優(yōu)化后的指令微調(diào)流程覆蓋通用問(wèn)答、工具調(diào)用、邏輯推理等能力,在多個(gè)基準(zhǔn)評(píng)測(cè)中表現(xiàn)優(yōu)異。
基石智算對(duì)?Qwen3-30B-A3B-Instruct-2507?完成底層容器化部署與多機(jī)并行優(yōu)化,支持彈性伸縮、Token 計(jì)費(fèi)與 API 調(diào)用方式。
快來(lái)基石智算?coreshub.cn?體驗(yàn)吧!