国产成人精品高清在线观看99,日韩一本之道一区中文字幕,国外亚洲成av人片在线观看,国产欧美日韩一区二区三区在线,国产精品美女久久久免费

阿里通義千問發(fā)布新模型并正式開源

時間:2025/08/09 17:32:09 編輯:川崎伊俊

通義千問放大招,新模型震撼登場且全面開源!歷經(jīng)潛心研發(fā),這款模型基于海量數(shù)據(jù)完成預(yù)訓(xùn)練,優(yōu)化后的架構(gòu)大幅提升性能。面對復(fù)雜數(shù)學(xué)問題,能條理清晰給出解答;處理多語言任務(wù)時,輕松實現(xiàn)流暢交互。開源后,開發(fā)者可自由獲取模型,基于其特性,在智能客服、內(nèi)容創(chuàng)作、智能輔助辦公等多領(lǐng)域探索創(chuàng)新應(yīng)用,為行業(yè)發(fā)展注入新活力。

阿里通義千問發(fā)布新模型并正式開源

8月7日,阿里通義千問發(fā)布更小尺寸新模型,即Qwen3 - 4B - Instruct - 2507和Qwen3 - 4B - Thinking - 2507。通義千問稱,Qwen3 - 4B - Instruct - 2507在非推理領(lǐng)域全面超越閉源的GPT4.1 - Nano;Qwen3 - 4B - Thinking - 2507在推理領(lǐng)域可媲美中等規(guī)模的Qwen3 - 30B - A3B(thinking)。目前,新模型已在魔搭社區(qū)、HuggingFace正式開源。

新模型在非推理領(lǐng)域表現(xiàn)出色,Qwen3-4B-Instruct-2507全面超越了閉源的小尺寸模型GPT4.1-Nano,并在性能上接近中等規(guī)模的Qwen3-30B-A3B(non-thinking)。在推理領(lǐng)域,Qwen3-4B-Thinking-2507的表現(xiàn)甚至可以與Qwen3-30B-A3B(thinking)相媲美。

官方指出,2507版本的Qwen3-4B模型特別適合在手機等端側(cè)硬件上部署,這將使得手機等移動設(shè)備能夠高效地運行這些模型。

Qwen3-4B-Instruct-2507模型的通用能力得到了大幅提升,不僅超越了商業(yè)閉源的小尺寸模型GPT-4.1-nano,而且在性能上接近Qwen3-30B-A3B(non-thinking)。新模型還覆蓋了更多語言的長尾知識,并在主觀和開放性任務(wù)中增強了人類偏好對齊,能夠提供更符合人們需求的答復(fù)。此外,模型的上下文理解能力擴展至256K,使得小模型也能夠處理長文本。

Qwen3-4B-Thinking-2507模型在推理能力上得到了大幅增強,AIME25得分高達81.3分,推理表現(xiàn)可以媲美Qwen3-30B-Thinking模型。特別是在AIME25測評中,該模型在數(shù)學(xué)能力方面表現(xiàn)出色,以4B參數(shù)量獲得了81.3分的高分。此外,該模型的Agent分數(shù)也非常突出,相關(guān)評測均超越了更大尺寸的Qwen3-30B-Thinking模型。模型的256K tokens上下文理解能力支持更復(fù)雜的文檔分析、長篇內(nèi)容生成、跨段落推理等場景,為用戶提供更加豐富的應(yīng)用體驗。

相關(guān)資訊
相關(guān)游戲