国产成人精品高清在线观看99,日韩一本之道一区中文字幕,国外亚洲成av人片在线观看,国产欧美日韩一区二区三区在线,国产精品美女久久久免费

阿里巴巴發(fā)布QwQ-32B開(kāi)源模型,挑戰(zhàn)DeepSeek的霸主地位

時(shí)間:2025/03/06 17:49:04 編輯:川崎伊俊

在DeepSeek成為全球開(kāi)源大模型的焦點(diǎn)之后,國(guó)產(chǎn)開(kāi)源大模型的開(kāi)發(fā)熱潮不斷升溫。如今,DeepSeek的最強(qiáng)對(duì)手終于亮相了!

阿里巴巴在今日凌晨3點(diǎn)30分發(fā)布了一款重磅炸彈——通義千問(wèn)最新開(kāi)源模型QwQ-32B。這款模型在尺寸上比DeepSeek更小,但在性能上卻與全球最強(qiáng)的開(kāi)源推理模型不相上下。據(jù)了解,通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí),千問(wèn)QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)了質(zhì)的飛躍,整體性能與DeepSeek-R1相當(dāng)。而且,千問(wèn)QwQ-32B在保持強(qiáng)勁性能的同時(shí),還大幅降低了部署使用成本,能夠在消費(fèi)級(jí)顯卡上實(shí)現(xiàn)本地部署。

目前,阿里已采用寬松的Apache2.0協(xié)議,將千問(wèn)QwQ-32B模型向全球開(kāi)源,所有人都可以免費(fèi)下載及商用。同時(shí),用戶(hù)也可以通過(guò)通義APP免費(fèi)體驗(yàn)最新的千問(wèn)QwQ-32B模型。目前,QwQ-32B-Preview已經(jīng)在(chat.qwen.ai)官網(wǎng)上線。

據(jù)通義千問(wèn)Qwen團(tuán)隊(duì)介紹,近期的研究表明,強(qiáng)化學(xué)習(xí)可以顯著提高模型的推理能力。例如,DeepSeek-R1通過(guò)整合冷啟動(dòng)數(shù)據(jù)和多階段訓(xùn)練,實(shí)現(xiàn)了最先進(jìn)的性能,使其能夠進(jìn)行深度思考和復(fù)雜推理。而QwQ-32B就是大規(guī)模強(qiáng)化學(xué)習(xí)(RL)對(duì)大語(yǔ)言模型的智能的提升作用的最好研究例證。規(guī)模上,QwQ-32B是一款僅有320億參數(shù)的模型,其性能卻可與具備6710 億參數(shù)(其中370億被激活)的DeepSeek-R1媲美。

 

另外,Qwen團(tuán)隊(duì)還在推理模型中集成了與Agent相關(guān)的能力,使其能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過(guò)程。測(cè)試結(jié)果顯示,在測(cè)試數(shù)學(xué)能力的AIME24評(píng)測(cè)集上,以及評(píng)估代碼能力的 LiveCodeBench中,千問(wèn)QwQ-32B表現(xiàn)與DeepSeek-R1相當(dāng),遠(yuǎn)勝于o1-mini及相同尺寸的R1 蒸餾模型。

在由Meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評(píng)測(cè)榜” LiveBench、谷歌等提出的指令遵循能力IFEval評(píng)測(cè)集、由加州大學(xué)伯克利分校等提出的評(píng)估準(zhǔn)確調(diào)用函數(shù)或工具方面的BFCL測(cè)試中,千問(wèn)QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen團(tuán)隊(duì)還通過(guò)展示了一段簡(jiǎn)短的示例代碼,說(shuō)明如何通過(guò)API使用 QwQ-32B。Qwen團(tuán)隊(duì)表示,我們希望我們的一點(diǎn)努力能夠證明強(qiáng)大的基礎(chǔ)模型疊加大規(guī)模強(qiáng)化學(xué)習(xí)也許是一條通往通用人工智能的可行之路。

受此消息影響,阿里巴巴港股大漲6.7%,截稿前報(bào)138.6港元,總市值2.63萬(wàn)億港元。

相關(guān)資訊
相關(guān)游戲