阿里將于2月16日除夕夜開源Qwen3.5大模型,該模型實(shí)現(xiàn)架構(gòu)創(chuàng)新,并計(jì)劃推出2B密集模型與35B-A3B MoE模型。
觀點(diǎn)網(wǎng)訊:2月16日,報(bào)道援引消息人士消息,阿里巴巴將于今晚除夕夜開源新一代千問大模型Qwen3.5,該模型實(shí)現(xiàn)了模型架構(gòu)的全面創(chuàng)新。去年除夕深夜,阿里曾發(fā)布Qwen2.5-Max。
Qwen3.5采用創(chuàng)新混合注意力機(jī)制,結(jié)合局部與全局注意力優(yōu)勢(shì),長(zhǎng)文本處理能力提升超40%。該模型原生支持任意分辨率圖像輸入,并計(jì)劃以雙版本形式開源,包括2B密集模型和35B-A3B MoE模型,旨在降低開發(fā)者部署門檻。
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)由觀點(diǎn)根據(jù)公開信息整理,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。
審校:劉滿桃
