DeepSeek計劃下周發(fā)布多模態(tài)大模型V4,支持圖文視頻生成并深度適配國產芯片;Lite版上下文窗口擴至100萬tokens,參數(shù)量或超1萬億。
觀點網(wǎng)訊:3月1日,據(jù)媒體報道,DeepSeek被傳將于下周推出最新大模型V4。
據(jù)知情人士透露,該版本為原生多模態(tài)架構,可同步生成圖片、視頻與文本,并針對國產算力完成深度優(yōu)化,意在降低對海外芯片依賴、加速推理環(huán)節(jié)本土化。
報道稱,該公司同步準備一份簡短技術說明,完整報告預計一個月后發(fā)布。
根據(jù)公開資料整理,正在秘密測試的V4 Lite代號“sealion-lite”,上下文窗口達100萬tokens,較V3系列128K提升近8倍;參數(shù)規(guī)模約2000億,完整版或突破1萬億。
資料顯示,DeepSeek上次重大更新為2025年1月20日的R1推理模型,此次V4發(fā)布時間間隔超一年。
免責聲明:本文內容與數(shù)據(jù)由觀點根據(jù)公開信息整理,不構成投資建議,使用前請核實。
審校:徐耀輝
