中國(guó)報(bào)告大廳發(fā)布的《2025-2030年全球及中國(guó)服務(wù)器行業(yè)市場(chǎng)現(xiàn)狀調(diào)研及發(fā)展前景分析報(bào)告》指出,近年來(lái),隨著AI技術(shù)的快速發(fā)展,大模型在企業(yè)中的應(yīng)用需求日益增長(zhǎng)。然而,如何實(shí)現(xiàn)大模型的本地化高效部署成為許多企業(yè)的難題。近日,聯(lián)想集團(tuán)宣布了一項(xiàng)重大技術(shù)突破——基于聯(lián)想問(wèn)天WA7780 G3服務(wù)器,首次實(shí)現(xiàn)單機(jī)部署DeepSeek R1/V3 671B大模型,并以低于行業(yè)公認(rèn)標(biāo)準(zhǔn)(實(shí)際768GB顯存)實(shí)現(xiàn)了100并發(fā)用戶的流暢體驗(yàn),為企業(yè)的AI應(yīng)用樹(shù)立了新標(biāo)桿。
聯(lián)想研發(fā)團(tuán)隊(duì)通過(guò)多項(xiàng)技術(shù)突破,成功解決了企業(yè)級(jí)大模型部署中的關(guān)鍵難題。首先,在顯存利用率方面,聯(lián)想通過(guò)專(zhuān)家并行優(yōu)化和智能訪存架構(gòu)升級(jí)等創(chuàng)新手段,大幅提升了系統(tǒng)的性能表現(xiàn)。這使得企業(yè)在有限的硬件資源下能夠支持更多用戶同時(shí)使用大模型,顯著降低了企業(yè)的采購(gòu)成本。
聯(lián)想的實(shí)測(cè)數(shù)據(jù)顯示,在512token的標(biāo)準(zhǔn)測(cè)試環(huán)境下,該系統(tǒng)可支持100個(gè)并發(fā)用戶持續(xù)獲得每秒10token的穩(wěn)定輸出。值得一提的是,首token響應(yīng)時(shí)間被壓縮至30秒內(nèi),而在處理4K長(zhǎng)序列復(fù)雜場(chǎng)景時(shí),仍能保持25個(gè)并發(fā)用戶的同等性能表現(xiàn)。
在硬件配置方面,這臺(tái)聯(lián)想問(wèn)天WA7780 G3服務(wù)器僅搭載了8張96GB顯存的GPU卡。然而,DeepSeek R1大模型本身需要占用約700GB顯存,這意味著剩余空間極為有限(不到100GB)。如果不進(jìn)行專(zhuān)門(mén)優(yōu)化,僅能支持23個(gè)用戶接入。聯(lián)想通過(guò)萬(wàn)全異構(gòu)智算平臺(tái)的精心優(yōu)化,不僅實(shí)現(xiàn)了用戶關(guān)注的核心指標(biāo)(首token延遲小于30秒、單token延遲小于100毫秒、支持2K以上長(zhǎng)序列處理),還成功將成本節(jié)約了20%以上。
聯(lián)想基礎(chǔ)設(shè)施業(yè)務(wù)群與聯(lián)想研究院先進(jìn)計(jì)算實(shí)驗(yàn)室將繼續(xù)攜手合作,依托萬(wàn)全異構(gòu)智算平臺(tái)對(duì)DeepSeek平臺(tái)從AI預(yù)訓(xùn)練到推理的全流程進(jìn)行持續(xù)優(yōu)化。這一技術(shù)突破不僅將加速大模型在企業(yè)的落地進(jìn)程,也為推動(dòng)新一輪生產(chǎn)力革命奠定了堅(jiān)實(shí)基礎(chǔ)。
總結(jié)
聯(lián)想此次的技術(shù)創(chuàng)新不僅為行業(yè)樹(shù)立了企業(yè)級(jí)大模型部署的新基準(zhǔn),還通過(guò)高效利用硬件資源和優(yōu)化算法,顯著降低了企業(yè)的應(yīng)用門(mén)檻。未來(lái),隨著技術(shù)的進(jìn)一步優(yōu)化和應(yīng)用場(chǎng)景的不斷拓展,這一突破將進(jìn)一步推動(dòng)AI技術(shù)在企業(yè)中的廣泛應(yīng)用,助力企業(yè)在智能化轉(zhuǎn)型中實(shí)現(xiàn)更大價(jià)值。
更多服務(wù)器行業(yè)研究分析,詳見(jiàn)中國(guó)報(bào)告大廳《服務(wù)器行業(yè)報(bào)告匯總》。這里匯聚海量專(zhuān)業(yè)資料,深度剖析各行業(yè)發(fā)展態(tài)勢(shì)與趨勢(shì),為您的決策提供堅(jiān)實(shí)依據(jù)。
更多詳細(xì)的行業(yè)數(shù)據(jù)盡在【數(shù)據(jù)庫(kù)】,涵蓋了宏觀數(shù)據(jù)、產(chǎn)量數(shù)據(jù)、進(jìn)出口數(shù)據(jù)、價(jià)格數(shù)據(jù)及上市公司財(cái)務(wù)數(shù)據(jù)等各類(lèi)型數(shù)據(jù)內(nèi)容。
本文來(lái)源:上海證券報(bào)·中國(guó)證券網(wǎng)
本文地址:http://158dcq.cn/info/1255842.html