您好,歡迎來(lái)到報(bào)告大廳![登錄](méi) [注冊(cè)]
您當(dāng)前的位置:報(bào)告大廳首頁(yè) >> 行業(yè)資訊 >> 服務(wù)器新突破:聯(lián)想實(shí)現(xiàn)企業(yè)級(jí)大模型高效部署

服務(wù)器新突破:聯(lián)想實(shí)現(xiàn)企業(yè)級(jí)大模型高效部署

2025-03-03 13:31:14 報(bào)告大廳(158dcq.cn) 字號(hào): T| T
分享到:

  中國(guó)報(bào)告大廳發(fā)布的《2025-2030年全球及中國(guó)服務(wù)器行業(yè)市場(chǎng)現(xiàn)狀調(diào)研及發(fā)展前景分析報(bào)告》指出,近年來(lái),隨著AI技術(shù)的快速發(fā)展,大模型在企業(yè)中的應(yīng)用需求日益增長(zhǎng)。然而,如何實(shí)現(xiàn)大模型的本地化高效部署成為許多企業(yè)的難題。近日,聯(lián)想集團(tuán)宣布了一項(xiàng)重大技術(shù)突破——基于聯(lián)想問(wèn)天WA7780 G3服務(wù)器,首次實(shí)現(xiàn)單機(jī)部署DeepSeek R1/V3 671B大模型,并以低于行業(yè)公認(rèn)標(biāo)準(zhǔn)(實(shí)際768GB顯存)實(shí)現(xiàn)了100并發(fā)用戶的流暢體驗(yàn),為企業(yè)的AI應(yīng)用樹(shù)立了新標(biāo)桿。

  一、技術(shù)創(chuàng)新打破顯存瓶頸

  聯(lián)想研發(fā)團(tuán)隊(duì)通過(guò)多項(xiàng)技術(shù)突破,成功解決了企業(yè)級(jí)大模型部署中的關(guān)鍵難題。首先,在顯存利用率方面,聯(lián)想通過(guò)專(zhuān)家并行優(yōu)化和智能訪存架構(gòu)升級(jí)等創(chuàng)新手段,大幅提升了系統(tǒng)的性能表現(xiàn)。這使得企業(yè)在有限的硬件資源下能夠支持更多用戶同時(shí)使用大模型,顯著降低了企業(yè)的采購(gòu)成本。

  二、實(shí)測(cè)數(shù)據(jù)彰顯強(qiáng)大性能

  聯(lián)想的實(shí)測(cè)數(shù)據(jù)顯示,在512token的標(biāo)準(zhǔn)測(cè)試環(huán)境下,該系統(tǒng)可支持100個(gè)并發(fā)用戶持續(xù)獲得每秒10token的穩(wěn)定輸出。值得一提的是,首token響應(yīng)時(shí)間被壓縮至30秒內(nèi),而在處理4K長(zhǎng)序列復(fù)雜場(chǎng)景時(shí),仍能保持25個(gè)并發(fā)用戶的同等性能表現(xiàn)。

  三、服務(wù)器配置與成本優(yōu)化

  在硬件配置方面,這臺(tái)聯(lián)想問(wèn)天WA7780 G3服務(wù)器僅搭載了8張96GB顯存的GPU卡。然而,DeepSeek R1大模型本身需要占用約700GB顯存,這意味著剩余空間極為有限(不到100GB)。如果不進(jìn)行專(zhuān)門(mén)優(yōu)化,僅能支持23個(gè)用戶接入。聯(lián)想通過(guò)萬(wàn)全異構(gòu)智算平臺(tái)的精心優(yōu)化,不僅實(shí)現(xiàn)了用戶關(guān)注的核心指標(biāo)(首token延遲小于30秒、單token延遲小于100毫秒、支持2K以上長(zhǎng)序列處理),還成功將成本節(jié)約了20%以上。

  四、未來(lái)展望:持續(xù)優(yōu)化與應(yīng)用落地

  聯(lián)想基礎(chǔ)設(shè)施業(yè)務(wù)群與聯(lián)想研究院先進(jìn)計(jì)算實(shí)驗(yàn)室將繼續(xù)攜手合作,依托萬(wàn)全異構(gòu)智算平臺(tái)對(duì)DeepSeek平臺(tái)從AI預(yù)訓(xùn)練到推理的全流程進(jìn)行持續(xù)優(yōu)化。這一技術(shù)突破不僅將加速大模型在企業(yè)的落地進(jìn)程,也為推動(dòng)新一輪生產(chǎn)力革命奠定了堅(jiān)實(shí)基礎(chǔ)。

  總結(jié)

  聯(lián)想此次的技術(shù)創(chuàng)新不僅為行業(yè)樹(shù)立了企業(yè)級(jí)大模型部署的新基準(zhǔn),還通過(guò)高效利用硬件資源和優(yōu)化算法,顯著降低了企業(yè)的應(yīng)用門(mén)檻。未來(lái),隨著技術(shù)的進(jìn)一步優(yōu)化和應(yīng)用場(chǎng)景的不斷拓展,這一突破將進(jìn)一步推動(dòng)AI技術(shù)在企業(yè)中的廣泛應(yīng)用,助力企業(yè)在智能化轉(zhuǎn)型中實(shí)現(xiàn)更大價(jià)值。

更多服務(wù)器行業(yè)研究分析,詳見(jiàn)中國(guó)報(bào)告大廳《服務(wù)器行業(yè)報(bào)告匯總》。這里匯聚海量專(zhuān)業(yè)資料,深度剖析各行業(yè)發(fā)展態(tài)勢(shì)與趨勢(shì),為您的決策提供堅(jiān)實(shí)依據(jù)。

更多詳細(xì)的行業(yè)數(shù)據(jù)盡在【數(shù)據(jù)庫(kù)】,涵蓋了宏觀數(shù)據(jù)、產(chǎn)量數(shù)據(jù)、進(jìn)出口數(shù)據(jù)、價(jià)格數(shù)據(jù)及上市公司財(cái)務(wù)數(shù)據(jù)等各類(lèi)型數(shù)據(jù)內(nèi)容。

(本文著作權(quán)歸原作者所有,未經(jīng)書(shū)面許可,請(qǐng)勿轉(zhuǎn)載)
報(bào)告
研究報(bào)告
分析報(bào)告
市場(chǎng)研究報(bào)告
市場(chǎng)調(diào)查報(bào)告
投資咨詢(xún)
商業(yè)計(jì)劃書(shū)
項(xiàng)目可行性報(bào)告
項(xiàng)目申請(qǐng)報(bào)告
資金申請(qǐng)報(bào)告
ipo咨詢(xún)
ipo一體化方案
ipo細(xì)分市場(chǎng)研究
募投項(xiàng)目可行性研究
ipo財(cái)務(wù)輔導(dǎo)
市場(chǎng)調(diào)研
專(zhuān)項(xiàng)定制調(diào)研
市場(chǎng)進(jìn)入調(diào)研
競(jìng)爭(zhēng)對(duì)手調(diào)研
消費(fèi)者調(diào)研
數(shù)據(jù)中心
產(chǎn)量數(shù)據(jù)
行業(yè)數(shù)據(jù)
進(jìn)出口數(shù)據(jù)
宏觀數(shù)據(jù)
購(gòu)買(mǎi)幫助
訂購(gòu)流程
常見(jiàn)問(wèn)題
支付方式
聯(lián)系客服
售后保障
售后條款
實(shí)力鑒證
版權(quán)聲明
投訴與舉報(bào)
官方微信賬號(hào)