產(chǎn)品服務(wù)

致力于人工智能、數(shù)字智造深度
創(chuàng)新和落地

我們的服務(wù)涵蓋數(shù)字化工廠建設(shè)、智能制造系統(tǒng)集成研發(fā)、工業(yè)數(shù)據(jù)分析和人工智能應(yīng)用等方面,已經(jīng)為眾多行業(yè)領(lǐng)域的客戶提供了人工智能和數(shù)字智造方面的解決方案。

搜索
中國(guó)AI計(jì)算迎重大突破!諾亞鴻云首批AGC架構(gòu)智算整機(jī)問(wèn)世!
30

05

2025

從雙卡到20卡,全球首家單機(jī)適配全尺寸DeepSeek

5月9日,諾亞鴻云聯(lián)合中國(guó)開(kāi)放指令生態(tài)(RISC-V)聯(lián)盟在北京宣布成立RISC-V國(guó)產(chǎn)智算體系結(jié)構(gòu)創(chuàng)新專業(yè)組,現(xiàn)場(chǎng)300多人參與會(huì)議。諾亞鴻云一舉發(fā)布5款采用AGC架構(gòu)設(shè)計(jì)的智算新品,從支持雙卡到支持20卡不等,成為全球首家單機(jī)全面適配DeepSeek各模型尺寸產(chǎn)品的企業(yè)。

其中,入門級(jí)的K2支持雙卡,體積小巧、超靜音(噪音低于55分貝),預(yù)置DeepSeek 32B模型服務(wù)、推理環(huán)境及RAG環(huán)境,非常適合辦公場(chǎng)景部署;旗艦級(jí)的K20單機(jī)可支持20卡,通過(guò)創(chuàng)新的張量并行技術(shù),完美運(yùn)行滿血版 DeepSeek 671B全量模型。較于傳統(tǒng)方案則需要4臺(tái)8卡機(jī)器組網(wǎng),技術(shù)復(fù)雜、成本高、運(yùn)維難度大。K20基于獨(dú)立全信創(chuàng)體系,支持國(guó)內(nèi)外多種形態(tài)的GPU算力卡及主流CPU處理器,同時(shí)適配DeepSeek、Qwen、LLama、ChatGLM等國(guó)內(nèi)外主流開(kāi)源AI大模型。

圖:支持20卡(16生產(chǎn)卡+4熱備卡)的K20現(xiàn)場(chǎng)點(diǎn)亮

AGC智算架構(gòu)如何破解“不可能三角”?

諾亞鴻云CTO石旭在主題報(bào)告中分享了K20背后的架構(gòu)創(chuàng)新理念與核心技術(shù)。他談到,芯片、系統(tǒng)和軟件是計(jì)算機(jī)體系結(jié)構(gòu)的三大關(guān)鍵要素。只有在體系結(jié)構(gòu)層面進(jìn)行高維度的創(chuàng)新,才能打破成本、效率、靈活性“不可能三角”的魔咒,讓GPU發(fā)揮更大算力效率,同時(shí)更具成本優(yōu)勢(shì)和靈活的適應(yīng)性。

圖:AGC是面向AI時(shí)代的計(jì)算機(jī)體系結(jié)構(gòu)

在高性能計(jì)算(HPC)、大模型訓(xùn)練/推理等場(chǎng)景應(yīng)用中,與CPU相比,GPU作為核心加速計(jì)算部件,具有功耗更高、運(yùn)行溫度更高、故障率更高等“三高”特征,進(jìn)而對(duì)GPU算力卡的生產(chǎn)級(jí)可用性、運(yùn)維便捷性、使用壽命構(gòu)成嚴(yán)重挑戰(zhàn)。有數(shù)據(jù)表明,某國(guó)外著名GPU在非7X24小時(shí)使用情況下的故障率為1-3%,在高負(fù)荷場(chǎng)景下故障率高達(dá)5-8%由于長(zhǎng)期處于高溫高能耗狀態(tài),GPU的平均壽命僅有1-3年。對(duì)普通架構(gòu)智算整機(jī)而言,單卡故障會(huì)直接導(dǎo)致整機(jī)停止服務(wù),恢復(fù)時(shí)間需2小時(shí)以上。

針對(duì)上述挑戰(zhàn),諾亞鴻云技術(shù)團(tuán)隊(duì)另辟蹊徑,立足AGC架構(gòu)設(shè)計(jì)理念,實(shí)現(xiàn)了全球首創(chuàng)的GPU熱插拔、GPU-RAID高可用、GPU節(jié)能延壽等三大技術(shù)突破。過(guò)GPU Box設(shè)計(jì),更換GPU卡像換硬盤一樣簡(jiǎn)單,運(yùn)維時(shí)間從至少2小時(shí)縮短1分鐘極致提升運(yùn)維效率,保障業(yè)務(wù)連續(xù)性;通過(guò)GPU-RAID技術(shù)類似磁盤陣列的冗余設(shè)計(jì),使單機(jī)可用性從傳統(tǒng)架構(gòu)的85%升至99.99%,極大提升生產(chǎn)環(huán)境下智算系統(tǒng)的SLA服務(wù)水平;通過(guò)GPU算力卡單點(diǎn)電源管理技術(shù),構(gòu)建細(xì)粒度能耗管理體系,讓GPU在非工作時(shí)段由系統(tǒng)自啟休眠模式,降低功耗和電費(fèi),并有效延長(zhǎng)GPU卡的使用壽命。另外,通過(guò)單張GPU算力卡與100G至400G網(wǎng)卡綁定技術(shù)(不占用CPU性能),實(shí)現(xiàn)單機(jī)2T至8T通信墻,支撐構(gòu)建萬(wàn)卡矩陣組網(wǎng)。

諾亞鴻云提出的AGC架構(gòu)與技術(shù)突破,已經(jīng)獲得多家上下游伙伴與企業(yè)用戶的認(rèn)可。來(lái)自航天聯(lián)志、燧原科技、曉軟科技的嘉賓分別介紹了與諾亞鴻云的合作成果。其中,航天聯(lián)志基于諾亞鴻云技術(shù)的通算/智算系列產(chǎn)品,已經(jīng)在油田、政務(wù)、涉密部門實(shí)現(xiàn)部署應(yīng)用;燧原科技表示對(duì)于燧原S60的諾亞鴻云一體機(jī)DeepSeek 671B滿血版,經(jīng)優(yōu)化測(cè)試后獲得了極好的綜合性能,相較于ACC結(jié)構(gòu),節(jié)省了50%的硬件資源;曉軟科技不僅將諾亞鴻云的AGC智算方案引入PCB行業(yè)20強(qiáng)企業(yè)科翔股份智能報(bào)價(jià)+chatBI智能問(wèn)數(shù)場(chǎng)景,還推出了基于超融合DAU數(shù)據(jù)處理器加速卡的信創(chuàng)服務(wù)器方案,提升IO性能3-10倍,降低硬件投資及運(yùn)營(yíng)成本50%以上。

攜手RISC-V聯(lián)盟,打造國(guó)產(chǎn)智算“朋友圈”

為進(jìn)一步推廣AGC架構(gòu),吸引更多企業(yè)進(jìn)行協(xié)同創(chuàng)新,諾亞鴻云選擇將所有知識(shí)產(chǎn)權(quán)面向CPU、GPU、整機(jī)廠商以及RISC-V聯(lián)盟成員單位進(jìn)行開(kāi)放、共享。在此次會(huì)議上,RISC-V聯(lián)盟國(guó)產(chǎn)智算體系結(jié)構(gòu)創(chuàng)新專業(yè)組也宣告成立,成為該聯(lián)盟旗下七大專業(yè)組之一。

 

圖:RISC-V國(guó)產(chǎn)智算體系結(jié)構(gòu)創(chuàng)新專業(yè)組成立儀式

在全球RISC-V生態(tài)高速發(fā)展、RISC-V高性能處理器不斷取得技術(shù)突破的態(tài)勢(shì)之下,RISC-V+AI正成為新的產(chǎn)業(yè)共識(shí),有望為AI推理算力市場(chǎng)帶來(lái)新的組合方案。在這一背景下,基于RISC-V的國(guó)產(chǎn)化智算體系架構(gòu)創(chuàng)新機(jī)會(huì)巨大,國(guó)產(chǎn)智算創(chuàng)新體系專業(yè)組的成立可謂恰逢其時(shí)。中國(guó)開(kāi)放指令生態(tài)(RISC-V)聯(lián)盟秘書(shū)長(zhǎng)包云崗在致辭中對(duì)專業(yè)組提出了三點(diǎn)期望:一是堅(jiān)持開(kāi)源開(kāi)放,秉承RISC-V初心,推動(dòng)技術(shù)共享和協(xié)作創(chuàng)新,二是聚焦國(guó)產(chǎn)智算,結(jié)合中國(guó)市場(chǎng)需求,打造真正可自主演進(jìn)的解決方案,三是匯聚行業(yè)力量,聯(lián)合產(chǎn)學(xué)研各界共同構(gòu)建繁榮的RISC-V生態(tài)體系。

 

圖:中國(guó)開(kāi)放指令生態(tài)(RISC-V)聯(lián)盟秘書(shū)長(zhǎng)包云崗致辭

諾亞鴻云CTO石旭在演講中也談到,未來(lái)還有很多體系結(jié)構(gòu)方面的技術(shù)需要協(xié)同專業(yè)組一起協(xié)作解決,比如部件級(jí)芯片級(jí)高速傳輸技術(shù)、國(guó)產(chǎn)開(kāi)源人工智能框架等。目前聯(lián)盟內(nèi)部已經(jīng)啟動(dòng)“延安開(kāi)源框架”研發(fā)項(xiàng)目,將全方位支持國(guó)產(chǎn)GPU,著力解決GPU深度優(yōu)化、全局緩存共享、全鏈路優(yōu)化、大模型安全、訓(xùn)推效率提升等5個(gè)方面的問(wèn)題。

在圓桌論壇環(huán)節(jié),RISC-V副秘書(shū)長(zhǎng)張松就國(guó)產(chǎn)AI發(fā)展和七位行業(yè)專家展開(kāi)深度對(duì)話,諾亞鴻云首席科學(xué)家張彥朝指出:“AGC架構(gòu)已在國(guó)內(nèi)多個(gè)重點(diǎn)行業(yè)驗(yàn)證,推理效率提升3倍以上。”兆松科技CEO范澤分享:“我們開(kāi)發(fā)的RISC-V專用編譯器可將CUDA遷移損耗控制在15%以內(nèi)。”信創(chuàng)海河實(shí)驗(yàn)室主任王濤強(qiáng)調(diào):“要通過(guò)開(kāi)源協(xié)作突破技術(shù)壁壘,構(gòu)建自主可控的AI生態(tài)。”

圖:圓桌論壇

立即聯(lián)系專家團(tuán)隊(duì),為您定制解決方案