浪潮信息宣布元腦企智DeepSeek一體機推出“雙模”版,單機可同時部署、運行671B參數的DeepSeek R1與V3模型,并可高性能支持2000用戶并發服務,結合元腦企智EPAI企業大模型應用開發平臺,將為各行業用戶提供強大、好用、易部署的大模型應用系統。
“快思考”與“深度思考”并行,賦能企業效率提升
DeepSeek V3 與 DeepSeek R1 模型均基于混合專家架構(MoE)與多頭潛在注意力(MLA)技術底座,但在技術路徑與應用定位上展現出差異化發展方向。
■ DeepSeek V3 (671B/685B):以低成本和高通用性見長,適合廣泛的應用場景,如智能客服、多語言翻譯、內容生成等,能夠高 效處理各種文本生成、摘要和對話任務。DeepSeek V3-0324模型在長文本理解、多輪對話與通用問答等方面表現提升明顯;
■ DeepSeek R1 (671B):通過強化學習實現了專業領域的推理突破,專注于復雜邏輯推理任務,如數學證明、代碼生成和決策分析,支持“思維鏈”輸出,展示推理過程,提升透明度和可信度。
DeepSeek一體機作為一種高 效、經濟、安全的私有化交付方式,已逐漸成為企業用戶快速實現本地化部署DeepSeek R1 671B或DeepSeek V3 671B/685B模型的重要途徑。企業在實際業務運行中,簡單和實時任務要求快速推理,復雜邏輯、跨領域、創造性任務則需要深度思考。如何通過一臺DeepSeek一體機同時實現“快思考”和“深度思考”,企業根據任務特性合理分配兩種推理模式,顯著提升問題解決的效率與質量,充分發揮DeepSeek在實際業務場景中的價值,這也成為了業界更為關注的研究方向。
元腦企智DeepSeek一體機,支持671B R1和V3同機運行
浪潮信息團隊針對用戶的這一迫切需求,從AI 服務器、推理框架、大模型應用軟件等多個方面開展適配與優化工作,推出元腦企智DeepSeek一體機,已適配支持DeepSeek R1 671B、DeepSeek V3 671B/685B模型,實現了“快思考”與“深度思考”能力的全面融合,助力企業用戶在全場景下充分釋放DeepSeek大模型能力。
元腦企智DeepSeek一體機NF5698A7原生支持FP8計算引擎,以1536GB HBM3顯存、5.3 TB/s 內存帶寬實現了顯存容量與通信效率的黃金組合,適配 DeepSeek R1模型“短輸入長輸出、顯存帶寬敏感”的技術特性,單機支持全量DeepSeek R1與V3模型推理情況下,仍保留充足的KV緩存空間,配合896 GB/s P2P帶寬的高速通信架構,在保障單機部署張量并行效率的同時,實現大模型推理解碼階段的加速,為DeepSeek R1與V3模型提供強勁算力支撐與穩定運行保障。
此外,得益于超 大顯存,浪潮NF5698A7服務器能夠同時部署、運行DeepSeek R1與DeepSeek V3模型,為用戶帶來了“開箱即用”的解決方案,降低了DeepSeek模型部署的技術門檻,快速實現大模型在業務中的應用。