浪潮元脑CPU推理服务器NF8260G7/G7采用4颗高性能CPU与AMX加速技术,单机支持20并发用户,性能超20tokens/s,结合32B级模型DeepSeek-R1和QwQ-32B的中文处理优势,以通用算力实现稳定的大模型部署,助力企业低投入快速落地AI应用。
浪潮信息元脑R1推理服务器已完成对开源框架SGLang新版本的深度适配,成功实现在单机高性能运行DeepSeek R1 671B模型时可支持超过1000路的用户并发访问。