• 首页
  • 关于PT电子

    公司介绍

    大事记

  • 新闻中心

    公司动态

    媒体报道

    市场活动

  • 产品

    数据计算产品

    • AI算力系列
    • 通用算力系列
    • 风液冷整机柜系列
    • 一体机解决方案系列

    终端产品

    • 商用台式机
    • 商用笔记本

    KunTai数据通信产品

    • 数据中心交换机
    • 园区交换机
    • 无线产品
  • 服务

    服务与支持

    • 服务网点
    • 服务公告
    • 产品停止维护公告

    服务产品

    • 服务产品
    • 服务窗口

    文档

    • 产品文档
    • 知识库
    • 视频中心
    • FAQ

    工具

    • 软件下载

    自助服务

    • 许可申请
    • 故障申报
    • 保修期单条查询
    • 保修期批量查询
    • 备件查询助手
    • 漏洞上报
    • 漏洞公示
    • 产品兼容性查询
  • 生态合作

    ISV软件兼容性

    合作伙伴信息

    分销业务咨询

    总裁信箱

  • 行业应用

    金融

    运营商

    互联网

    能源

    政企

    科教医疗

  • 认证培训

    重点赛事

    • 技能竞赛
    • 第二届pt电子(中国)数码云端技术大赛

    校企合作

    • 人才培养方案
    • 专业共建服务
    • 课程授权
    • 实训室建设
    • 师资培养与支持

    人才认证

    • 认证项目
    • 认证考试报名
    • 证书查询

    课程培训

    • 认证培训
    • 专题培训
    • ICT技术培训
    • 平台服务
    • 实训项目
    • 培训报名

    认证及报告

    • 温室气体核查
    • 产品碳核查
    • 可持续发展报告
  • 联系PT电子

    加入PT电子

    公司通联

登录
  • 新闻中心
  • 公司动态
  • 媒体报道
  • 市场活动

PT电子-【禁令解除72小时:141GB H20 跑满血实测,DeepSeek 性能超预期】PjTime.COM 行业新闻

2025-08-30 12:21:57| 新闻中心
分享至:

2025年7月15日,英伟达CEO黄仁勋公布了一个震惊AI圈的动静:美国当局本日起排除H20芯片对于华发卖禁令,而就于禁令排除后,云工厂科技发布具体测试数据---8卡141GB显存的H20办事器,能流利运行671B参数的满血版非量化DeepSeek-R1模子,推理吞吐量冲破预期。

硬核实测:141GB H20 跑满血版非量化 DeepSeek 机能周全解析

测试情况配置

image.png

一. 测试数据

image.png

二. 要害机能测试成果

测试显示:

1.首token相应快: 于测试的多个并发量下,首个Token的相应时间 (TTFT) 都连结于3秒之内(实测0.1s - 2.8s),用户体验很是流利,觉得不到任何延迟。

2.高并发吞吐年夜:H20显卡揭示出优异的并发处置惩罚能力。于模仿100个用户同时发问(并发哀求=100)的中高负载场景下:

·处置惩罚短问题(输入/输出各256 tokens),体系总吞吐量高达 约1124 tokens/s。

·处置惩罚典型问题(输入/输出各1K tokens),总吞吐量不变于 约1100 tokens/s。

·处置惩罚繁杂问题/长对于话(输入/输出各2K tokens),总吞吐量仍能连结 约1020 tokens/s。

分场景机能趋向:

1.低并发场景 ( 10用户):

·相应极快:TTFT始终低在0.9秒,用户险些觉得不到等候。

·吞吐未饱及: 体系能力远未被充实使用,吞吐量相对于较低(32-208 tokens/s),机能体现轻松自若。

2.中高并发场景 (50-100用户):

·相应依然迅速:TTFT连结于1.9秒 (1K上下文) 到2.8秒 (2K上下文),交互体验依然流利。

·吞吐年夜幅跃升: 体系资源获得高效使用,总吞吐量急剧上升至634 - 1124 tokens/s。

·长上下文上风闪现: 于不异并发下,处置惩罚更长(1K/2K)的上下文凡是能得到比短上下文(256)更高的吞吐量(特别于并发50时最较着),充实表现了vLLM对于长文本的优化效果。

3.极限场景 (100用户 + 长上下文2K):

·相应可控:TTFT为2.8秒,交互体验依然流利。

·吞吐维持高位: 纵然于此压力下,体系总吞吐量仍达1020 tokens/s。

三.测试总结

image.png

云工厂科技构建了周全的异构计较资源池,涵盖NVIDIA全系高机能GPU(包括141GB显存H20、L20、RTX 4090等最新型号)、AMD w7900以和国产算力三巨头(华为昇腾910B系列、baidu昆仑芯P800、燧原S60)等等,可当地部署到就近机房,提供DeepSeek、文心一言、华为盘古、LLaMA等开源年夜模子当地部署。

经由过程严酷的横向机能基准测试,云工厂科技验证了差别架构GPU于LLM推理、计较机视觉等场景的能效比差异,并为客户提供"算力租赁 + 算力智能调理 + 平台化交付"的完备 AI 办事系统,今朝已经于教诲/工业/通讯/交通等多范畴乐成落地,支撑其年夜模子部署、推理和场景化落地的全流程需求。

-PT电子

友情链接

  • pt电子(中国)数码集团
  • DCN

    关于PT电子

  • 公司介绍
  • 大事记

    新闻中心

  • 公司动态
  • 媒体报道
  • 市场活动

    产品

  • 数据计算产品
  • 终端产品
  • KunTai数据通信产品

    服务

  • 服务与支持
  • 服务产品
  • 文档
  • 工具
  • 自助服务

    生态合作

  • ISV软件兼容性
  • 合作伙伴信息
  • 分销业务咨询
  • 总裁信箱

    行业应用

  • 金融
  • 运营商
  • 互联网
  • 能源
  • 政企
  • 科教医疗

    认证培训

  • 重点赛事
  • 校企合作
  • 人才认证
  • 课程培训
  • 认证及报告

    联系PT电子

  • 加入PT电子
  • 公司通联

客户服务热线

7X24小时服务热线

400-775-8258


终端产品24小时服务热线

400-775-8258


公司地址

广州市白云区上下九街4号数码科技广场

E-Mail

www.PT.com

隐私政策 | 网络安全与隐私保护      Copyright© 北京pt电子(中国)数码云科信息技术有限公司   www.PT.com
在线客服