MLU370-X4加速卡采用思元370芯片,为单槽位150w全尺寸加速卡,可提供高达256TOPS(INT8)推理算力,和24TFLOPS(FP32)训练算力,同时提供丰富的FP16、BF16等多种训练精度,配合全新基础系统软件平台,可充分满足推训一体AI任务需求。
板卡型号 |
MLU370-X4 |
计算架构 |
Cambricon MLUarch03 |
制程工艺 |
7nm |
计算精度支持 |
FP32、FP16、BF16、INT16、INT8、INT4 |
峰值性能
|
256 TOPS (INT8) |
128 TOPS (INT16) |
|
96 TFLOPS (FP16) |
|
96 TFLOPS (BF16) |
|
24 TFLOPS (FP32) |
|
内存类型 |
LPDDR5 |
内存容量 |
24GB |
内存带宽 |
307.2 GB/s |
视频编解码 |
最高可支持至8K; 132路HEVC全高清视频解码; 24路HEVC全高清视频编码; |
图片编解码 |
图片编解码最高分辨率支持16384x16384; 4000 Frames/s 全高清图片解码; 3000 Frames/s 全高清图片编码; |
系统接口 |
x16 PCIe Gen4 |
形态 |
全高全长单槽位 |
最大热功耗 |
150W |
散热设计 |
被动 |
*测试环境:
MLU370-X4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6
GPU数据:ResNet-50来自于相关产品官网,Transformer、VGG16、YOLOv3均取自实测最大吞吐性能。