NVIDIA Tesla NVIDIAGPUGeForceQuadroNVIDIAGPGPU2017Volta Tesla  NVIDIA 
Nvidia Tesla GPU

概要

編集

CPU使TOP500APICUDAOpenCLDirectCompute使

GeForceQuadroTeslaC2050/C2070

AMDAMD FireStreamAMD FireProS

KeplerTesla353.06OpenCL 1.2[1]G80FermiOpenCL 1.1

仕様と構成

編集

表中の性能欄は、単精度/倍精度浮動小数点の理論演算性能(ピーク時)である。

Teslaマイクロアーキテクチャ

編集

2007年6月20日発表[2]。G80ベースのx870シリーズは単精度浮動小数点演算のみの対応であり、倍精度浮動小数点演算は実行できない[3]

構成 機種名 GPU数 グラフィックスクロック (MHz) CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
GPUコンピューティングプロセッサ1 C870 1 600 128 1350 77 GDDR3 384 1.5 1.6 0.519 N/A フルハイトビデオカード
デスクサイト・スーパーコンピュータ1 D870 2 600 256 1350 154 GDDR3 384 3 1.6 1.037 N/A デスクサイドシステム/ラックマウント装置
GPUコンピューティングサーバ1 S870 4 600 512 1350 307 GDDR3 384 6 1.6 2.074 N/A 1Uラック
C1060
コンピューティングプロセッサ2 [4]
C1060 1 602 240 1296 102 GDDR3 512 4 0.800 0.933 0.078 フルハイトビデオカード
IEEE 754r 機能
S1070 1U
GPUコンピューティングサーバ2 [5] [6]
S1070 4 602 960
(240×4)
1296/1440 408
(102×4)
GDDR3 512 16
(4×4)
? 3.73/4.14 0.311/0.345 1Uラック
IEEE 754r 機能

注釈

  • 1 NVIDIAが明らかにしていない仕様については、GeForce 8800 GTXからの推測。
  • 2 NVIDIAが明らかにしていない仕様については、GeForce GTX 280からの推測。

Fermiマイクロアーキテクチャ

編集

2009年11月6日発表[7]。ハーフレートの倍精度演算性能を実現している(倍精度の理論演算性能は単精度の場合の1/2になっている)。

機種名 GPU数 グラフィックスクロック (MHz) CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
C20503, 5 [8] 1 575 448 1150 144 GDDR5 384 3 1.5 1.03 0.515 フルハイトビデオカード
IEEE 754r 機能
画面出力機能付き
C20703, 5 1 575 448 1150 144 GDDR5 384 6 1.5 1.03 0.515
C20753, 6 [9] 1 575 448 1150 144 GDDR5 384 6 1.5 1.03 0.515
M2050 1 575 448 1150 148 GDDR5 384 3 1.546 1.03 0.515 フルハイト/
パッシブ・ヒートシンク型
M2070 1 575 448 1150 150 GDDR5 384 6 1.566 1.03 0.515
M2090 1 650 512 1300 177 GDDR5 384 6 1.85 1.331 0.665
S2050 4 575 1792 1150 148 GDDR5 384 12 1.55 4.13 2.06 1Uラック

注釈

  • 3 NVIDIAが明らかにしていない仕様については、Quadro 6000からの推測。
  • 5 GF100 (Quadro 6000/GeForce GTX 480) ベース[要出典]
  • 6 GF110 (GeForce GTX 580[要出典]) ベース

Keplerマイクロアーキテクチャ

編集

Tesla K102012516[10]GK104K101/24[11][12]GK110K20K40GK210K801/3[13] [14] [15]2014Tesla K8GK104[16]K8Tesla1[17]

FermiSMKeplerSMXGK104/GK110SMX[18] [19]

192 CUDA16 CUDA112

64K32256KB

L1 64KB 16KB/32KB/48KB 使1256B

 48KB

 (SFU) 32

Fermi (warp) 13216 CUDA1322KeplerCompute capability (CC) GK104CC 3.0GK110CC 3.5GK210CC 3.7[20]CC 3.5Dynamic ParallelismHyper-Q[21]

GK104512KBGK110/GK210 1536KB (1.5MB)  L2  SMX  DRAM 1Xeon Phi30MB L2 [?]
機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SMX数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
K8 7 1 1536 8 693
811 (Boost)
160 GDDR5 256 8 2.5 2.13
2.49 (Boost)
0.09
0.10 (Boost)
フルハイト/1スロット型
K10 8 2 3072
(1536x2)
8x2 745 320
(160x2)
GDDR5 256 8
(4x2)
2.5 4.577
(2.288x2)
0.191
(0.095x2)
フルハイト/
パッシブ・ヒートシンク型
K20 1 2496 13 706 208 GDDR5 320 5 2.6 3.52 1.17
K20X 1 2688 14 732 250 GDDR5 384 6 2.6 3.95 1.31
K40 1 2880 15 745
875 (Boost)
288 GDDR5 384 12 3 4.29
5 (Boost)
1.43
K80 2 4992
(2496x2)
13x2 562
875 (Boost)
480
(240x2)
GDDR5 384 24 2.5 5.6
8.74 (Boost)
1.87

注釈

  • 7 GK104ベース
  • 8 GK104 (GeForce GTX 690) ベース

Maxwellマイクロアーキテクチャ

編集

MaxwellではKeplerよりもさらに倍精度サポートが削られている(単精度の場合の1/32)。M4/M40は主に機械学習ディープラーニング向けのソリューションとして提供されている[22] [23] [24] [25]

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
M6 [26] 1 1536 12 950

1051 (Boost)

147.3 GDDR5 256 8 2.5 3.6 (Boost) 0.11 (Boost) MXM
M60 [27] 2 4096
(2048x2)
32

(16x2)

899

1178 (Boost)

320

(160x2)

GDDR5 256 16
(8x2)
2.5 9.65

(4.825x2)

0.3

(0.15x2)

フルハイト
M4 [28] 1 1024 8 517

1074 (Boost)

88 GDDR5 128 4 2.75 2.2 (Boost) 0.07 (Boost) ロープロファイル/
パッシブ
M40 [29] 1 3072 24 948
1114 (Boost)
288 GDDR5 384 12 3 5.8
6.8 (Boost)
0.18
0.21 (Boost)
フルハイト/
パッシブ・ヒートシンク型

Pascalマイクロアーキテクチャ

編集

Tesla P10020164[30]16nmGP100P100Fermi22High Bandwidth Memory (HBM2) NVIDIANVLinkPCI Express

GP102P40GP104P41/32[31]SMCUDA12896KBMaxwell[32]
機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
P4 [33] 1 2560 20 810
1063 (Boost)
192 GDDR5 256 8 3 4.15
5.44 (Boost)
0.13
0.17 (Boost)
ロープロファイル
P40 [34] 1 3840 30 1303
1531 (Boost)
346 GDDR5 384 24 7.25 10.01
11.76 (Boost)
0.31
0.36(Boost)
フルハイト
P100 PCIe [35] 1 3584 56 1189
1328 (Boost)
540 /

720

HBM2 4096 12 /

16

0.715 9.5 (Boost) 4.8 (Boost) フルハイト/

パッシブ

P100 SXM2 [36] 1 3583 56 1328
1480 (Boost)
720 HBM2 4096 16 0.715 10.6 (Boost) 5.3 (Boost) NVLink/

パッシブ

Voltaマイクロアーキテクチャ[37]

編集

Tesla V10020175[38]12nmTensor Core
機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
V100 PCIe 1 5120 80 1245
1380 (Boost)
900 HBM2 4096 16 0.876 14 (Boost) 7 (Boost) フルハイト/

パッシブ

V100 SXM2 1 5120 80 1312

1530 (Boost)

900 HBM2 4096 16 0.876 15 (Boost) 7.5 (Boost) NVLink/

パッシブ

Turingマイクロアーキテクチャ

編集

Tesla T4が2018年9月に発売された。

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
T4 1 2560 40 585

1590 (Boost)

320 GDDR6 256 16 1.25 8.1 不明 フルハイト

Ampereマイクロアーキテクチャ

編集

最初の製品であるTesla A100は2020年5月に発売された。

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
A2 1 1280 不明 1440

1770 (Boost)

200 GDDR6 128 16 6.25 4.531 0.14 ハーフハイト
A10 1 9216 84 885

1695 (Boost)

600 GDDR6 384 24 不明 31.24 0.976 フルハイト
A16 4 5120

(1280x4)

20 885

1695 (Boost)

800

(200x4)

GDDR6 128x4 64

(16x4)

6.25 18.432

(4.608x4)

1.0848 フルハイト/

2スロット

A30 1 3584 128 930

1440 (Boost)

933 HBM2 3072 24 1.215 10.32 5.161 フルハイト/

2スロット

A40 1 10752 84 1305

1740 (Boost)

696 GDDR6 384 48 7.251 37.42 1.168 フルハイト/

2スロット

A100 PCIe 1 6912 108 765

1410 (Boost)

1555 HBM2 5120 40 / 80 不明 19.5 9.7 フルハイト/

2スロット

A100 SXM 1555

2039

不明 SXM英語版

Hopperマイクロアーキテクチャ

編集

最初の製品であるTesla H100は2022年3月に発売された。

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
H100 PCIe 1 14592 114 1065

1650 (Boost)

2000 HBM2e 5120 80 不明 48 24 フルハイト/

2スロット

H100 SXM 1 16896 132 3350 HBM3 不明 60 30 SXM英語版
H200 SXM 4800 HBM3e 141 不明 67 34 SXM

脚注

編集


(一)^ Release 352 Quadro, NVS, Tesla, GRID, & Notebook Drivers - Version 353.06; RN-WQ35306-01_v01 | June 1, 2015; Windows 7, Windows 8, & Windows 8.1; Release Notes

(二)^ NVIDIAG80HPCGPUTesla

(三)^ Tesla Technical Brief (PDF)

(四)^ NVIDIA Tesla C1060

(五)^ NVIDIA Tesla S1070 1U 

(六)^ NVIDIA Tesla S1070 -   

(七)^ NVIDIAFermiNVIDIA Tesla 20 - ITmedia 

(八)^ Tesla C2050 / C2070 GPU

(九)^ NVIDIA Tesla C2075 |   

(十)^ NVIDIA Tesla K10 GPU | NVIDIA

(11)^ 4Gamer.net  GeForce GTX TITAN500GPU

(12)^ 4Gamer.net  NVIDIAKeplerTeslaGK110Tesla K20

(13)^ AnandTech | NVIDIA Launches Tesla K80, GK210 GPU

(14)^ NVIDIAGPUGK210HPCGPUTesla K80 - 4Gamer.net

(15)^ NVIDIA® Tesla® GPU Accelerators Datasheet - nvidia-tesla-kepler-family-datasheet.pdf

(16)^ Tesla-K8-Board-Spec-BD-07228-001-v03.pdf

(17)^ NVIDIA Tesla K8 |   

(18)^ Weekly NVIDIAGPUKepler

(19)^  NVIDIACUDA  Kepler GK110

(20)^ Whitepaper; NVIDIAs Next Generation CUDA Compute Architecture: Kepler GK110/210

(21)^ Kepler Tuning Guide :: CUDA Toolkit Documentation

(22)^ NVIDIAMaxwellTesla M40Tesla M4 - 4Gamer.net

(23)^ NVIDIAMaxwell7TFLOPSTesla M40 Low Profile1Tesla M4 - PC Watch

(24)^ NVIDIA Tesla M60 and Tesla M6 Accelerators To Power Grid 2.0 - M60 Featuring Dual-GM204 GPUs

(25)^ NVIDIA Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning

(26)^ Tesla M6 Product Brief

(27)^ Tesla M60 Product Brief

(28)^ Data Sheet: Tesla M4

(29)^ NVIDIA Tesla M40 |   

(30)^ GTC 2016西3DGETeslaGPUPascal - 4Gamer.net

(31)^ NVIDIATesla P40Tesla P4 - 4Gamer.net

(32)^ PASCAL: GPU

(33)^ NVIDIA Tesla P4 GPU Datasheet

(34)^ Data Sheet: Tesla P40

(35)^ Data Sheet: Tesla P100

(36)^ Data Sheet: Tesla P100

(37)^ NVIDIA TESLA V100 GPU ACCELERATOR

(38)^ GTC 2017西3DGEVoltaGPUGV100 - 4Gamer.net

関連項目

編集

外部リンク

編集