コンテンツにスキップ

NVIDIA Tesla

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Nvidia Tesla GPU

NVIDIA Tesla NVIDIAGPUGeForceQuadroNVIDIAGPGPU2017Volta Tesla  NVIDIA 

[]


CPU使TOP500APICUDAOpenCLDirectCompute使

GeForceQuadroTeslaC2050/C2070

AMDAMD FireStreamAMD FireProS

KeplerTesla353.06OpenCL 1.2[1]G80FermiOpenCL 1.1

[]



Tesla[]


2007620[2]G80x870[3]
構成 機種名 GPU数 グラフィックスクロック (MHz) CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
GPUコンピューティングプロセッサ1 C870 1 600 128 1350 77 GDDR3 384 1.5 1.6 0.519 N/A フルハイトビデオカード
デスクサイト・スーパーコンピュータ1 D870 2 600 256 1350 154 GDDR3 384 3 1.6 1.037 N/A デスクサイドシステム/ラックマウント装置
GPUコンピューティングサーバ1 S870 4 600 512 1350 307 GDDR3 384 6 1.6 2.074 N/A 1Uラック
C1060
コンピューティングプロセッサ2 [4]
C1060 1 602 240 1296 102 GDDR3 512 4 0.800 0.933 0.078 フルハイトビデオカード
IEEE 754r 機能
S1070 1U
GPUコンピューティングサーバ2 [5] [6]
S1070 4 602 960
(240×4)
1296/1440 408
(102×4)
GDDR3 512 16
(4×4)
? 3.73/4.14 0.311/0.345 1Uラック
IEEE 754r 機能

注釈

  • 1 NVIDIAが明らかにしていない仕様については、GeForce 8800 GTXからの推測。
  • 2 NVIDIAが明らかにしていない仕様については、GeForce GTX 280からの推測。

Fermiマイクロアーキテクチャ[編集]

2009年11月6日発表[7]。ハーフレートの倍精度演算性能を実現している(倍精度の理論演算性能は単精度の場合の1/2になっている)。

機種名 GPU数 グラフィックスクロック (MHz) CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
C20503, 5 [8] 1 575 448 1150 144 GDDR5 384 3 1.5 1.03 0.515 フルハイトビデオカード
IEEE 754r 機能
画面出力機能付き
C20703, 5 1 575 448 1150 144 GDDR5 384 6 1.5 1.03 0.515
C20753, 6 [9] 1 575 448 1150 144 GDDR5 384 6 1.5 1.03 0.515
M2050 1 575 448 1150 148 GDDR5 384 3 1.546 1.03 0.515 フルハイト/
パッシブ・ヒートシンク型
M2070 1 575 448 1150 150 GDDR5 384 6 1.566 1.03 0.515
M2090 1 650 512 1300 177 GDDR5 384 6 1.85 1.331 0.665
S2050 4 575 1792 1150 148 GDDR5 384 12 1.55 4.13 2.06 1Uラック



3 NVIDIAQuadro 6000

5 GF100 (Quadro 6000/GeForce GTX 480) []

6 GF110 (GeForce GTX 580[]) 

Kepler[]


Tesla K102012516[10]GK104K101/24[11][12]GK110K20K40GK210K801/3[13] [14] [15]2014Tesla K8GK104[16]K8Tesla1[17]

FermiSMKeplerSMXGK104/GK110SMX[18] [19]

192 CUDA16 CUDA112

64K32256KB

L1 64KB 16KB/32KB/48KB 使1256B

 48KB

 (SFU) 32

Fermi (warp) 13216 CUDA1322KeplerCompute capability (CC) GK104CC 3.0GK110CC 3.5GK210CC 3.7[20]CC 3.5Dynamic ParallelismHyper-Q[21]

GK104512KBGK110/GK210 1536KB (1.5MB)  L2  SMX  DRAM 1Xeon Phi30MB L2 [?]
機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SMX数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
K8 7 1 1536 8 693
811 (Boost)
160 GDDR5 256 8 2.5 2.13
2.49 (Boost)
0.09
0.10 (Boost)
フルハイト/1スロット型
K10 8 2 3072
(1536x2)
8x2 745 320
(160x2)
GDDR5 256 8
(4x2)
2.5 4.577
(2.288x2)
0.191
(0.095x2)
フルハイト/
パッシブ・ヒートシンク型
K20 1 2496 13 706 208 GDDR5 320 5 2.6 3.52 1.17
K20X 1 2688 14 732 250 GDDR5 384 6 2.6 3.95 1.31
K40 1 2880 15 745
875 (Boost)
288 GDDR5 384 12 3 4.29
5 (Boost)
1.43
K80 2 4992
(2496x2)
13x2 562
875 (Boost)
480
(240x2)
GDDR5 384 24 2.5 5.6
8.74 (Boost)
1.87

注釈

  • 7 GK104ベース
  • 8 GK104 (GeForce GTX 690) ベース

Maxwellマイクロアーキテクチャ[編集]

MaxwellではKeplerよりもさらに倍精度サポートが削られている(単精度の場合の1/32)。M4/M40は主に機械学習ディープラーニング向けのソリューションとして提供されている[22] [23] [24] [25]

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
M6 [26] 1 1536 12 950

1051 (Boost)

147.3 GDDR5 256 8 2.5 3.6 (Boost) 0.11 (Boost) MXM
M60 [27] 2 4096
(2048x2)
32

(16x2)

899

1178 (Boost)

320

(160x2)

GDDR5 256 16
(8x2)
2.5 9.65

(4.825x2)

0.3

(0.15x2)

フルハイト
M4 [28] 1 1024 8 517

1074 (Boost)

88 GDDR5 128 4 2.75 2.2 (Boost) 0.07 (Boost) ロープロファイル/
パッシブ
M40 [29] 1 3072 24 948
1114 (Boost)
288 GDDR5 384 12 3 5.8
6.8 (Boost)
0.18
0.21 (Boost)
フルハイト/
パッシブ・ヒートシンク型

Pascalマイクロアーキテクチャ[編集]


Tesla P10020164[30]16nmGP100P100Fermi22High Bandwidth Memory (HBM2) NVIDIANVLinkPCI Express

GP102P40GP104P41/32[31]SMCUDA12896KBMaxwell[32]
機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
P4 [33] 1 2560 20 810
1063 (Boost)
192 GDDR5 256 8 3 4.15
5.44 (Boost)
0.13
0.17 (Boost)
ロープロファイル
P40 [34] 1 3840 30 1303
1531 (Boost)
346 GDDR5 384 24 7.25 10.01
11.76 (Boost)
0.31
0.36(Boost)
フルハイト
P100 PCIe [35] 1 3584 56 1189
1328 (Boost)
540 /

720

HBM2 4096 12 /

16

0.715 9.5 (Boost) 4.8 (Boost) フルハイト/

パッシブ

P100 SXM2 [36] 1 3583 56 1328
1480 (Boost)
720 HBM2 4096 16 0.715 10.6 (Boost) 5.3 (Boost) NVLink/

パッシブ

Voltaマイクロアーキテクチャ[37][編集]


Tesla V10020175[38]12nmTensor Core
機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
V100 PCIe 1 5120 80 1245
1380 (Boost)
900 HBM2 4096 16 0.876 14 (Boost) 7 (Boost) フルハイト/

パッシブ

V100 SXM2 1 5120 80 1312

1530 (Boost)

900 HBM2 4096 16 0.876 15 (Boost) 7.5 (Boost) NVLink/

パッシブ

Turingマイクロアーキテクチャ[編集]

Tesla T4が2018年9月に発売された。

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
T4 1 2560 40 585

1590 (Boost)

320 GDDR6 256 16 1.25 8.1 不明 フルハイト

Ampereマイクロアーキテクチャ[編集]

最初の製品であるTesla A100は2020年5月に発売された。

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
A2 1 1280 不明 1440

1770 (Boost)

200 GDDR6 128 16 6.25 4.531 0.14 ハーフハイト
A10 1 9216 84 885

1695 (Boost)

600 GDDR6 384 24 不明 31.24 0.976 フルハイト
A16 4 5120

(1280x4)

20 885

1695 (Boost)

800

(200x4)

GDDR6 128x4 64

(16x4)

6.25 18.432

(4.608x4)

1.0848 フルハイト/

2スロット

A30 1 3584 128 930

1440 (Boost)

933 HBM2 3072 24 1.215 10.32 5.161 フルハイト/

2スロット

A40 1 10752 84 1305

1740 (Boost)

696 GDDR6 384 48 7.251 37.42 1.168 フルハイト/

2スロット

A100 PCIe 1 6912 108 765

1410 (Boost)

1555 HBM2 5120 40 / 80 不明 19.5 9.7 フルハイト/

2スロット

A100 SXM 1555

2039

不明 SXM英語版

Hopperマイクロアーキテクチャ[編集]

最初の製品であるTesla H100は2022年3月に発売された。

機種名 GPU数 CUDA メモリ 性能
単精度
(TFLOPS)
性能
倍精度
(TFLOPS)
形状など
CUDAコア数 SM数 CUDAコアクロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
H100 PCIe 1 14592 114 1065

1650 (Boost)

2000 HBM2e 5120 80 不明 48 24 フルハイト/

2スロット

H100 SXM 1 16896 132 3350 HBM3 不明 60 30 SXM英語版
H200 SXM 4800 HBM3e 141 不明 67 34 SXM

脚注[編集]



(一)^ Release 352 Quadro, NVS, Tesla, GRID, & Notebook Drivers - Version 353.06; RN-WQ35306-01_v01 | June 1, 2015; Windows 7, Windows 8, & Windows 8.1; Release Notes

(二)^ NVIDIAG80HPCGPUTesla

(三)^ Tesla Technical Brief (PDF)

(四)^ NVIDIA Tesla C1060

(五)^ NVIDIA Tesla S1070 1U 

(六)^ NVIDIA Tesla S1070 -   

(七)^ NVIDIAFermiNVIDIA Tesla 20 - ITmedia 

(八)^ Tesla C2050 / C2070 GPU

(九)^ NVIDIA Tesla C2075 |   

(十)^ NVIDIA Tesla K10 GPU | NVIDIA

(11)^ 4Gamer.net  GeForce GTX TITAN500GPU

(12)^ 4Gamer.net  NVIDIAKeplerTeslaGK110Tesla K20

(13)^ AnandTech | NVIDIA Launches Tesla K80, GK210 GPU

(14)^ NVIDIAGPUGK210HPCGPUTesla K80 - 4Gamer.net

(15)^ NVIDIA® Tesla® GPU Accelerators Datasheet - nvidia-tesla-kepler-family-datasheet.pdf

(16)^ Tesla-K8-Board-Spec-BD-07228-001-v03.pdf

(17)^ NVIDIA Tesla K8 |   

(18)^ Weekly NVIDIAGPUKepler

(19)^  NVIDIACUDA  Kepler GK110

(20)^ Whitepaper; NVIDIAs Next Generation CUDA Compute Architecture: Kepler GK110/210

(21)^ Kepler Tuning Guide :: CUDA Toolkit Documentation

(22)^ NVIDIAMaxwellTesla M40Tesla M4 - 4Gamer.net

(23)^ NVIDIAMaxwell7TFLOPSTesla M40 Low Profile1Tesla M4 - PC Watch

(24)^ NVIDIA Tesla M60 and Tesla M6 Accelerators To Power Grid 2.0 - M60 Featuring Dual-GM204 GPUs

(25)^ NVIDIA Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning

(26)^ Tesla M6 Product Brief

(27)^ Tesla M60 Product Brief

(28)^ Data Sheet: Tesla M4

(29)^ NVIDIA Tesla M40 |   

(30)^ GTC 2016西3DGETeslaGPUPascal - 4Gamer.net

(31)^ NVIDIATesla P40Tesla P4 - 4Gamer.net

(32)^ PASCAL: GPU

(33)^ NVIDIA Tesla P4 GPU Datasheet

(34)^ Data Sheet: Tesla P40

(35)^ Data Sheet: Tesla P100

(36)^ Data Sheet: Tesla P100

(37)^ NVIDIA TESLA V100 GPU ACCELERATOR

(38)^ GTC 2017西3DGEVoltaGPUGV100 - 4Gamer.net

関連項目[編集]

外部リンク[編集]