米東部標準時間2017年1月5日9:00,AMDは,「HBM2」(High Bandwidth Memory)を採用する次世代GPU「
Vega 」(ヴェガ,開発コードネーム)の技術情報を一部先行公開した。
2016年12月の報道関係者向けイベント,AMD TECH SUMMITで,AMDのGPU部門であるRadeon Technologies Groupを率いる
Raja Koduri (ラジャ・コドゥリ)氏は,「Vegaには4つの新しい技術ポイントがある。今回はこれらについて解説することにしたい」と述べ,懐からVegaのサンプルチップパッケージを出して掲げたのだが,今回,機密保持契約の期限が来たことでお届けできるのは,これら4つの技術ポイントについてだ。
Raja Koduri氏(Senior Vice President and Chief Architect, Radeon Technologies Group, AMD)
Vega搭載の実動デモ機。PCケース内部が見えにくい細工がしてあり,撮影してもこの有様
な お , 結 論 か ら 先 に 述 べ る と , 今 回 明 ら か に な っ た の は ﹁ 先 行 公 開 ﹂ と い う 位 置 づ け の 情 報 で あ り , チ ッ プ パ ッ ケ ー ジ 自 体 も 一 瞬 ス テ ー ジ 上 で 掲 げ ら れ た の み で , 接 写 撮 影 を す る こ と は 叶 わ ず 。 デ モ 会 場 に あ っ た 実 機 デ モ は 曇 り ガ ラ ス の よ う な ス テ ッ カ ー を 貼 っ て 中 が 見 え な い よ う に し て あ る と い う 徹 底 ぶ り で , 搭 載 グ ラ フ ィ ッ ク ス カ ー ド の 形 は 判 明 し て い な い 。
A M D の 公 式 見 解 と し て , ス ペ ッ ク も 含 め た , よ り 詳 細 な 情 報 は 後 日 あ ら た め て 発 表 す る , と の こ と だ 。
V e g a は 搭 載 す る H B M 2 を キ ャ ッ シ ュ と し て 利 用 す る !?
Joe Macri氏(CIE,AMD)。氏のセッションは撮影が禁止されていたので,写真は2016年6月に撮影したものとなる。ちなみに氏の肩書きは今回,CIEとなっていたが,これが何の略なのかは分からない
さ て , K o d u r i 氏 に 続 い て 登 壇 し た J o e M a c r i ︵ ジ ョ ー ・ マ ク リ ー ︶ 氏 は , 1 つ め の 技 術 ポ イ ン ト と し て , 新 し い メ モ リ ア ー キ テ ク チ ャ の 採 用 を 明 ら か に し た 。
A M D は 2 0 1 6 年 3 月 の 時 点 で V e g a が H B M 2 を 採 用 す る こ と を 明 ら か に し て い た が ︵ 関 連 記 事 ︶ , M a c r i 氏 に よ る と , V e g a は そ の H B M 2 を ﹁ H i g h - B a n d w i d t h C a c h e ﹂ ︵ 以 下 , H B C ︶ と し て 使 う の だ と い う 。 従 来 の S R A M に 代 わ る キ ャ ッ シ ュ と し て , H B M 2 を 使 う と い う わ け だ 。
HBM(High Bandwidth Memory)を世界で初めて採用したしたGPUは,開発コードネーム「Fiji」(フィジー)ことRadeon R9 Furyシリーズである(
関連記事 )。メモリチップを高層ビルのように積み上げて(=スタックさせて)配置し,それを「TSV」(Through Silicon Via,シリコン貫通ビア)技術によって串刺しに貫通させて配線するメモリ実装技術で,省スペースかつ高帯域幅なメモリ性能を発揮できる新世代のメモリ技術だ。
Vegaのサンプルチップパッケージ。写真でGPUダイの上に見える2つのチップがHBM2だ
それに対してVegaが採用するHBM2は,採用する基本技術こそHBMと共通ながら,1ダイあたりの容量,ピンあたりの伝送速度がいずれも2倍に向上しているのが特徴である。
ちなみに,HBM2自体は,2016年4月にNVIDIAが発表したGPGPU向けプロセッサ「
Tesla P100 」が初採用である。
HBM2は,同じ動作クロックで比較したとき,HBMに対して2倍のメモリバス帯域幅を持つ
同じメモリ容量を実現するのに,HBM2ならGDDR5比で基板上の専有面積を50%以上削減可能。また,HBMと比べて1スタックあたり8倍の容量を実現した
で は , H B M 2 を H B C と し て 採 用 す る V e g a の キ ャ ッ シ ュ メ モ リ シ ス テ ム は , S R A M を 採 用 し て い る 従 来 型 G P U の そ れ と 何 が 違 う の か 。
﹁ V e g a で は H B M 2 を 採 用 し た ﹂ 。 こ こ は い い 。 し か し ﹁ こ の H B M 2 を キ ャ ッ シ ュ メ モ リ と し て 利 用 す る ﹂ と い う こ と の 意 味 が ピ ン と こ な い 読 者 も 多 い だ ろ う 。
A M D の 解 析 に よ れ ば , PC ゲ ー ム に 代 表 さ れ る 現 在 の 主 要 な G P U ア プ リ ケ ー シ ョ ン で は , テ ク ス チ ャ や 各 種 バ ッ フ ァ な ど 向 け に 確 保 し た メ モ リ の う ち , 実 際 に レ ン ダ リ ン グ パ イ プ ラ イ ン が 一 周 す る ま で に 使 わ れ る 容 量 は そ の 半 分 程 度 に 留 ま る と い う 。
言 い 換 え る と , 実 際 の レ ン ダ リ ン グ 時 に 高 速 性 が 要 求 さ れ る メ モ リ ア ク セ ス は , 確 保 し た 容 量 の 半 分 で 足 り る と 言 う わ け だ 。
AMDはVegaのメモリシステムを「世界で最もスケーラブルなメモリアーキテクチャ」と謳う
﹁ で あ れ ば , レ ン ダ リ ン グ パ イ プ ラ イ ン が 一 周 す る 間 に 必 要 な デ ー タ だ け を 高 速 メ モ リ に 載 せ て お け ば , そ れ 以 外 の デ ー タ は , ゲ ー ム な ら メ イ ン メ モ リ , オ フ ラ イ ン レ ン ダ リ ン グ 用 な ら S S D と い っ た 具 合 に , 高 速 メ モ リ 以 外 に 置 い て お い て も い い の で は な い か ﹂ と い う 考 え 方 も 通 用 す る 。
そ こ で 採 用 し た の が , ﹁ で あ れ ば , 高 速 性 が 必 要 な メ モ リ に H B M 2 を 割 り 当 て よ う ﹂ と い う 発 想 で あ る 。
﹁ そ れ 以 外 の デ ー タ ﹂ 用 の メ モ リ は , H B M 2 以 外 , そ れ こ そ C P U 側 の メ イ ン メ モ リ や , あ る い は グ ラ フ ィ ッ ク ス カ ー ド 上 に 別 途 搭 載 す る D D R 3 メ モ リ で い い か も し れ な い 。
た だ , こ の 場 合 , キ ャ ッ シ ュ マ ネ ジ メ ン ト を 相 当 に う ま く や ら な い と , レ ン ダ リ ン グ 実 行 速 度 が 遅 く な っ て し ま う 。
そ こ で V e g a は , キ ャ ッ シ ュ 管 理 機 構 と し て の ﹁ H i g h - B a n d w i d t h C a c h e C o n t r o l l e r ﹂ ︵ 以 下 , H B C C ︶ を 実 装 し た 。
H B C C の 仕 事 は , 大 別 し て 2 つ あ る 。
1 つ は , G P U に 直 結 さ れ て い る H B M 2 以 外 の メ モ リ に 対 す る ア ク セ ス , よ り 正 確 に 言 え ば 入 出 力 マ ネ ジ メ ン ト だ 。
下 の ス ラ イ ド を 見 て ほ し い 。 こ れ を 見 る と , H B C C は , H B M 2 ︵ = H B C ︶ と は 別 に , ﹁ S y s t e m D R A M ﹂ ﹁ N e t w o r k S t o r a g e ﹂ ﹁ N V R A M ﹂ と つ な が っ て い る の が 分 か る 。 S y s t e m D R A M は PC 側 の シ ス テ ム メ モ リ ︵ ≒ メ イ ン メ モ リ ︶ の こ と だ が , 面 白 い の は N e t w o r k S t o r a g e と N V R A M だ ろ う 。 N e t w o r k S t o r a g e は ネ ッ ト ワ ー ク 接 続 さ れ た ス ト レ ー ジ , N V R A M は N V I D I A と は 無 関 係 で ︵ 笑 ︶ , 電 源 を 落 と し て も メ モ リ の 内 容 が 消 え な い 不 揮 発 性 メ モ リ を 指 し て い る 。 A M D 側 の 認 識 と し て は , こ こ は 単 体 S S D も 含 む よ う だ 。
簡易ブロック図より,HBCC周り。HBCCはHBCとそしてSystem DRAMおよびNetwork Storage,NV RAMとつながっているのが分かる。なお,HBCCの上に見えるのがL2キャッシュで,GPUパッケージの外に5個以上つながっているように見えるのは,カード上のローカルメモリではなく,CPUやPCI Expressなどの要素だ
H B C C が 受 け 持 つ 仕 事 , も う 1 つ は , ﹁ G P U ︵ プ ロ グ ラ ム ︶ に 対 す る 仮 想 ア ド レ ス 空 間 の 提 供 ﹂ で あ る 。
V e g a で は , 実 体 と し て の グ ラ フ ィ ッ ク ス メ モ リ が な く な り , H B M 2 が 大 容 量 キ ャ ッ シ ュ メ モ リ と な っ た た め , メ モ リ ア ク セ ス に あ た っ て は , G P U プ ロ グ ラ ム 側 が 指 定 し た ア ド レ ス を 解 釈 し て , H B M 2 に ア ク セ ス し た り , あ る い は 前 述 し た よ う な H B M 2 以 外 の 外 部 メ モ リ へ の ア ク セ ス を 提 供 し た り し な け れ ば な ら な い 。 こ れ ら ア ド レ ス 変 換 と メ モ リ の 入 出 力 も , H B C C の 仕 事 と な る 。
こ こ ま で ア ー キ テ ク チ ャ が 変 わ る と 既 存 の プ ロ グ ラ ム と の 互 換 性 が 気 に な る か も し れ な い が , こ れ は 問 題 が な い 。 G P U プ ロ グ ラ ム 側 が 実 行 時 に 用 い る ア ド レ ス 空 間 は こ れ ま で も 仮 想 ア ド レ ス だ っ た か ら だ 。 つ ま り , 従 来 の G P U で も V e g a で も , い ず れ に せ よ 仮 想 ア ド レ ス か ら 物 理 ア ド レ ス へ の 変 換 を 行 っ て ア ク セ ス し て い る の で , 俯 瞰 視 点 で 見 れ ば , ア ド レ ス 解 決 の 仕 方 と メ モ リ 管 理 の 仕 方 が 変 わ っ た と い う だ け な の だ 。 ワ ー ス ト ケ ー ス で 実 行 速 度 に 影 響 が 出 る 可 能 性 は 否 定 で き な い も の の , G P U プ ロ グ ラ ム の 実 行 に お い て , ﹁ G P U の メ モ リ ア ー キ テ ク チ ャ が 異 な っ て い る こ と ﹂ の 影 響 を 受 け る こ と は な い は ず で あ る 。
Vegaがサポートする仮想アドレス空間は512TB
A M D の 発 表 に よ る と , V e g a の 有 効 仮 想 ア ド レ ス は 4 9 b i t で , 利 用 で き る 仮 想 メ モ リ 空 間 は 5 1 2 T B と の こ と で あ る 。 ち な み に , 6 4 b i t 版 W i n d o w s 1 0 が サ ポ ー ト す る 仮 想 ア ド レ ス 空 間 は 4 8 b i t で , 利 用 で き る メ モ リ 空 間 は シ ス テ ム 領 域 と ユ ー ザ ー 領 域 の 合 計 2 5 6 T B と な っ て い る の で , 当 面 は V e g a の 仕 様 で 実 用 上 の 支 障 が 出 る こ と は な い だ ろ う 。
今 回 の 発 表 で は , オ ン パ ッ ケ ー ジ の 搭 載 と な る H B M 2 容 量 の 発 表 は な か っ た 。 K o d u r i 氏 が 掲 げ た チ ッ プ パ ッ ケ ー ジ を 見 る 限 り , メ モ リ ス タ ッ ク は 2 つ な の で , 総 容 量 に し て 4 G B も し く は 8 G B あ た り と い っ た と こ ろ で は な か ろ う か 。
そ う 考 え る 根 拠 は , G P G P U 専 用 用 途 で は な く , PC ゲ ー ム 用 途 を 含 め た 民 生 用 途 を 考 え る と , コ ス ト の 高 い 8 層 式 H B M 2 を 採 用 す る と は 思 え な い た め だ 。 そ う な る と 2 層 式 か 4 層 式 と な り , 2 層 式 の H B M 2 は 2 ス タ ッ ク で 4 G B , 4 層 式 で は 2 ス タ ッ ク で 8 G B と な る 。
ち な み に , ピ ン あ た り 2 G b p s 仕 様 の も の と 仮 定 す る と 帯 域 幅 は 5 1 2 G B / s ︵ ※ 2 5 6 G B / s の 2 ス タ ッ ク ︶ で , ハ イ エ ン ド G P U と し て は そ れ っ ぽ い 値 に な る 。 な お , 現 在 , 量 産 提 供 中 の H B M 2 に つ い て は , S K H y n i x が 公 開 し て い る H B M 2 の 仕 様 ペ ー ジ が 参 考 に な る は ず で あ る 。
「The Witcher 3: Wild Hunt」と「Fallout 4」で,それぞれ3840 × 2160ドット表示させたときのメモリ使用率グラフ。縦軸が容量,横軸が時間で,黄土色の波線が確保された容量(≒データ格納容量)で,薄紫色の波線が実際のアクセス容量となっている。これを見ると,「実際の描画にあたって,確保した容量の半分くらいにしかアクセスしていない」ことは分かるはず。提供されたスライドだと縦軸の数字はないが,イベント会場では黄土色の波線が4GBあたり,薄紫色の波線が2GBあたりを推移していたので,だとするとVegaのHBM2容量は4GB の線が濃厚か?
新しいシェーダステージ「Primitive Shader」を導入
Mike Mantor氏(Graphics and Parallel Compute Architect and Corporate Fellow)
Vegaにおける技術ポイント,2つめは,新設のジオメトリエンジン「New Programmable Geometry Pipeline」(ニュー・プログラマブルジオメトリパイプライン。以下 NPGP)だ。従来のRadeonでは「Geometry Processor」(以下,GP)と呼称されていた部位が刷新となるわけだ。
GPUコアのアーキテクチャ面について説明したAMDの
Mike Mantor (マイク・メンター)氏によれば,NPGPにおいて,従来のGPに対して2つの改良ポイントがあるという。
VegaはNPGPを新規に採用
1つは,「Primitive Shader」(プリミティヴシェーダ)という新プログラマブルシェーダの導入である。
DirectX 10で登場したCompute Shader(コンピュートシェーダ)は,DirectX 11以降でとくに活用が進んだプログラマブルシェーダだが,近年では,これまでPixel Shader(ピクセルシェーダ,以下カタカナ表記)で行ってきたポストエフェクト処理やVertex Shader(頂点シェーダ,以下カタカナ表記)が行ってきた頂点パイプライン処理までをCompute Shaderで代行するような活用が始まっている。
Compute Shaderが便利なのは,あらゆるリソースに対し自在に読み書きできる点で,これは従来の頂点シェーダや「Geometry Shader」(ジオメトリシェーダ,以下カタカナ表記)にはない利点だ。
NPGPのスループットは動作クロックあたりでGPの2倍以上になるという
それに対して新設のPrimitive Shaderは,「頂点シェーダとジオメトリシェーダで行えること」に,Compute Shaderの汎用性を統合させたものになる。Primitive Shaderを活用することで「ジオメトリパイプラインそのものをプログラムできる」(Mantor氏)から,NPGPという名称になったわけである。
具体的な活用事例やアプリケーション側からの活用手法については正式発表を待ってほしいとのことだが,Primitive Shaderを使うことで,NVIDIAが2015年6月に発表したVR向けの不均衡解像度レンダリング「
Multi-Res Shading 」のようなことも高効率で行えるようになる見込みだ。
Vegaでは新しいプログラマブルシェーダとしてのPrimitive Shaderを導入する
2 つ め は ﹁ I n t e l l i g e n t W o r k g r o u p D i s t r i b u t o r ﹂ ︵ 以 下 , I W D ︶ で あ る 。
初 耳 と い う 読 者 も い る だ ろ う が , 実 の と こ ろ 筆 者 は , 連 載 バ ッ ク ナ ン バ ー で I W D に つ い て 解 説 済 み だ っ た り す る 。 ど こ で か と い う と , P l a y S t a t i o n 4 P r o ︵ 以 下 , P S 4 P r o ︶ の ハ ー ド ウ ェ ア に つ い て 解 説 し た 記 事 に お い て , で あ る ︵ 関 連 記 事 ︶ 。 P S 4 の G P U に は , V e g a の 機 能 が い く つ か 先 行 実 装 さ れ て い る の だ が , そ の 1 つ が こ の I W D ︵ 相 当 の 機 能 ︶ だ っ た の だ 。
IWDはVegaだけでなく,PS4 ProのGPUにも搭載されしている
I W D は , い わ ぱ , ジ オ メ ト リ エ ン ジ ン 側 の 機 能 強 化 に あ た る も の で , ジ オ メ ト リ タ ス ク を 最 も 高 効 率 で 実 行 で き る よ う 制 御 す る 仕 組 み と な る 。
上 で リ ン ク を 張 っ た P S 4 P r o 解 説 記 事 を 執 筆 し た 時 点 だ と , I W D に つ い て の 情 報 提 供 が そ れ ほ ど 詳 細 で な か っ た こ と か ら , 筆 者 は 推 測 ベ ー ス で 解 説 を 試 み た が , 残 念 な が ら , A M D T E C H S U M M I T の タ イ ミ ン グ で も そ れ ほ ど 詳 し い 内 容 は 出 て こ な か っ た 。 た だ , 先 の 記 事 で 推 測 し た こ と は ほ ぼ 正 解 だ っ た よ う で あ る 。
要 約 す れ ば , I W D は , ス レ ッ ド 発 行 先 と な る S h a d e r E n g i n e ︵ ≒ ミ ニ G P U ︶ の 選 択 を , 当 該 ス レ ッ ド の 実 行 を な る べ く 効 率 よ く 行 え る よ う 適 宜 選 択 す る 。 そ の と き , レ ジ ス タ フ ァ イ ル な ど の 有 限 リ ソ ー ス を 最 も 効 率 よ く 使 え る か 否 か を 考 慮 し , さ ら に メ モ リ ア ク セ ス が キ ャ ッ シ ュ ア ク セ ス で 済 む よ う な 配 慮 も 行 う ら し い 。
C o m p u t e U n i t は F P 1 6 と I N T 8 の P a c k e d 実 行 に 対 応
Compute Unitは新世代に
3 つ め は , C o m p u t e U n i t の 改 良 だ が , 実 は こ れ も P S 4 P r o 解 説 記 事 で 触 れ た 内 容 そ の も の で あ っ た 。
﹁ G r a p h i c s C o r e N e x t ﹂ ︵ 以 下 , G C N ︶ ア ー キ テ ク チ ャ を 採 用 す る G P U で は , 1 ク ロ ッ ク あ た り 16 個 の 3 2 b i t 単 浮 動 小 数 点 ︵ F P 3 2 ︶ の 積 和 算 を 行 え る S I M D - 1 6 ベ ク ト ル 演 算 器 を 4 個 ひ と か た ま り に し て , こ れ を 1 つ の 単 位 演 算 ユ ニ ッ ト た る C o m p u t e U n i t と し て 扱 っ て い る 。 ざ っ く り 言 え ば , C o m p u t e U n i t 1 基 で , 1 ク ロ ッ ク あ た り 64 個 の F P 3 2 積 和 算 ︵ 2 O p s ︶ を 実 行 で き る と い う こ と で あ る 。
V e g a で は , こ こ が 拡 張 と な り , 演 算 単 位 を 1 6 b i t 単 位 , も し く は 8 b i t 単 位 に 細 分 化 し て 行 え る よ う に な っ た 。 専 門 的 に い え ば P a c k e d 実 行 が 可 能 に な っ た と い う こ と で あ る 。
FP16がPacked実行できるようになった
たとえば半精度浮動小数点(FP16)であれば,Compute Unitあたり128個の積和算を1クロックあたりに実行できようになったのだ。8bit整数(INT8)であれば,さらにその倍の256個となる。
本文で触れた「1クロックでCompute Unitが実行できる積和算の数」よりもスライドにある数字が2倍になっているのは,積和算が2 Ops換算のため。Compute Unitあたり128個のFP16の積和算(2 Ops)を1クロックで実行できるから,256 FLOPSであり,スライドの表記はそれに基づいている
F P 1 6 や I N T 8 は ピ ク セ ル フ ォ ー マ ッ ト で 活 用 さ れ る 傾 向 に あ り , そ う し た テ ー マ の 演 算 で は , か な り の 性 能 向 上 を 期 待 で き る こ と に な る 。
な お , 倍 精 度 6 4 b i t 浮 動 小 数 点 ︵ F P 6 4 ︶ に 対 し て は , 製 品 種 別 ご と に コ ン フ ィ ギ ュ レ ー シ ョ ン が 可 能 だ と の こ と 。 G P G P U 専 用 の V e g a で あ れ ば F P 6 4 性 能 を 高 く 設 定 し て の 製 品 化 を 行 っ た り で き る と い う こ と な の だ ろ う 。
な お A M D は , 今 回 の V e g a で 仕 様 拡 張 さ れ た C o m p u t e U n i t を ﹁ N e x t - G e n e r a t i o n N e w C o m p u t e U n i t ﹂ ︵ 以 下 , N C U ︶ と 呼 ん で い る 。
FP16を対象したときの演算実行形態を比較したイメージ。CUとあるのが従来型Compute Unitで,下がNCUのものだ
Pixel Engineの改良
Vegaにおける技術ポイント,4つめはPixel Engine(≒ピクセルシェーダ)の改良だ。具体的には,「描画結果の書き込みにまつわる最適化」に関するものになる。
VegaではPixel Engineが新世代版に刷新される
今 日 ︵ こ ん に ち ︶ の レ ン ダ リ ン グ パ イ プ ラ イ ン で は ﹁ 頂 点 情 報 で し か な か っ た ポ リ ゴ ン に 対 し て ラ ス タ ラ イ ズ を 行 っ て ピ ク セ ル 単 位 に 分 解 し , そ の ピ ク セ ル 個 数 の 回 数 ピ ク セ ル シ ェ ー ダ を 起 動 。 そ こ で 陰 影 計 算 を 行 っ て , そ の 結 果 を メ モ リ に 書 き 込 む ﹂ と い う よ う な 実 行 の 流 れ に な っ て い る 。
し か し , 視 点 か ら 見 て 3 D 的 に 奥 の オ ブ ジ ェ ク ト は , せ っ か く ピ ク セ ル シ ェ ー ダ を 起 動 し て 計 算 し て 書 き 込 ん で も , そ れ よ り 手 前 に あ る オ ブ ジ ェ ク ト に よ っ て 上 書 き さ れ て し ま う 。 つ ま り , 上 書 き さ れ た 領 域 は , 視 点 か ら 見 え な く な る の で , そ の 箇 所 の 描 画 に 要 し た ピ ク セ ル シ ェ ー ダ の 演 算 コ ス ト は ﹁ 骨 折 り 損 ﹂ と い う こ と に な る 。
V e g a で は , こ の 骨 折 り 損 を 低 減 さ せ る た め に , ラ ス タ ラ イ ザ に 拡 張 を 施 し た と い う の だ 。
ど う い う 拡 張 か と い え ば , ラ ス タ ラ イ ザ に 専 用 キ ャ ッ シ ュ を 与 え , ﹁ 上 書 き さ れ る 見 込 み の ピ ク セ ル か ど う か ﹂ を こ の 段 階 で 判 断 し , 上 書 き さ れ る 見 込 み な ら ば 後 段 で ピ ク セ ル シ ェ ー ダ の 起 動 を 行 わ な い よ う 抑 制 す る 制 御 を 行 う 。 A M D は こ れ に ﹁ D r a w S t r e a m B i n n i n g R a s t e r i z e r ﹂ ︵ ド ロ ー ス ト リ ー ム ビ ニ ン グ ラ ス タ ラ イ ザ ︶ と い う 呼 び 名 を 与 え て い る 。
詳 し い 動 作 メ カ ニ ズ ム は 明 ら か に さ れ な か っ た が , お そ ら く I m a g i n a t i o n T e c h n o l o g i e s 製 G P U I P コ ア で あ る ﹁ P o w e r V R ﹂ の よ う な 振 る 舞 い を す る も の と 思 わ れ る 。
つ ま り , ラ ス タ ラ イ ザ 専 用 キ ャ ッ シ ュ と い う の は , あ る 程 度 の 大 き さ ︵ = タ イ ル サ イ ズ ︶ の Z バ ッ フ ァ 的 な も の で , ラ ス タ ラ イ ズ 時 に , す ぐ に は ピ ク セ ル シ ェ ー ダ を 起 動 せ ず , 一 定 量 の ポ リ ゴ ン を ラ ス タ ラ イ ズ し て か ら , こ の キ ャ ッ シ ュ 内 で Z テ ス ト を 行 い , こ れ を パ ス し た ピ ク セ ル に つ い て の み ピ ク セ ル シ ェ ー ダ を 起 動 す る の だ 。
P i x e l E n g i n e の キ ャ ッ シ ュ 関 連 だ と も う 1 つ , ユ ニ ー ク な ア ー キ テ ク チ ャ 改 変 が 入 っ て い る 。 ﹁ キ ャ ッ シ ュ メ モ リ の 階 層 構 造 ﹂ が 変 わ っ て い る の だ 。
従 来 の R a d e o n だ と , P i x e l E n g i n e ︵ = ピ ク セ ル シ ェ ー ダ ︶ の 書 き 込 ん だ ピ ク セ ル デ ー タ は R e n d e r B a c k - E n d ︵ レ ン ダ ー バ ッ ク エ ン ド , 以 下 カ タ カ ナ 表 記 ︶ 経 由 で メ モ リ コ ン ト ロ ー ラ を 介 し て メ モ リ に 出 力 す る 流 れ に な っ て い た 。
文 章 で 書 く と 当 た り 前 な の だ が , ポ イ ン ト は , ピ ク セ ル シ ェ ー ダ が 書 き 込 ん だ デ ー タ が L 2 キ ャ ッ シ ュ に は 載 ら な い と い う こ と だ 。 な の で , 次 の パ ス の レ ン ダ リ ン グ で , ﹁ い ま 書 き 込 ん だ デ ー タ ﹂ を 読 み 出 す と き に は , グ ラ フ ィ ッ ク ス メ モ リ か ら の 読 み 出 し に な っ て し ま う 。 同 じ 領 域 を 反 復 的 に 読 ん だ 場 合 は キ ャ ッ シ ュ に 載 る の で , そ の キ ャ ッ シ ュ ヒ ッ ト は 期 待 で き る が 。
従来のRadeonで,Pixel Engineからの出力はメモリコントローラ経由でそのままメモリへと出力されていたため,L2キャッシュに載ることがなかった
﹁ 一 度 描 画 し た も の を 次 の パ ス で す ぐ に 参 照 す る ﹂ と い う こ と 自 体 は , 近 代 ゲ ー ム グ ラ フ ィ ッ ク ス で は あ り ふ れ て い る 。 た と え ば , 一 度 , プ レ イ ヤ ー キ ャ ラ ク タ ー の 周 囲 を 環 境 マ ッ プ テ ク ス チ ャ と し て レ ン ダ リ ン グ し , こ れ を 次 の パ ス の レ ン ダ リ ン グ で テ ク ス チ ャ マ ッ ピ ン グ す る こ と で 映 り 込 み 表 現 を 行 う と い う の は , 代 表 的 な 事 例 だ と 言 え る だ ろ う 。
あ る い は , ﹁ U n r e a l E n g i n e 4 ﹂ を は じ め と す る 近 代 ゲ ー ム エ ン ジ ン が 採 用 す る D e f e r r e d R e n d e r i n g ︵ デ ィ フ ァ ー ド レ ン ダ リ ン グ ︶ 法 な ら , 描 画 す る 対 象 を 直 接 描 画 す る こ と な く , ま ず は 一 度 , 中 間 パ ラ メ ー タ を 画 面 座 標 系 で レ ン ダ リ ン グ し て , そ れ を 後 段 の シ ェ ー デ ィ ン グ フ ェ ー ズ で 参 照 し , 材 質 ご と の 陰 影 の 出 方 を 計 算 し て 解 決 し て い く わ け だ が , ま さ に こ れ も ﹁ レ ン ダ リ ン グ し た も の を す ぐ 後 段 で 活 用 す る ﹂ 事 例 の 1 つ だ と 言 え る 。
そ こ で V e g a の P i x e l E n g i n e は , こ う し た 近 代 レ ン ダ リ ン グ 手 法 に お け る 性 能 向 上 を 図 る べ く , ピ ク セ ル シ ェ ー ダ か ら の 出 力 , 正 確 を 期 せ ば レ ン ダ ー バ ッ ク エ ン ド か ら の 出 力 を L 2 キ ャ ッ シ ュ に 接 続 す る よ う に 改 良 し た の だ 。
こ う す る こ と で , い ま 述 べ た よ う な 事 例 に お い て , 直 前 の レ ン ダ リ ン グ で 出 力 し た デ ー タ が 高 確 率 で キ ャ ッ シ ュ に 載 る よ う に な り , 実 メ モ リ ア ク セ ス 量 が 減 り , 性 能 向 上 を 期 待 で き る よ う に な る 。
Pixel Engineからの出力がL2キャッシュに載りやすくなるよう,Vegaでは改良が入った。これはDeferred Renderingの性能向上にも貢献することが見込まれている
た だ , ピ ク セ ル シ ェ ー ダ か ら の 描 き 出 し デ ー タ 量 は 得 て し て 膨 大 に な る た め , す べ て の デ ー タ を L 2 キ ャ ッ シ ュ に 載 せ て し ま う と , 本 来 な ら ば も っ と 長 時 間 キ ャ ッ シ ュ に 載 っ て い て 欲 し い デ ー タ が キ ャ ッ シ ュ か ら 追 い 出 さ れ て し ま う 可 能 性 が あ る 。
こ れ に つ い て は , そ う な ら な い よ う , H B C C が 賢 い 制 御 を 行 う と い う こ と な の だ ろ う 。
S S D 搭 載 R a d e o n P r o は V e g a ベ ー ス で あ る こ と も 判 明 。 で , V e g a の 絶 対 性 能 は ?
今 回 の 先 行 技 術 説 明 会 を 通 じ て , ま だ ま だ 予 告 段 階 と い う 印 象 は 拭 え な か っ た が , そ れ で も キ ー ポ イ ン ト と な る 技 術 に つ い て の 説 明 は 一 通 り 入 っ た と 言 っ て い い の で は な か ろ う か 。
個 人 的 に は , グ ラ フ ィ ッ ク ス メ モ リ を 丸 ご と H B M 2 化 し た う え で , こ れ を シ ス テ ム ア ー キ テ ク チ ャ 上 は キ ャ ッ シ ュ メ モ リ と し て し ま う 発 想 は な か な か 面 白 い と 感 じ た 。
G P U か ら 見 て , シ ス テ ム メ イ ン メ モ リ は も ち ろ ん , S S D や ネ ッ ト ワ ー ク ス ト レ ー ジ す ら G P U メ モ リ と し て 透 過 的 に 取 り 扱 え る と い う 発 想 は , 地 味 な が ら も 革 新 的 な 発 明 だ 。 と い う か , こ れ か ら 主 流 に な る で あ ろ う , C P U と G P U の 統 合 型 コ ン ピ ュ ー テ ィ ン グ ア ー キ テ ク チ ャ に お い て , 必 要 不 可 欠 に な っ て く る ア イ デ ア だ と も い え る か も し れ な い 。
そ し て 次 期 A P U が , 今 回 の メ モ リ ア ー キ テ ク チ ャ 革 新 を 採 用 す る 確 率 も 高 い は ず だ 。
2016年8月のSIGGRAPH 2016会期中に発表されたRadeon Pro SSG。これはVega搭載製品だった
なお,これまで製品名だけで,その正体がよく分かっていなかった,異色の「SSD搭載GPU」こと「
Radeon Pro SSG 」だが,これは実のところ,Vegaベースのグラフィックスカードだということも,イベントで明らかになった。要するに,Vega特有のメモリアーキテクチャを活用し,SSDをGPUメモリとして取り扱えるように仕立て上げたものだというわけである。
AMD TECH SUMMITのデモルームでは,このRadeon Pro SSGを用い,リビングルームの3Dシーンをリアルタイムにレイトレーシングするデモが公開された。
Radeon Pro SSGによる「リアルタイムレイトレーシング」のデモ
VIDEO
このデモ,リアルタイムレイトレーシングとは言いつつも,シーン内の空間に伝搬する光の情報はすべて事前に計算済みで,その結果をRadeon Pro SSG上のSSDに記録しておき,ランタイムでは,SSDからその大局照明情報を読み出して適用しているだけなのだ。いわば,この3Dシーン内のオブジェクト界面上にやってくる全方位の光の情報を事前計算しているということである。言い換えれば,膨大な地点数の全方位環境マップデータを事前計算して持っているということである。
その事前計算済みの光の伝搬情報は,トータルで20GB以上にもなるそうだ。
事前計算しておいた巨大な大局照明データをRadeon Pro SSGのSSDに格納し,そのデータを利用して高速に大局照明付きのシーン描画を行うデモ
デモを実演する原田隆宏氏(Senior Member of Technical Staff, AMD)。AMD製GPUレイトレーシングエンジン「
Radeon Pro Render 」は,氏が中心になって開発を進めている
こ こ ま で 巨 大 に な る と , C P U 管 理 下 の シ ス テ ム メ イ ン メ モ リ 側 に 置 い て お く こ と も ま ま な ら な い い ほ ど の ビ ッ グ デ ー タ な わ け だ が , R a d e o n P r o S S G の 仕 組 み で あ れ ば , G P U は , そ の 瞬 間 の レ ン ダ リ ン グ に 必 要 な 分 だ け の デ ー タ を 読 み 出 し , そ れ を 適 切 に キ ャ ッ シ ュ し て い く こ と で , イ ン タ ラ ク テ ィ ブ レ ベ ル の レ ン ダ リ ン グ を 実 現 し て い る の で あ る 。
さ て , 読 者 が 一 番 に 気 に な っ て い る の は , そ ん な V e g a の 絶 対 性 能 で は な い だ ろ う か 。
昨 年 は , ハ イ エ ン ド G P U ク ラ ス に お い て は G e F o r c e G T X 1 0 シ リ ー ズ 一 強 状 態 が 続 い た だ け に , 2 0 1 7 年 は , V e g a を 武 器 と し た A M D の 巻 き 返 し が 期 待 さ れ る 。
A M D は 今 回 , 性 能 面 に 関 す る 言 及 を 避 け て い た が , 正 式 発 表 時 に は , も ち ろ ん そ う し た 情 報 も 明 ら か に な る は ず だ 。
今 か ら X - D A Y を 心 待 ち に し た い 。