: neural network; NN[1][1][2] (: artificial neural network) 

[ 1]


 (axon)  (dendrite) [3](synapse)[3][1]Dendrite, Axon [1][ 2]

[1] [4][1][4]


[1]appleorange[1]調[1]調orange[1]  調[4]

: : 


[ 3]


19431949   "  " [5]


1970[5][5]1986  [5]













: Feed-forward Neural Network; FFN, FFNN[12]


: 1-layer 

: N-layer 

: N-layer c.f. recurrent CNN; RCNN





GRNNGeneral Regression Neural Network- RBF











2015NNQualcommSnapdragon 820[16][17]





23[ 5][18][19]


 §  § 


Autoregressive Generative Network § PixelCNNWaveNetWaveRNN=CNNWaveNet沿RNNWaveRNN




 (Generative Adversarial Network, GAN) A (Generator) BDCGANStyleGANBigGAN




Table. ニューラルネットワークの構成要素
総称/名称 概念 意図/効果
skip connection x = x + f(x) 勾配消失の防止 ResNet
アンサンブル学習 ResNet
位置情報の保持 U-Net
ボトルネック構造 Wshallow > Wmiddle < Wdeep 特徴抽出 AE
圧縮された潜在表現 generative AE
階層構造 middle(x) = f(x + bottom(x)) 局所/全体特徴の両立[20] U-Net GAN


cycle GB2A(GA2B(a)) = a コンテンツ/不変特徴の保持 CycleGAN
latent D(G(z)) = D(G(z+Δ)) 潜在変数ゆらぎへの堅牢性 ICR-BigGAN
データ拡張 D(Aug(x)) = D(x)

D(G(z)) = D(Aug(G(z)))

leakのないデータ拡張 CR-GAN


progressive output Size(Gt=0(x)) < Size(Gt=1(x)) 学習の高速化・安定化[21] PGGAN
input Input Complexity t0 < t1 学習の高速化・安定化 PA-GAN
正規化 batch y = γc Norm(x) + βc 学習の高速化
Conditional y = γcnl,s Norm(c) + βcnl,s スタイル変換
AdaIN y = σ(s) Norm(c) + μ(s) スタイル変換 StyleGAN
SPADE スタイル変換


: Batch Normalization[22]/BNμ, σ (β, γ)  y = γX+β

CNNLayer NormInstance NormGroup NormβγNN(β)NN(γ)



 (gradient-free method) [2]


 + ; [23]Level 2 BLAS Level 3 BLAS [24]


3  ReLU使




Python 3.5 Python @ **  * 
import numpy as np

dim_in = 1              # 入力は1次元
dim_out = 1             # 出力は1次元
hidden_count = 1024     # 隠れ層のノードは1024個
learn_rate = 0.005      # 学習率

# 訓練データはxは -1~1yは 2 * x ** 2 - 1
train_count = 64        # 訓練データ数
train_x = np.arange(-1, 1, 2 / train_count).reshape((train_count, dim_in))
train_y = np.array([2 * x ** 2 - 1 for x in train_x]).reshape((train_count, dim_out))

# 重みパラメータ。-0.5 〜 0.5 でランダムに初期化。この行列の値を学習する。
w1 = np.random.rand(hidden_count, dim_in) - 0.5
w2 = np.random.rand(dim_out, hidden_count) - 0.5
b1 = np.random.rand(hidden_count) - 0.5
b2 = np.random.rand(dim_out) - 0.5

# 活性化関数は ReLU
def activation(x):
    return np.maximum(0, x)

# 活性化関数の微分
def activation_dash(x):
    return (np.sign(x) + 1) / 2

# 順方向。学習結果の利用。
def forward(x):
    return w2 @ activation(w1 @ x + b1) + b2

# 逆方向。学習
def backward(x, diff):
    global w1, w2, b1, b2
    v1 = (diff @ w2) * activation_dash(w1 @ x + b1)
    v2 = activation(w1 @ x + b1)

    w1 -= learn_rate * np.outer(v1, x)  # outerは直積
    b1 -= learn_rate * v1
    w2 -= learn_rate * np.outer(diff, v2)
    b2 -= learn_rate * diff

# メイン処理
idxes = np.arange(train_count)          # idxes は 0~63
for epoc in range(1000):                # 1000エポック
    np.random.shuffle(idxes)            # 確率的勾配降下法のため、エポックごとにランダムにシャッフルする
    error = 0                           # 二乗和誤差
    for idx in idxes:
        y = forward(train_x[idx])       # 順方向でxからyを計算する
        diff = y - train_y[idx]         # 訓練データとの誤差
        error += diff ** 2              # 二乗和誤差に蓄積
        backward(train_x[idx], diff)    # 誤差を学習
    print(error.sum())                  # エポックごとに二乗和誤差を出力。徐々に減衰して0に近づく。


: inference




: Quantizationweightactivation[28][29]8-bitFP32INT8


: FP32INT8:IPC1AVX-FP32: 8AVX2-INT8: 32


: [31]


: -



: Static Quantization: [34]

: Dynamic Quantization: activationactivation[35]weight[36]

fake quantization (Quantize and DeQuantize; QDQ): +[37][38]


: Sparsification





: Pruning




(二)^ 11

(三)^ 2020

(四)^ RNN1stepGPU使

(五)^ BP使


