強化学習 - Wikipedia

テクノロジーカテゴリーの変更を依頼記事元:

ja.wikipedia.org

23 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

komure0709 MDPやマルコフ決定過程で日本で求人検索しても、キーエンスしか見つからない。米国だと結構出てくる。

2019/06/12 リンク

komure0709 MDPやマルコフ決定過程で日本で求人検索しても、キーエンスしか見つからない。米国だと結構出てくる。

2019/06/12 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

強化学習 - Wikipedia

強化学習︵きょうかがくしゅう、英: reinforcement learning、RL︶は、ある環境内における知的エージェ... 強化学習︵きょうかがくしゅう、英: reinforcement learning、RL︶は、ある環境内における知的エージェントが、現在の状態を観測し、得られる収益︵累積報酬︶を最大化するために、どのような行動をとるべきかを決定する機械学習の一分野である。強化学習は、教師あり学習、教師なし学習と並んで、3つの基本的な機械学習パラダイムの一つである。強化学習が教師あり学習と異なる点は、ラベル付きの入力／出力の組を提示する必要がなく、最適でない行動を明示的に修正する必要もない。その代わり、未知の領域の探索と、現在の知識の活用の間のバランスを見つけることに重点が置かれる[1]。この文脈の強化学習アルゴリズムの多くは動的計画法を使用するため、この環境は通常マルコフ決定過程︵MDP︶として定式化される[2]。古典的な動的計画法と強化学習アルゴリズムとの主な違いは、後者はMDPの正確な数学的モデルの

ブックマークしたユーザー

mashana2023/12/18
komure07092019/06/12
mixedjuicegofyugofyu2019/01/03
John_Kawanishi2018/05/07
mimizukuma2017/10/22
miraishonen992017/09/02
ksd67002016/03/19
hiroomi2015/08/31
monnalisasmile2014/09/04
keiless_loss2014/06/27
nabinno2013/02/01
Azna012011/09/11
ommr292010/05/11
enemyoffreedom2008/08/18
goinger2008/07/22

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx