The Wayback Machine - http://web.archive.org/web/20220709202125/https://www.cnblogs.com/pinard/
  XGBoostXGBoost使XGBoostPython XGBoostPython  XGBoost 1. XGBoost XGBoostPyth   
posted @ 2019-07-01 18:10 刘建平Pinard 阅读(51561) 评论(134) 推荐(18) 编辑
  (GBDT)GBDTXGBoostXGBoostGBDTGBDT XGBoostP  
posted @ 2019-06-05 20:36 刘建平Pinard 阅读(60102) 评论(198) 推荐(28) 编辑
  4    
posted @ 2019-05-27 17:19 刘建平Pinard 阅读(32897) 评论(25) 推荐(6) 编辑
  () 使使 使   
posted @ 2019-05-07 15:59 刘建平Pinard 阅读(40562) 评论(68) 推荐(22) 编辑
  () 使    
posted @ 2019-04-29 19:42 刘建平Pinard 阅读(31069) 评论(78) 推荐(15) 编辑
  () 9,     
posted @ 2019-04-26 18:42 刘建平Pinard 阅读(32733) 评论(44) 推荐(17) 编辑
  使 Matrix Caculas   
posted @ 2019-04-22 18:03 刘建平Pinard 阅读(50989) 评论(19) 推荐(42) 编辑
摘要: 在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。 本篇主要参考了AlphaGo Zero的论文, AlphaGo Zero综述和AlphaG 阅读全文
posted @ 2019-03-27 20:11 刘建平Pinard 阅读(30543) 评论(69) 推荐(14) 编辑
摘要: 在强化学习(十七) 基于模型的强化学习与Dyna算法框架中,我们讨论基于模型的强化学习方法的基本思路,以及集合基于模型与不基于模型的强化学习框架Dyna。本文我们讨论另一种非常流行的集合基于模型与不基于模型的强化学习方法:基于模拟的搜索(Simulation Based Search)。 本篇主要参 阅读全文
posted @ 2019-03-04 17:09 刘建平Pinard 阅读(40419) 评论(25) 推荐(4) 编辑
摘要: 在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Policy Based RL),本篇我们讨论最后一种强化学习流派,基于模型的强化学习(Model Based RL),以及基于模型的强化学习算法框架Dyna。 本篇主要参考了UCL强化学习课程的第8讲和Dy 阅读全文
posted @ 2019-02-15 20:22 刘建平Pinard 阅读(19639) 评论(26) 推荐(2) 编辑