- 2023-08-03
強化学習でProximal Policy Optimization(PPO)を実装する
GMOグローバルサイン・ホールディングスCTO室のZulfazli@zulfazlihussinです。 私はhakaru.aiの開発チームにてAI開発を担当しております。今回は、強化学習の手法の中で、方策を学習する手法の一つであるProximal P […]
GMOグローバルサイン・ホールディングスCTO室のZulfazli@zulfazlihussinです。 私はhakaru.aiの開発チームにてAI開発を担当しております。今回は、強化学習の手法の中で、方策を学習する手法の一つであるProximal P […]