MONTH

2023年8月

  • 2023-08-03

強化学習でProximal Policy Optimization(PPO)を実装する

GMOグローバルサイン・ホールディングスCTO室のZulfazli@zulfazlihussinです。 私はhakaru.aiの開発チームにてAI開発を担当しております。今回は、強化学習の手法の中で、方策を学習する手法の一つであるProximal P […]