MONTH

2023年8月

強化学習でProximal Policy Optimization（PPO）を実装する

GMOグローバルサイン・ホールディングスCTO室のZulfazli@zulfazlihussinです。私はhakaru.aiの開発チームにてAI開発を担当しております。今回は、強化学習の手法の中で、方策を学習する手法の一つであるProximal P […]