一种批量最小二乘策略迭代方法
일충비량최소이승책략질대방법
Batch Least-squares Policy Iteration
저자의 최근 논문