An empirical study of policy convergence in Markov decision process value iteration
Christopher W. Zobel, William T. SchererТом:
32
Рік:
2005
Мова:
english
Сторінки:
16
DOI:
10.1016/s0305-0548(03)00207-7
Файл:
PDF, 234 KB
english, 2005