モデルベース強化学習

どなたかモデルベース強化学習について加筆して下さい。