package fehu

You can search for identifiers within the package.

in-package search v0.2.0

Reinforcement learning for OCaml

Install

dune-project

Dependency

github.com Readme Changelog Edit opam file Versions (3)

Authors

Thibaut Mattio

Maintainers

Thibaut Mattio

Sources

raven-1.0.0.alpha3.tbz

sha256=96d35ce03dfbebd2313657273e24c2e2d20f9e6c7825b8518b69bd1d6ed5870f

sha512=90c5053731d4108f37c19430e45456063e872b04b8a1bbad064c356e1b18e69222de8bfcf4ec14757e71f18164ec6e4630ba770dbcb1291665de5418827d1465

doc/fehu.envs/Fehu_envs/Random_walk/index.html

Module `Fehu_envs.Random_walk`Source

One-dimensional random walk.

The agent moves left or right on a line bounded by [-10; 10]. Reward is - |position|. Episodes terminate when the agent reaches a boundary or after 200 steps.

Observation: Fehu.Space.spec.Box of shape [1] in [-10.0; 10.0].

Actions: Fehu.Space.spec.Discrete 2 -- 0 = left, 1 = right.

Render modes: ansi.

Sourcetype obs = (float, Nx.float32_elt) Nx.t

Sourcetype act = (int32, Nx.int32_elt) Nx.t

Sourcetype render = string

Source

val make : 
  ?render_mode:Fehu.Env.render_mode ->
  unit ->
  (obs, act, render) Fehu.Env.t

make () is a random walk environment.