package fehu

You can search for identifiers within the package.

in-package search v0.2.0

fehu
- CHANGES
- README
- Library fehu
  - Fehu
    
    Errors
    
    Info
    
    Metadata
    
    Render
    
    Pixel
    
    Space
    
    Value
    
    Discrete
    
    Box
    
    Multi_binary
    
    Multi_discrete
    
    Tuple
    
    Dict
    
    Sequence
    
    Text
    
    Env
    
    Wrapper
    
    Vector_env
    
    Buffer
    
    Replay
    
    Rollout
    
    Training
    
    Policy
    
    Trajectory
- Library fehu.algorithms
  - Fehu_algorithms
    
    Reinforce
    
    Dqn
- Library fehu.envs
  - Fehu_envs
    
    Random_walk
    
    Grid_world
    
    Cartpole
    
    Mountain_car
- Library fehu.visualize
  - Fehu_visualize
    
    Overlay
    
    Video
    
    Sink
- Sources
  - fehu
    
    buffer.ml
    
    env.ml
    
    errors.ml
    
    fehu.ml
    
    fehu__.ml
    
    info.ml
    
    metadata.ml
    
    policy.ml
    
    render.ml
    
    space.ml
    
    training.ml
    
    trajectory.ml
    
    vector_env.ml
    
    wrapper.ml
  - fehu.algorithms
    
    dqn.ml
    
    fehu_algorithms.ml
    
    fehu_algorithms__.ml
    
    reinforce.ml
  - fehu.envs
    
    cartpole.ml
    
    fehu_envs.ml
    
    fehu_envs__.ml
    
    grid_world.ml
    
    mountain_car.ml
    
    random_walk.ml
  - fehu.visualize
    
    fehu_visualize.ml
    
    fehu_visualize__.ml
    
    overlay.ml
    
    sink.ml
    
    utils.ml
    
    wrapper_video.ml

Legend:
Page
Library
Module
Module type
Parameter
Class
Class type
Source

Module `Fehu_algorithms.Dqn`Source

Dqn algorithm implementation.

DQN (Deep Q-Network) is an off-policy value-based method that uses experience replay and target networks for stable training. It learns Q-values for discrete actions and selects actions greedily. See Dqn for detailed documentation.

Deep Q-Network (DQN) training API.

Sourcetype config = {

learning_rate : float;
gamma : float;
epsilon_start : float;
epsilon_end : float;
epsilon_decay : float;
batch_size : int;
buffer_capacity : int;
target_update_freq : int;
warmup_steps : int;

}

Sourceval default_config : config

Sourcetype params = Kaun.Ptree.t

Sourcetype metrics = {

loss : float;
avg_q_value : float;
epsilon : float;
episode_return : float option;
episode_length : int option;
total_steps : int;
total_episodes : int;

}

Sourcetype state

Source

val init : 
  env:
    ((float, Bigarray.float32_elt) Rune.t,
      (int32, Bigarray.int32_elt) Rune.t,
      'render)
      Fehu.Env.t ->
  q_network:Kaun.module_ ->
  rng:Rune.Rng.key ->
  config:config ->
  params * state

Source

val step : 
  env:
    ((float, Bigarray.float32_elt) Rune.t,
      (int32, Bigarray.int32_elt) Rune.t,
      'render)
      Fehu.Env.t ->
  params:params ->
  state:state ->
  params * state

Sourceval metrics : state -> metrics

Latest metrics gathered after step.

Source

val train : 
  env:
    ((float, Bigarray.float32_elt) Rune.t,
      (int32, Bigarray.int32_elt) Rune.t,
      'render)
      Fehu.Env.t ->
  q_network:Kaun.module_ ->
  rng:Rune.Rng.key ->
  config:config ->
  total_timesteps:int ->
  ?callback:(metrics -> [ `Continue | `Stop ]) ->
  unit ->
  params * state

Sourceval save : path:string -> params:params -> state:state -> unit

Source

val load : 
  path:string ->
  env:
    ((float, Bigarray.float32_elt) Rune.t,
      (int32, Bigarray.int32_elt) Rune.t,
      'render)
      Fehu.Env.t ->
  q_network:Kaun.module_ ->
  config:config ->
  (params * state, string) result

package fehu

Module Fehu_algorithms.DqnSource

Module `Fehu_algorithms.Dqn`Source