Exemplos de Environment em Java

Linguagem de programação: Java

Espaço para nome / nome do pacote: com.ideaheap.mdp.sim

Classe / Tipo: Environment

Exemplos em hotexamples.com: 2

Environment em Java - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de com.ideaheap.mdp.sim.Environment em Java extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

getRewardForPos(2)

isTerminalState(1)

Métodos Frequentes

getRewardForPos (2)

isTerminalState (1)

Relacionados

PushpinIF

Messages

GUI_ID

org.apache.hw_v4_1_0.hedwig.client.api.Client

GenericObjectEditor

Class

GridReplicatedLockFuture

ObjCRuntime

PyFunctionBuilder

ILayer

Related in langs

formateSize (PHP)

Good (PHP)

PrimitiveIsNegativeL1 (C#)

BattleTeamFightRecord (C#)

like (C++)

gwlist_destroy (C++)

NewTSDBQueueManager (Go)

IncomingWebhookListToJson (Go)

get_overcloud_endpoint (Python)

score (Python)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: Utility.java Projeto: nwertzberger/ai-class

public void updatePolicy(Policy policy, double discount) { double change; double maxError = MAX_ERROR * (1 - discount) / discount; do { change = 0; // Bellman step Utility u = new Utility(this); for (int y = 0; y < rows; y++) { for (int x = 0; x < cols; x++) { Pos p = new Pos(x, y); double reward = env.getRewardForPos(p); if (env.isTerminalState(p)) { util[y][x] = reward; } else { util[y][x] = reward + discount * policy.getAction(p).getProbableReward(p, u, env); } } } // get most changed for (int y = 0; y < rows; y++) { for (int x = 0; x < cols; x++) { double diff = Math.abs(util[y][x] - u.util[y][x]); if (diff > change) { change = diff; } } } } while (change > maxError); }

Exemplo n.º 2

0

Exibir arquivo

Arquivo: Utility.java Projeto: nwertzberger/ai-class

public Utility(Environment env) { this.rows = env.rows; this.cols = env.cols; this.env = env; util = new double[env.rows][env.cols]; for (int y = 0; y < env.rows; y++) { for (int x = 0; x < env.cols; x++) { util[y][x] = env.getRewardForPos(new Pos(x, y)); } } }