Gymnasium/tests/experimental/wrappers/test_normalize_reward.py

"""Test suite for NormalizeRewardV0."""
import numpy as np

from gymnasium.core import ActType
from gymnasium.experimental.wrappers import NormalizeRewardV0
from tests.testing_env import GenericTestEnv


def _make_reward_env():
    """Function that returns a `GenericTestEnv` with reward=1."""

    def step_func(self, action: ActType):
        return self.observation_space.sample(), 1.0, False, False, {}

    return GenericTestEnv(step_func=step_func)


def test_normalize_reward_wrapper():
    """Tests that the NormalizeReward does not throw an error."""
    # TODO: Functional correctness should be tested
    env = _make_reward_env()
    wrapped_env = NormalizeRewardV0(env)
    wrapped_env.reset()
    _, reward, _, _, _ = wrapped_env.step(None)
    assert np.ndim(reward) == 0
    env.close()
Add wrappers to experimental (#201) 2022-12-10 22:04:14 +00:00			`"""Test suite for NormalizeRewardV0."""`
Fix experimental normalize reward wrapper (#277) Co-authored-by: raphajaner <raphael.trumpp@tum.de> 2023-01-20 15:25:31 +01:00			`import numpy as np`

			`from gymnasium.core import ActType`
			`from gymnasium.experimental.wrappers import NormalizeRewardV0`
			`from tests.testing_env import GenericTestEnv`


			`def _make_reward_env():`
			"""Function that returns a `GenericTestEnv` with reward=1."""

			`def step_func(self, action: ActType):`
			`return self.observation_space.sample(), 1.0, False, False, {}`

			`return GenericTestEnv(step_func=step_func)`


			`def test_normalize_reward_wrapper():`
			`"""Tests that the NormalizeReward does not throw an error."""`
			`# TODO: Functional correctness should be tested`
			`env = _make_reward_env()`
			`wrapped_env = NormalizeRewardV0(env)`
			`wrapped_env.reset()`
			`_, reward, _, _, _ = wrapped_env.step(None)`
			`assert np.ndim(reward) == 0`
			`env.close()`