change prints, max achieved throughput

2025-09-06 13:23:58 +00:00 · 2025-08-26 00:47:13 -07:00
parent cf368322bf
commit 8e6c2c2c20
11 changed files with 19 additions and 44 deletions
--- a/fle/env/gym_env/environment.py
+++ b/fle/env/gym_env/environment.py
@@ -10,7 +10,7 @@ from fle.env import FactorioInstance
 from fle.commons.models.game_state import GameState
 from fle.env.gym_env.action import Action
 from fle.commons.models.achievements import ProductionFlows
-from fle.env.utils.profits import get_achievements
+from fle.env.utils.achievements import calculate_achievements
 from fle.agents import Response, TaskResponse
 from fle.env.gym_env.observation import (
    Observation,
@@ -433,9 +433,7 @@ class FactorioGymEnv(gym.Env):
        output_game_state = GameState.from_instance(self.instance)
        # Get post-execution flows and calculate achievements
        current_flows = ProductionFlows.from_dict(namespace._get_production_stats())
-        achievements = get_achievements(
-            start_production_flows.__dict__, current_flows.__dict__
-        )
+        achievements = calculate_achievements(start_production_flows, current_flows)
        # Store for next step
        self._last_production_flows[agent_idx] = current_flows.__dict__

@@ -467,6 +465,7 @@ class FactorioGymEnv(gym.Env):
            "last_message_timestamp": self.last_message_timestamps[agent_idx],
            "task_verification": task_response,
            "output_game_state": output_game_state,
+            "achievements": achievements,
        }

        # pause the game until the next step if this is part of a trajectory
--- a/fle/env/gym_env/run_eval.py
+++ b/fle/env/gym_env/run_eval.py
@@ -1,4 +1,3 @@
-import argparse
 import asyncio
 import json
 import multiprocessing
@@ -129,18 +128,3 @@ async def main(config_path):
    # Wait for all processes to complete
    for p in processes:
        p.join()
-
-
-if __name__ == "__main__":
-    multiprocessing.set_start_method("spawn")
-    parser = argparse.ArgumentParser(
-        description="Run Factorio Learning Environment evaluation"
-    )
-    parser.add_argument(
-        "--run-config",
-        type=str,
-        required=True,
-        help="Path to run configuration JSON file",
-    )
-    args = parser.parse_args()
-    asyncio.run(main(args.run_config))
--- a/fle/env/gym_env/trajectory_logger.py
+++ b/fle/env/gym_env/trajectory_logger.py
@@ -107,6 +107,11 @@ class TrajectoryLogger:
            with open(obs_file, "w") as f:
                f.write(formatted_obs)

+        raw_text = agent.observation_formatter.format_raw_text(observation.raw_text)
+        for line in raw_text.split("\n"):
+            if "Error" in line:
+                print("raw_text Error:", line)
+
    def add_iteration_time(self, iteration_time: float):
        """Add an iteration time to the tracking list

--- a/fle/env/gym_env/trajectory_runner.py
+++ b/fle/env/gym_env/trajectory_runner.py
@@ -1,6 +1,6 @@
 import time
 from itertools import product
-from typing import List, Optional, Tuple
+from typing import Any, List, Dict, Optional, Tuple

 from fle.agents import CompletionReason, CompletionResult
 from fle.agents.gym_agent import GymAgent
@@ -67,11 +67,8 @@ class GymTrajectoryRunner:
        iteration_time = time.time() - iteration_start
        self.logger.add_iteration_time(iteration_time)

-        # Log progress every 10 steps
-        if agent_step % 10 == 0:
-            self.logger.log_progress(agent, agent_step, program.value)
-
-        # Log observation and program
+        # Log progress, observation and program
+        self.logger.log_progress(agent, agent_step, program.value)
        self.logger.log_observation_and_program(
            agent, agent_idx, agent_step, observation, program
        )
@@ -83,6 +80,7 @@ class GymTrajectoryRunner:
        reward: float,
        response: str,
        error_occurred: bool,
+        achievements: Dict[str, Any],
        game_state: GameState,
    ) -> Program:
        """Create a Program object from a Policy and environment results
@@ -114,6 +112,7 @@ class GymTrajectoryRunner:
            version_description=self.config.version_description,
            value=reward,
            state=game_state,
+            achievements=achievements,
            meta={
                "model": self.agents[agent_idx].model,
                "process_id": self.process_id,
@@ -214,6 +213,7 @@ class GymTrajectoryRunner:
                        reward=reward,
                        response=obs_dict["raw_text"],
                        error_occurred=info["error_occurred"],
+                        achievements=info["achievements"],
                        game_state=output_game_state,
                    )

--- a/fle/env/tools/agent/connect_entities/client.py
+++ b/fle/env/tools/agent/connect_entities/client.py
@@ -164,9 +164,6 @@ class ConnectEntities(Tool):
                real_world_sleep = (
                    ticks_added / 60 / game_speed if game_speed > 0 else 0
                )
-                print(
-                    f"connect_entities: Sleeping for {real_world_sleep:.3f} seconds ({ticks_added} ticks at speed {game_speed}x)"
-                )
                sleep(real_world_sleep)

        if dry_run:
--- a/fle/env/tools/agent/craft_item/client.py
+++ b/fle/env/tools/agent/craft_item/client.py
@@ -47,9 +47,6 @@ class CraftItem(Tool):
        if ticks_added > 0:
            game_speed = self.game_state.instance.get_speed()
            real_world_sleep = ticks_added / 60 / game_speed if game_speed > 0 else 0
-            print(
-                f"craft_item: Sleeping for {real_world_sleep:.3f} seconds ({ticks_added} ticks at speed {game_speed}x)"
-            )
            sleep(real_world_sleep)

        if not self.game_state.instance.fast:
--- a/fle/env/tools/agent/harvest_resource/client.py
+++ b/fle/env/tools/agent/harvest_resource/client.py
@@ -50,9 +50,6 @@ class HarvestResource(Tool):
        if ticks_added > 0:
            game_speed = self.game_state.instance.get_speed()
            real_world_sleep = ticks_added / 60 / game_speed if game_speed > 0 else 0
-            print(
-                f"harvest_resource: Sleeping for {real_world_sleep:.3f} seconds ({ticks_added} ticks at speed {game_speed}x)"
-            )
            sleep(real_world_sleep)

        if response != {} and response == 0 or isinstance(response, str):
--- a/fle/env/tools/agent/move_to/client.py
+++ b/fle/env/tools/agent/move_to/client.py
@@ -71,9 +71,6 @@ class MoveTo(Tool):
                real_world_sleep = (
                    ticks_added / 60 / game_speed if game_speed > 0 else 0
                )
-                print(
-                    f"move_to: Sleeping for {real_world_sleep:.3f} seconds ({ticks_added} ticks at speed {game_speed}x)"
-                )
                sleep(real_world_sleep)

            if isinstance(response, int) and response == 0:
--- a/fle/env/tools/agent/sleep/client.py
+++ b/fle/env/tools/agent/sleep/client.py
@@ -25,9 +25,6 @@ class Sleep(Tool):
        if ticks_added > 0:
            game_speed = self.game_state.instance.get_speed()
            real_world_sleep = ticks_added / 60 / game_speed if game_speed > 0 else 0
-            print(
-                f"sleep: Sleeping for {real_world_sleep:.3f} seconds ({ticks_added} ticks at speed {game_speed}x)"
-            )
            sleep(real_world_sleep)

        return True
--- a/fle/eval/algorithms/independent/gym_run_config.json
+++ b/fle/eval/algorithms/independent/gym_run_config.json
@@ -1,6 +1,6 @@
 [
    {
-        "env_id": "iron_ore_throughput",
-        "model": "claude-3-5-sonnet-latest"
+        "env_id": "steel_plate_throughput",
+        "model": "claude-4-opus-20250514"
    }
 ] 
--- a/fle/eval/tasks/throughput_task.py
+++ b/fle/eval/tasks/throughput_task.py
@@ -82,7 +82,9 @@ class ThroughputTask(TaskABC):
                break
        return TaskResponse(
            success=max_achieved_throughput >= self.quota,
-            meta={},
+            meta={
+                f"{self.throughput_entity}_achieved_throughput": max_achieved_throughput,
+            },
        )

    def _to_dict(self) -> Dict[str, Any]: