lab-v2 · devrz45 · Jul 18, 2023 · Jul 20, 2023 · Jul 20, 2023 · Jul 25, 2023
diff --git a/pyreason_gym/pyreason_grid_world/graph/game_graph.graphml b/pyreason_gym/pyreason_grid_world/graph/game_graph.graphml
@@ -7,12 +7,16 @@
   <key id="down" for="edge" attr.name="down" attr.type="long" />
   <key id="up" for="edge" attr.name="up" attr.type="long" />
   <key id="right" for="edge" attr.name="right" attr.type="long" />
+  <key id="blue-soldier-2" for="node" attr.name="blue-soldier-2" attr.type="long" />
+  <key id="red-soldier-2" for="node" attr.name="red-soldier-2" attr.type="long" />
   <key id="bullet" for="node" attr.name="bullet" attr.type="long" />
+  <key id="blue-soldier-1" for="node" attr.name="blue-soldier-1" attr.type="long" />
   <key id="teamBlue" for="node" attr.name="teamBlue" attr.type="long" />
   <key id="shootRightBlue" for="node" attr.name="shootRightBlue" attr.type="long" />
   <key id="shootLeftBlue" for="node" attr.name="shootLeftBlue" attr.type="long" />
   <key id="shootDownBlue" for="node" attr.name="shootDownBlue" attr.type="long" />
   <key id="shootUpBlue" for="node" attr.name="shootUpBlue" attr.type="long" />
+  <key id="red-soldier-1" for="node" attr.name="red-soldier-1" attr.type="long" />
   <key id="justDied" for="node" attr.name="justDied" attr.type="string" />
   <key id="teamRed" for="node" attr.name="teamRed" attr.type="long" />
   <key id="shootRightRed" for="node" attr.name="shootRightRed" attr.type="long" />
@@ -240,6 +244,7 @@
       <data key="shootRightRed">0</data>
       <data key="teamRed">1</data>
       <data key="justDied">0,0</data>
+      <data key="red-soldier-1">1</data>
     </node>
     <node id="blue-soldier-1">
       <data key="health">1</data>
@@ -253,6 +258,7 @@
       <data key="shootRightBlue">0</data>
       <data key="teamBlue">1</data>
       <data key="justDied">0,0</data>
+      <data key="blue-soldier-1">1</data>
     </node>
     <node id="red-bullet-1">
       <data key="teamRed">1</data>
@@ -262,6 +268,42 @@
       <data key="teamBlue">1</data>
       <data key="bullet">1</data>
     </node>
+    <node id="red-soldier-2">
+      <data key="health">1</data>
+      <data key="moveUp">0</data>
+      <data key="moveDown">0</data>
+      <data key="moveLeft">0</data>
+      <data key="moveRight">0</data>
+      <data key="shootUpRed">0</data>
+      <data key="shootDownRed">0</data>
+      <data key="shootLeftRed">0</data>
+      <data key="shootRightRed">0</data>
+      <data key="teamRed">1</data>
+      <data key="justDied">0,0</data>
+      <data key="red-soldier-2">1</data>
+    </node>
+    <node id="blue-soldier-2">
+      <data key="health">1</data>
+      <data key="moveUp">0</data>
+      <data key="moveDown">0</data>
+      <data key="moveLeft">0</data>
+      <data key="moveRight">0</data>
+      <data key="shootUpBlue">0</data>
+      <data key="shootDownBlue">0</data>
+      <data key="shootLeftBlue">0</data>
+      <data key="shootRightBlue">0</data>
+      <data key="teamBlue">1</data>
+      <data key="justDied">0,0</data>
+      <data key="blue-soldier-2">1</data>
+    </node>
+    <node id="red-bullet-2">
+      <data key="teamRed">1</data>
+      <data key="bullet">1</data>
+    </node>
+    <node id="blue-bullet-2">
+      <data key="teamBlue">1</data>
+      <data key="bullet">1</data>
+    </node>
     <edge source="0" target="1">
       <data key="right">1</data>
     </edge>
@@ -357,6 +399,9 @@
     <edge source="7" target="red-soldier-1">
       <data key="atLoc">1</data>
     </edge>
+    <edge source="7" target="red-soldier-2">
+      <data key="atLoc">1</data>
+    </edge>
     <edge source="8" target="9">
       <data key="right">1</data>
     </edge>
@@ -964,6 +1009,9 @@
     <edge source="56" target="blue-soldier-1">
       <data key="atLoc">1</data>
     </edge>
+    <edge source="56" target="blue-soldier-2">
+      <data key="atLoc">1</data>
+    </edge>
     <edge source="57" target="58">
       <data key="right">1</data>
     </edge>
@@ -1070,5 +1118,23 @@
     <edge source="blue-soldier-1" target="blue-bullet-1">
       <data key="bullet">1</data>
     </edge>
+    <edge source="red-soldier-2" target="red-base">
+      <data key="team">1</data>
+    </edge>
+    <edge source="red-soldier-2" target="7">
+      <data key="atLoc">1</data>
+    </edge>
+    <edge source="red-soldier-2" target="red-bullet-2">
+      <data key="bullet">1</data>
+    </edge>
+    <edge source="blue-soldier-2" target="blue-base">
+      <data key="team">1</data>
+    </edge>
+    <edge source="blue-soldier-2" target="56">
+      <data key="atLoc">1</data>
+    </edge>
+    <edge source="blue-soldier-2" target="blue-bullet-2">
+      <data key="bullet">1</data>
+    </edge>
   </graph>
 </graphml>
diff --git a/pyreason_gym/pyreason_grid_world/pyreason_grid_world.py b/pyreason_gym/pyreason_grid_world/pyreason_grid_world.py
@@ -11,14 +11,14 @@ def __init__(self, grid_size, num_agents_per_team):
 
         # Keep track of the next timestep to start
         self.next_time = 0
-        
+
         # Pyreason settings
         pr.settings.verbose = False
         pr.settings.atom_trace = False
         pr.settings.canonical = True
         pr.settings.inconsistency_check = False
         pr.settings.static_graph_facts = False
-        pr.settings.store_interpretation_changes = False
+        # pr.settings.store_interpretation_changes = True
         current_path = os.path.abspath(os.path.dirname(__file__))
 
         # Load the graph
@@ -49,20 +49,21 @@ def move(self, action):
                 fact_off = pr.fact_node.Fact(f'red_action_{i+1}_off', f'red-soldier-{i+1}', pr.label.Label(red_available_actions[a]), pr.interval.closed(0,0), self.next_time+1, self.next_time+1)
                 facts.append(fact_on)
                 facts.append(fact_off)
-    
+
         for i, a in enumerate(blue_team_actions):
             if a != 8:
                 fact_on = pr.fact_node.Fact(f'blue_action_{i+1}', f'blue-soldier-{i+1}', pr.label.Label(blue_available_actions[a]), pr.interval.closed(1,1), self.next_time, self.next_time)
                 fact_off = pr.fact_node.Fact(f'blue_action_{i+1}_off', f'blue-soldier-{i+1}', pr.label.Label(blue_available_actions[a]), pr.interval.closed(0,0), self.next_time+1, self.next_time+1)
                 facts.append(fact_on)
                 facts.append(fact_off)
-        
+
         self.interpretation = pr.reason(1, again=True, node_facts=facts)
+        # pr.save_rule_trace(self.interpretation)
         self.next_time = self.interpretation.time + 1
 
     def get_obs(self):
         observation = {'red_team': [], 'blue_team': [], 'red_bullets': [], 'blue_bullets': []}
-        
+
         # Gather bullet info for red and blue bullets
         (red_bullet_positions, blue_bullet_positions), (red_bullet_directions, blue_bullet_directions), (red_killed_who, blue_killed_who) = self._get_bullet_info()
         for red_pos, red_dir in zip(red_bullet_positions, red_bullet_directions):
@@ -99,14 +100,14 @@ def get_obs(self):
             observation['blue_team'].append({'pos': np.array(blue_pos_coords, dtype=np.int32), 'health': np.array([blue_health], dtype=np.float32), 'killed': list(blue_killed_who[i-1])})
 
         return observation
-    
+
     def get_obstacle_locations(self):
         # Return the coordinates of all the mountains in the grid to be able to draw them
         relevant_edges = [edge for edge in self.interpretation.edges if edge[1]=='mountain']
         obstacle_positions = [int(edge[0]) for edge in relevant_edges]
         obstacle_positions_coords = np.array([[pos%self.grid_size, pos//self.grid_size] for pos in obstacle_positions])
         return obstacle_positions_coords
-    
+
     def get_base_locations(self):
         # Return the locations of the two bases
         relevant_edges = [edge for edge in self.interpretation.edges if 'base' in edge[0]]
@@ -127,7 +128,8 @@ def _get_bullet_info(self):
         positions = (red_bullet_positions_coords, blue_bullet_positions_coords)
 
         # Get info about who killed whom. Stored in the form a list for every agent: (red-killer: [blue-casualties]) or (blue-killer: [red-casualties])
-        kill_info_edges = [edge for edge in self.interpretation.edges if pr.label.Label('killed') in self.interpretation.interpretations_edge[edge].world]
+        kill_info_edges = [edge for edge in self.interpretation.edges if pr.label.Label('killed') in self.interpretation.interpretations_edge[edge].world
+                           and self.interpretation.interpretations_edge[edge].world[pr.label.Label('killed')] == pr.interval.closed(1, 1)]
         kill_info_edges = sorted(kill_info_edges, key=lambda x: int(x[0][-1]))
         red_killed_who_tuple = [(int(edge[0][-1]), int(edge[1][-1])) for edge in kill_info_edges if 'red' in edge[0]]
         blue_killed_who_tuple = [(int(edge[0][-1]), int(edge[1][-1])) for edge in kill_info_edges if 'blue' in edge[0]]