yiliu30 · yiliu30 · Sep 25, 2025 · Oct 17, 2025 · gemini-code-assist · Sep 25, 2025
diff --git a/examples/parse_metadata.py b/examples/parse_metadata.py
@@ -5,7 +5,8 @@
 
 def parse_safetensors(folder: str, output_csv: str):
     rows = []
-
+
+    fp8_tensors_name = set()
     for root, _, files in os.walk(folder):
         for file in files:
             if file.endswith(".safetensors"):
@@ -15,26 +16,46 @@ def parse_safetensors(folder: str, output_csv: str):
                     with safe_open(file_path, framework="pt") as f:
                         keys = list(f.keys())
                         print(f"  Found {len(keys)} tensors")
+
                         for tensor_name in keys:
                             tensor = f.get_tensor(tensor_name)
                             dtype = str(tensor.dtype)
                             shape = list(tensor.shape)
-
+                            if dtype == "torch.float8_e4m3fn":
+                                fp8_tensors_name.add(tensor_name)
+                            tensor_min, tensor_max = "N/A", "N/A"
+                            try:
+                                tensor_min, tensor_max = tensor.min().item(), tensor.max().item()
+                            except:
+                                pass
+                            tensor_min, tensor_max = str(tensor_min), str(tensor_max)
-                            tensor_min, tensor_max = "N/A", "N/A"
-                            try:
-                                tensor_min, tensor_max = tensor.min().item(), tensor.max().item()
-                            except:
-                                pass
-                            tensor_min, tensor_max = str(tensor_min), str(tensor_max)
+                            try:
+                                tensor_min = str(tensor.min().item())
+                                tensor_max = str(tensor.max().item())
+                            except Exception:
+                                tensor_min, tensor_max = "N/A", "N/A"
-                            tensor_min, tensor_max = "N/A", "N/A"
-                            try:
-                                tensor_min, tensor_max = tensor.min().item(), tensor.max().item()
-                            except:
-                                pass
-                            tensor_min, tensor_max = str(tensor_min), str(tensor_max)
+                            try:
+                                tensor_min = str(tensor.min().item())
+                                tensor_max = str(tensor.max().item())
+                            except Exception:
+                                tensor_min, tensor_max = "N/A", "N/A"
                             rows.append({
                                 "file": os.path.relpath(file_path, folder),
                                 "tensor": tensor_name,
                                 "dtype": dtype,
-                                "shape": str(shape)
+                                "shape": str(shape),
+                                "min": tensor_min,
+                                "max": tensor_max
                             })
+                            # breakpoint()
                 except Exception as e:
                     print(f"  Error reading {file_path}: {e}")
 
     print(f"\nSaving results to {output_csv} ...")
     with open(output_csv, "w", newline="") as csvfile:
-        writer = csv.DictWriter(csvfile, fieldnames=["file", "tensor", "dtype", "shape"])
+        writer = csv.DictWriter(csvfile, fieldnames=["file", "tensor", "dtype", "shape", "min", "max"])
         writer.writeheader()
         writer.writerows(rows)
     print("Done ✅")
+    # show all fp8 tensors, ignore the layer index 
+    filtered_fp8_tensors = set()
+    for name in fp8_tensors_name:
+        filtered_name = name
+        for idx in range(200):
+            filtered_name = filtered_name.replace(f".{idx}.", ".*.")
+        filtered_fp8_tensors.add(filtered_name)
-    filtered_fp8_tensors = set()
-    for name in fp8_tensors_name:
-        filtered_name = name
-        for idx in range(200):
-            filtered_name = filtered_name.replace(f".{idx}.", ".*.")
-        filtered_fp8_tensors.add(filtered_name)
+    filtered_fp8_tensors = {re.sub(r'\.\d+\.', '.*.', name) for name in fp8_tensors_name}
-    filtered_fp8_tensors = set()
-    for name in fp8_tensors_name:
-        filtered_name = name
-        for idx in range(200):
-            filtered_name = filtered_name.replace(f".{idx}.", ".*.")
-        filtered_fp8_tensors.add(filtered_name)
+    filtered_fp8_tensors = {re.sub(r'\.\d+\.', '.*.', name) for name in fp8_tensors_name}
+    for name in sorted(filtered_fp8_tensors):
+        print(name)
 
 
 if __name__ == "__main__":