modelscope · Yunnglin · Aug 26, 2025 · gemini-code-assist · Aug 26, 2025 · gemini-code-assist
diff --git a/evalscope/api/model/model.py b/evalscope/api/model/model.py
@@ -362,7 +362,7 @@ def get_model(
 
     logger.info(
         f'Creating model {model} with eval_type={eval_type} '
-        f'base_url={base_url}, api_key={api_key}, config={config}, model_args={model_args}'
+        f'base_url={base_url}, config={config}, model_args={model_args}'
     )
 
     # find a matching model type

diff --git a/evalscope/backend/rag_eval/utils/clip.py b/evalscope/backend/rag_eval/utils/clip.py
@@ -81,8 +81,8 @@ def __init__(
             model_name = download_model(self.model_name, self.revision)
 
         # Load the model and processor
-        self.model = AutoModel.from_pretrained(model_name).to(self.device)
-        self.processor = AutoProcessor.from_pretrained(model_name)
+        self.model = AutoModel.from_pretrained(model_name, trust_remote_code=True).to(self.device)
+        self.processor = AutoProcessor.from_pretrained(model_name, trust_remote_code=True)
         self.transform = self.processor.image_processor
         self.tokenizer = self.processor.tokenizer
 

diff --git a/evalscope/benchmarks/needle_haystack/needle_haystack_adapter.py b/evalscope/benchmarks/needle_haystack/needle_haystack_adapter.py
@@ -118,7 +118,7 @@ def _init_length(self):
     def _init_tokenizer(self):
         """ Initialize the tokenizer based on the provided tokenizer path."""
         from modelscope import AutoTokenizer
-        self.tokenizer = AutoTokenizer.from_pretrained(self.tokenizer_path)
+        self.tokenizer = AutoTokenizer.from_pretrained(self.tokenizer_path, trust_remote_code=True)
 
     def load(self):
         """Load dataset from local disk or remote."""

diff --git a/evalscope/metrics/t2v_metrics/models/clipscore_models/pickscore_model.py b/evalscope/metrics/t2v_metrics/models/clipscore_models/pickscore_model.py
@@ -24,8 +24,9 @@ def load_model(self):
         # model_pretrained_name_or_path = "yuvalkirstain/PickScore_v1"
         model_pretrained_name_or_path = 'AI-ModelScope/PickScore_v1'  # modelscope model
 
-        self.processor = AutoProcessor.from_pretrained(processor_name_or_path)
-        self.model = AutoModel.from_pretrained(model_pretrained_name_or_path).eval().to(self.device)
+        self.processor = AutoProcessor.from_pretrained(processor_name_or_path, trust_remote_code=True)
+        self.model = AutoModel.from_pretrained(model_pretrained_name_or_path,
+                                               trust_remote_code=True).eval().to(self.device)
 
     def load_images(self, image: List[str]) -> torch.Tensor:
         """Load the image(s), and return a tensor (no preprocessing!!) put on self.device

diff --git a/evalscope/metrics/t2v_metrics/models/itmscore_models/fga_blip2_model.py b/evalscope/metrics/t2v_metrics/models/itmscore_models/fga_blip2_model.py
@@ -37,7 +37,9 @@ def load_model(self):
         from ..utils import download_file
 
         # load tokenizer
-        self.tokenizer = AutoTokenizer.from_pretrained('AI-ModelScope/bert-base-uncased', truncation_side='right')
+        self.tokenizer = AutoTokenizer.from_pretrained(
+            'AI-ModelScope/bert-base-uncased', truncation_side='right', trust_remote_code=True
+        )
         self.tokenizer.add_special_tokens({'bos_token': '[DEC]'})
         # load model
         self.variant = FGA_BLIP2_MODELS[self.model_name]['variant']

diff --git a/evalscope/metrics/t2v_metrics/models/itmscore_models/image_reward/blip_pretrain.py b/evalscope/metrics/t2v_metrics/models/itmscore_models/image_reward/blip_pretrain.py
@@ -10,7 +10,7 @@
 
 
 def init_tokenizer():
-    tokenizer = AutoTokenizer.from_pretrained('AI-ModelScope/bert-base-uncased')
+    tokenizer = AutoTokenizer.from_pretrained('AI-ModelScope/bert-base-uncased', trust_remote_code=True)
     tokenizer.add_special_tokens({'bos_token': '[DEC]'})
     tokenizer.add_special_tokens({'additional_special_tokens': ['[ENC]']})
     tokenizer.enc_token_id = tokenizer.additional_special_tokens_ids[0]

diff --git a/evalscope/metrics/t2v_metrics/models/vqascore_models/lavis/models/blip_models/blip.py b/evalscope/metrics/t2v_metrics/models/vqascore_models/lavis/models/blip_models/blip.py
@@ -20,7 +20,7 @@ class BlipBase(BaseModel):
 
     @classmethod
     def init_tokenizer(cls):
-        tokenizer = AutoTokenizer.from_pretrained('AI-ModelScope/bert-base-uncased')
+        tokenizer = AutoTokenizer.from_pretrained('AI-ModelScope/bert-base-uncased', trust_remote_code=True)
         tokenizer.add_special_tokens({'bos_token': '[DEC]'})
         tokenizer.add_special_tokens({'additional_special_tokens': ['[ENC]']})
         tokenizer.enc_token_id = tokenizer.additional_special_tokens_ids[0]

diff --git a/evalscope/metrics/t2v_metrics/models/vqascore_models/mm_utils.py b/evalscope/metrics/t2v_metrics/models/vqascore_models/mm_utils.py
@@ -81,7 +81,7 @@ def load_pretrained_model(
 
     from ..utils import download_file
 
-    tokenizer = AutoTokenizer.from_pretrained(tokenizer_path, **tokenizer_dict)
+    tokenizer = AutoTokenizer.from_pretrained(tokenizer_path, trust_remote_code=True, **tokenizer_dict)
     # tokenizer.pad_token = tokenizer.unk_token # could be redundant
 
     model_path = download_file(model_path, cache_dir=cache_dir)

diff --git a/evalscope/perf/plugin/api/custom_api.py b/evalscope/perf/plugin/api/custom_api.py
@@ -31,7 +31,7 @@ def __init__(self, param: Arguments):
         super().__init__(param=param)
         if param.tokenizer_path is not None:
             from modelscope import AutoTokenizer
-            self.tokenizer = AutoTokenizer.from_pretrained(param.tokenizer_path)
+            self.tokenizer = AutoTokenizer.from_pretrained(param.tokenizer_path, trust_remote_code=True)
         else:
             self.tokenizer = None
 

diff --git a/evalscope/perf/plugin/api/openai_api.py b/evalscope/perf/plugin/api/openai_api.py
@@ -25,7 +25,7 @@ def __init__(self, param: Arguments):
         super().__init__(param=param)
         if param.tokenizer_path is not None:
             from modelscope import AutoTokenizer
-            self.tokenizer = AutoTokenizer.from_pretrained(param.tokenizer_path)
+            self.tokenizer = AutoTokenizer.from_pretrained(param.tokenizer_path, trust_remote_code=True)
         else:
             self.tokenizer = None
 

diff --git a/evalscope/third_party/thinkbench/eval.py b/evalscope/third_party/thinkbench/eval.py
@@ -24,7 +24,7 @@ def __init__(self, report_path, tokenizer_path, model_name, dataset_name, subset
         self.switch_tokens = ['alternatively', 'but wait', 'let me reconsider', 'another way', 'another approach', 'another method', 'another angle']
         self.subset_dict = defaultdict(lambda: defaultdict(list))
         self.think_end_token = '</think>'
-        self.tokenizer = AutoTokenizer.from_pretrained(tokenizer_path)
+        self.tokenizer = AutoTokenizer.from_pretrained(tokenizer_path, trust_remote_code=True)
         self.model_name = model_name
         self.dataset_name = dataset_name
         self.subsets = subsets