dyang39
/

InternVL-reasoning-4b

dyang39 commited on Apr 27

Commit

e5e1c6f

verified ·

1 Parent(s): ceff765

Upload configuration_internvl_chat.py with huggingface_hub

Files changed (1) hide show

configuration_internvl_chat.py CHANGED Viewed

@@ -6,12 +6,11 @@
 import copy
-from transformers import AutoConfig, LlamaConfig
 from transformers.configuration_utils import PretrainedConfig
 from transformers.utils import logging
 from .configuration_intern_vit import InternVisionConfig
-from .configuration_internlm2 import InternLM2Config
 logger = logging.get_logger(__name__)
@@ -43,14 +42,14 @@ class InternVLChatConfig(PretrainedConfig):
             logger.info('vision_config is None. Initializing the InternVisionConfig with default values.')
         if llm_config is None:
-            llm_config = {'architectures': ['InternLM2ForCausalLM']}
             logger.info('llm_config is None. Initializing the LlamaConfig config with default values (`LlamaConfig`).')
         self.vision_config = InternVisionConfig(**vision_config)
         if llm_config.get('architectures')[0] == 'LlamaForCausalLM':
             self.llm_config = LlamaConfig(**llm_config)
-        elif llm_config.get('architectures')[0] == 'InternLM2ForCausalLM':
-            self.llm_config = InternLM2Config(**llm_config)
         else:
             raise ValueError('Unsupported architecture: {}'.format(llm_config.get('architectures')[0]))
         self.use_backbone_lora = use_backbone_lora

 import copy
+from transformers import AutoConfig, LlamaConfig, Qwen2Config
 from transformers.configuration_utils import PretrainedConfig
 from transformers.utils import logging
 from .configuration_intern_vit import InternVisionConfig
 logger = logging.get_logger(__name__)
             logger.info('vision_config is None. Initializing the InternVisionConfig with default values.')
         if llm_config is None:
+            llm_config = {'architectures': ['Qwen2ForCausalLM']}
             logger.info('llm_config is None. Initializing the LlamaConfig config with default values (`LlamaConfig`).')
         self.vision_config = InternVisionConfig(**vision_config)
         if llm_config.get('architectures')[0] == 'LlamaForCausalLM':
             self.llm_config = LlamaConfig(**llm_config)
+        elif llm_config.get('architectures')[0] == 'Qwen2ForCausalLM':
+            self.llm_config = Qwen2Config(**llm_config)
         else:
             raise ValueError('Unsupported architecture: {}'.format(llm_config.get('architectures')[0]))
         self.use_backbone_lora = use_backbone_lora