MediaTek-Research
/

Llama-Breeze2-8B-Instruct

Model card Files Files and versions Community

YC-Chen commited on Jan 23

Commit

bfffb35

·

verified ·

1 Parent(s): d0b8862

Update modeling_internvl_chat.py

Files changed (1) hide show

modeling_internvl_chat.py +2 -2

modeling_internvl_chat.py CHANGED Viewed

@@ -38,7 +38,7 @@ class InternVLChatModel(PreTrainedModel):
     _supports_flash_attn_2 = True
     _no_split_modules = ['InternVisionModel', 'LlamaDecoderLayer', 'Qwen2DecoderLayer', 'MistralDecoderLayer']
-    def __init__(self, config: InternVLChatConfig, vision_model=None, language_model=None, use_flash_attn=True):
         super().__init__(config)
         assert version_cmp(transformers.__version__, '4.37.0', 'ge')
@@ -81,7 +81,7 @@ class InternVLChatModel(PreTrainedModel):
             nn.Linear(llm_hidden_size, llm_hidden_size)
         )
-        self.img_context_token_id = None
         self.mr_prompt = MRPromptV3()
     def forward(

     _supports_flash_attn_2 = True
     _no_split_modules = ['InternVisionModel', 'LlamaDecoderLayer', 'Qwen2DecoderLayer', 'MistralDecoderLayer']
+    def __init__(self, config: InternVLChatConfig, vision_model=None, language_model=None, use_flash_attn=True, img_context_token_id=None):
         super().__init__(config)
         assert version_cmp(transformers.__version__, '4.37.0', 'ge')
             nn.Linear(llm_hidden_size, llm_hidden_size)
         )
+        self.img_context_token_id = img_context_token_id
         self.mr_prompt = MRPromptV3()
     def forward(