spow12/MK_Nemo_12B

Model Description

This model is a Supervised fine-tuned version of mistralai/Mistral-Nemo-Instruct-2407 with DeepSpeed and trl for korean.

Merge methods.

models:
    - model: anthracite-org/magnum-v4-12b
    - model: mistralai/Mistral-Nemo-Instruct-2407
    - model: spow12/Mistral-Nemo-Instruct-2407_sft_ver_4.4(private)
    - model: werty1248/Mistral-Nemo-NT-Ko-12B-dpo
merge_method: model_stock
base_model: spow12/Mistral-Nemo-Instruct-2407_sft_ver_4.4(private)
dtype: bfloat16

Trained Data

  • Trained with public, private data (about 130K)

Usage

from transformers import TextStreamer, pipeline, AutoTokenizer, AutoModelForCausalLM

model_id = 'spow12/MK_Nemo_12B'
tokenizer = AutoTokenizer.from_pretrained(model_id)
# %%
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    attn_implementation="flash_attention_2",  #Optional
    device_map='auto',
)
model.eval()

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, device_map='auto')

generation_configs = dict(
    max_new_tokens=2048,
    num_return_sequences=1, 
    temperature=0.75,
    # repetition_penalty=1.1,
    do_sample=True,
    top_k=20,
    top_p=0.9,
    min_p=0.1,
    eos_token_id=tokenizer.eos_token_id,
    pad_token_id=tokenizer.eos_token_id,
    streamer = TextStreamer(tokenizer) # Optional, if you want to use streamer, you have to set num_beams=1
)

sys_message = """당신은 친절한 챗봇으로서 상대방의 요청에 최대한 자세하고 친절하게 답해야합니다. 
사용자가 제공하는 정보를 세심하게 분석하여 사용자의 의도를 신속하게 파악하고 그에 따라 답변을 생성해야합니다.  

항상 매우 자연스러운 한국어로 응답하세요."""

message = [
    {
        'role': "system",
        'content': sys_message
    },
    {
        'role': 'user',
        'content': "현재의 경제상황에 대해 어떻게 생각해?."
    }
]
conversation = pipe(message, **generation_configs)
conversation[-1]

#output
현재의 경제상황은 각국마다 다르며, 전반적으로는 코로나19 팬데믹의 영향으로 큰 타격을 받은 상태입니다. 많은 국가에서 경제 성장률이 감소하고 실업률이 상승했습니다. 그러나 각국 정부는 재정과 통화 정책을 통해 경제를 지지하고 복구하기 위해 노력하고 있습니다. 코로나19 백신의 개발과 배포가 경제 회복에 도움이 될 것으로 기대되고 있습니다. 그러나 코로나19 이전의 경제 성장률을 회복하기 위해서는 시간이 걸릴 수 있습니다. 장기적으로는 저성장과 고인플레이션이 계속될 수 있는 위험도 있습니다. 따라서 각국은 코로나19 이후의 세계에서 새로운 경제 모델을 모색하고, 디지털화와 녹색 경제 전환을 가속화하는 등 미래에 대비하는 노력이 필요합니다.
Downloads last month
1,896
Safetensors
Model size
12.2B params
Tensor type
BF16
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for spow12/MK_Nemo_12B

Collection including spow12/MK_Nemo_12B