DataWizardd's picture
Update README.md
d578662 verified
metadata
language: ko
datasets:
  - investing_comments_krw
metrics:
  - accuracy
  - precision
  - recall
  - f1
tags:
  - sentiment-analysis
  - finance
  - krw
  - binary-classification
  - emotion
model-index:
  - name: FinBERT-Sentiment-KRW-Comment (v3)
    results:
      - task:
          type: text-classification
          name: Sentiment Analysis (Fear vs. Greed)
        metrics:
          - type: accuracy
            value: 0.94
          - type: precision
            value: 0.94
          - type: recall
            value: 0.94
          - type: f1
            value: 0.94

FinBERT-Sentiment-KRW-Comment (v3)

이 모델은 snunlp/KR-FinBERT-SC를 기반으로 파인튜닝한 한국어 금융 감정 분석 모델입니다.
특히 환율(FX) 관련 댓글에서 나타나는 감정을 공포(0) 또는 욕심(1) 이진 분류하는 데 목적이 있습니다.

🧾 라벨 정의

라벨 설명
0 공포 (Fear)
1 욕심 (Greed)

🏋️‍♂️ 학습 정보

  • Base model: snunlp/KR-FinBERT-SC
  • Task: 감정 이진 분류 (공포 vs 욕심)
  • Input: 한국어 댓글 (content)
  • Output: 0 또는 1
  • Training epochs: 4
  • Train size: 약 X
  • Eval size: 약 X
  • Evaluation metric: Accuracy, Precision, Recall, F1

📊 평가 결과 (Test Set 기준)

Metric Score
Accuracy 0.94
Precision 0.94
Recall 0.94
F1-score 0.94

공포(0): precision=0.95, recall=0.91, f1=0.93
욕심(1): precision=0.93, recall=0.96, f1=0.94

🧪 사용 예시

from transformers import pipeline

pipe = pipeline("text-classification", model="DataWizardd/finbert-sentiment-krw-comment-v3")
pipe("심상치 않네요 중동전쟁 발발하고 1월8일에 김정은이 미사일 실험하고 그러면 1170은 기본이고 1190원도 순식간일듯.")
# → [{'label': '1', 'score': 0.98}]