|
--- |
|
language: ko |
|
datasets: |
|
- investing_comments_krw |
|
metrics: |
|
- accuracy |
|
- precision |
|
- recall |
|
- f1 |
|
tags: |
|
- sentiment-analysis |
|
- finance |
|
- krw |
|
- binary-classification |
|
- emotion |
|
model-index: |
|
- name: FinBERT-Sentiment-KRW-Comment (v3) |
|
results: |
|
- task: |
|
type: text-classification |
|
name: Sentiment Analysis (Fear vs. Greed) |
|
metrics: |
|
- type: accuracy |
|
value: 0.94 |
|
- type: precision |
|
value: 0.94 |
|
- type: recall |
|
value: 0.94 |
|
- type: f1 |
|
value: 0.94 |
|
--- |
|
|
|
# FinBERT-Sentiment-KRW-Comment (v3) |
|
|
|
이 모델은 [`snunlp/KR-FinBERT-SC`](https://huggingface.co/snunlp/KR-FinBERT-SC)를 기반으로 파인튜닝한 한국어 금융 감정 분석 모델입니다. |
|
특히 **환율(FX) 관련 댓글**에서 나타나는 감정을 **공포(0)** 또는 **욕심(1)** 이진 분류하는 데 목적이 있습니다. |
|
|
|
## 🧾 라벨 정의 |
|
|
|
| 라벨 | 설명 | |
|
|------|------------| |
|
| 0 | 공포 (Fear) | |
|
| 1 | 욕심 (Greed) | |
|
|
|
## 🏋️♂️ 학습 정보 |
|
|
|
- **Base model**: `snunlp/KR-FinBERT-SC` |
|
- **Task**: 감정 이진 분류 (공포 vs 욕심) |
|
- **Input**: 한국어 댓글 (`content`) |
|
- **Output**: 0 또는 1 |
|
- **Training epochs**: 4 |
|
- **Train size**: 약 `X` 개 |
|
- **Eval size**: 약 `X` 개 |
|
- **Evaluation metric**: Accuracy, Precision, Recall, F1 |
|
|
|
### 📊 평가 결과 (Test Set 기준) |
|
|
|
| Metric | Score | |
|
|------------|-------| |
|
| Accuracy | 0.94 | |
|
| Precision | 0.94 | |
|
| Recall | 0.94 | |
|
| F1-score | 0.94 | |
|
|
|
> 공포(0): precision=0.95, recall=0.91, f1=0.93 |
|
> 욕심(1): precision=0.93, recall=0.96, f1=0.94 |
|
|
|
## 🧪 사용 예시 |
|
|
|
```python |
|
from transformers import pipeline |
|
|
|
pipe = pipeline("text-classification", model="DataWizardd/finbert-sentiment-krw-comment-v3") |
|
pipe("심상치 않네요 중동전쟁 발발하고 1월8일에 김정은이 미사일 실험하고 그러면 1170은 기본이고 1190원도 순식간일듯.") |
|
# → [{'label': '1', 'score': 0.98}] |
|
|