ConvNext_Multi 모델 카드

_Last updated: 2025-09-25 08:56:58

최신 업데이트 내역

  • 핵심 수정사항: 마늘 데이터셋 기반 사전 학습 모델에 대해 양파 생육 단계별 스펙트럼 특성을 반영한 전처리 파이프라인 및 하이퍼파라미터 최적화(학습률·배치 크기·스케줄러 등)를 적용

  • 개선사항: 양파 생육 상태 분류 정확도 및 일반화 성능 향상을 확인하였으며, 작물별 분광 반응 특성을 차별적으로 반영

  • 추가 학습: 양파 전용 멀티스펙트럼 데이터셋(Blue, Green, Red, NIR, RedEdge)을 활용한 재학습 과정을 수행하여, 드론·위성 영상 기반 작물 모니터링의 적용 가능성 확대

  • 도메인 확장: 기존 마늘 중심의 모델을 양파 작물 생육 분석까지 확장함으로써, 다중 작물 대상 정밀 농업(Precision Agriculture) 활용성 강화

Model Details

ConvNext_Multi는 다중분광(멀티스펙트럼) 영상 데이터를 입력으로 하여 작물 및 식생을 분류하는 ConvNeXt 기반 이미지 분류 모델입니다. 드론 및 위성에서 촬영한 5밴드 (Blue, Green, Red, Near-Infrared, RedEdge) 영상을 효율적으로 처리하도록 설계되어, 고해상도 농업·환경 모니터링에 적합합니다.

  • Developed by: AI Research Team, MuhanRnd
  • License: MIT
  • Base model: facebook/convnext-tiny-224
  • Languages: Korean (모델 주석 및 문서화)
  • Model type: 이미지 분류 (멀티밴드 입력)
  • Created_date: 2025-06-05 13:32:18
  • Updated_date: 2025-09-25 08:56:58

Uses

Direct Use

  • 다중분광 영상 기반 생육 상태 분류
  • 드론 영상의 5밴드 입력 멀티스펙트럼 이미지 분류 작업

Downstream Use

  • 유사한 다중분광 데이터셋에 대한 파인튜닝
  • 농업 외 기타 환경 모니터링 대상 분류 문제 적용 가능

Out-of-Scope Use

  • RGB 3밴드 영상만을 사용하는 경우 (입력 구조상 활용 불가)
  • 보정되지 않은 멀티밴드 이미지(다중분광 보정값 처리 필요)
  • 객체 검출, 분할 등 분류 이외의 태스크

Bias, Risks, and Limitations

  • 본 모델은 특정 지역 및 작물 데이터를 중심으로 학습되었으므로, 미학습 환경에서는 성능 저하가 발생할 수 있음
  • 다중분광 영상의 품질, 촬영 조건, 전처리 과정에 민감함
  • 데이터 편향으로 인해 특정 작물이나 배경에 과적합 가능성 존재
  • 모델 예측은 보조적 판단 자료로 활용해야 하며, 최종 의사결정은 전문가 판단과 병행 필요

How to Get Started

from transformers import AutoModelForImageClassification, AutoFeatureExtractor
import torch

# 모델과 특징 추출기 불러오기
model = AutoModelForImageClassification.from_pretrained("MhRnd/ConvNext_Multi")
extractor = AutoFeatureExtractor.from_pretrained("MhRnd/ConvNext_Multi")

# 다중밴드 이미지 텐서 (예: [batch_size, 5, H, W])
inputs = extractor(multi_band_images, return_tensors="pt")

# 모델 추론
outputs = model(**inputs)
logits = outputs.logits
predicted_class = torch.argmax(logits, dim=1)

Training Details

  • Training Data:

    • 드론 및 위성 촬영 다중분광(5밴드) 이미지 데이터셋
    • 라벨: 주요 작물 및 생육 상태 클래스
  • Training Procedure:

    • 파인튜닝: facebook/convnext-tiny-224 기반
    • 에폭수: 300
    • 배치사이즈: 16
    • 옵티마이저: AdamW
    • 학습률: 1e-06, Step 스케줄러 사용

Evaluation

  • Testing Data: 별도 보유한 검증용 다중분광 이미지셋
  • Metrics: 정확도(Accuracy), 손실(Loss)
  • Performance:
    • 베스트 성능 (Epoch 82):
      • 훈련 손실: 0.6502
      • 훈련 정확도: 0.9537
      • 검증 손실: 0.7511
      • 검증 정확도: 0.9286
    • 마지막 업데이트: 2025-09-25 08:56:58

Environmental Impact

  • Hardware: NVIDIA RTX 3090 GPU (350W)
  • Training Duration: 18.44 minutes
  • Total FLOPs: 16650438.17 GFLOPs

Citation

@article{liu2022convnext,  
  title={ConvNeXt: A ConvNet for the 2020s},  
  author={Liu, Zhuang and Mao, Han and Wu, Chao and Feichtenhofer, Christoph and Darrell, Trevor and Xie, Saining},  
  journal={arXiv preprint arXiv:2201.03545},  
  year={2022}  
}

Glossary

  • 다중분광 영상(Multispectral Imagery): 여러 파장대의 빛을 분리하여 촬영한 영상으로, 작물의 생육 상태 분석 등에 활용됨
  • ConvNeXt: 현대적인 구조를 갖춘 컨볼루션 신경망(CNN)

Model Card Authors

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for MhRnd/ConvNext_Multi

Finetuned
(55)
this model

Paper for MhRnd/ConvNext_Multi