1. Data Labeling
: 모델을 훈련하기 위해 필요한 데이터에 의미를 부여하는 과정
2. Data Labeling의 예시
- Image Labeling
: 객체 인식, 세그멘테이션, 특징 포인트 지정, 이미지 분류
- Text Labeling
: 텍스트 분류, 감정 분류, 주관적 의견 분석, 키워드 추출
- Audio Labeling
: 음성 인식, 음악 분류, 화자 인식
- 의료 분야
: 의료 영상 데이터의 Labeling
- 자연어 처리
: Text Labeling
- 자율 주행 자동차
: 센서 데이터의 Labeling
- 환경 모니터링
: 환경 데이터의 Labeling
3. Labeling과 AI 모델 학습 유형
- Supervised Learning
: Data에 모든 Labeling이 존재한 상태에서의 Learning 방식
: Classification, Regression
- Semi-Supervised Learning
: 일부 Data만 Labeling 이 존재하며, 나머지는 Labeling이 존재하지 않는 상황에서의 Learning 방식
: self training - 초기에 Labeling 된 데이터로 모델 훈련후, 모델이 높게 예측한 Labeling 없는 데이터에 적용하여 Labeling을 하고 모델을 학습하는 과정을 반복
: co training - 초기 데이터는
: multiview training - 데이터 분할(피쳐 별로), 모델 학습(피쳐별 별도의 모델 학습), 결합(각 관점에서 얻은 정보를 종합해 모델을 결합)
- Self-Supervised Learnging
: Data에 모든 Labeling이 존재하지 않으며, 모델이 스스로 학습할 수 있도록 설계된 Learning 방식
: Auto Encoder - 데이터의 압축과 복원하는 과정에서 데이터 학습(Encoder, Decoder)
: Masked Language Model - 문장중에 일부 단어만 비워놓고 빈칸을 맞추는 학습 방법
: Contrastive Learning - 유사한 데이터는 가깝게 다른데이터는 멀게 표현하도록 하는 학습 방법
- 외의 모델 학습 유형
: Transfer Learnging - 이미 훈련된 모델을 다른 작어베 적용하는 방법
: Find Tuning - 사전 학습된 모델을 새로운 작업에 맞게 미세 조정하는 과정
: Online Learnging - 데이터를 순차적으로 처리하면서 모델을 업데이트하는 방식
: Batch Learning - 데이터 셋을 한번에 모델을 입력하는 전통적인 방식
* 모델 학습 유형 선택의 고려사항
: 데이터 양, 학습 시간, 모델의 복잡성, 도메인 특성 등을 고려하여 적절한 전략을 선택해야 함
'FastCampus UpStage AI > ML' 카테고리의 다른 글
(2) ML - 데이터 샘플링 (0) | 2024.11.26 |
---|---|
(1) ML - 학습시킬 데이터 준비 (1) | 2024.11.26 |
ML (2) | 2024.10.29 |
웹 크롤링 (0) | 2024.10.28 |