FastCampus UpStage AI/ML

(3) ML - 라벨링

하오츠(해석:맛있다) 2024. 11. 26. 14:40

1. Data Labeling

: 모델을 훈련하기 위해 필요한 데이터에 의미를 부여하는 과정

 

2. Data Labeling의 예시 

- Image Labeling

: 객체 인식, 세그멘테이션, 특징 포인트 지정, 이미지 분류 

 

- Text Labeling 

: 텍스트 분류, 감정 분류, 주관적 의견 분석, 키워드 추출

 

- Audio Labeling

: 음성 인식, 음악 분류, 화자 인식

 

- 의료 분야

: 의료 영상 데이터의 Labeling

 

- 자연어 처리

: Text Labeling

 

- 자율 주행 자동차

: 센서 데이터의 Labeling

 

- 환경 모니터링

: 환경 데이터의 Labeling

 

3. Labeling과 AI 모델 학습 유형

 

- Supervised Learning

: Data에 모든 Labeling이 존재한 상태에서의 Learning 방식

: Classification, Regression 

 

- Semi-Supervised Learning 

: 일부 Data만 Labeling 이 존재하며, 나머지는 Labeling이 존재하지 않는 상황에서의 Learning 방식

: self training - 초기에 Labeling 된 데이터로 모델 훈련후, 모델이 높게 예측한 Labeling 없는 데이터에 적용하여 Labeling을 하고 모델을 학습하는 과정을 반복

: co training - 초기 데이터는 

: multiview training - 데이터 분할(피쳐 별로), 모델 학습(피쳐별 별도의 모델 학습), 결합(각 관점에서 얻은 정보를 종합해 모델을 결합)

 

- Self-Supervised Learnging

: Data에 모든 Labeling이 존재하지 않으며, 모델이 스스로 학습할 수 있도록 설계된 Learning 방식

: Auto Encoder - 데이터의 압축과 복원하는 과정에서 데이터 학습(Encoder, Decoder)

: Masked Language Model - 문장중에 일부 단어만 비워놓고 빈칸을 맞추는 학습 방법

: Contrastive Learning - 유사한 데이터는 가깝게 다른데이터는 멀게 표현하도록 하는 학습 방법

 

- 외의 모델 학습 유형

: Transfer Learnging - 이미 훈련된 모델을 다른 작어베 적용하는 방법

: Find Tuning - 사전 학습된 모델을 새로운 작업에 맞게 미세 조정하는 과정

: Online Learnging - 데이터를 순차적으로 처리하면서 모델을 업데이트하는 방식

: Batch Learning - 데이터 셋을 한번에 모델을 입력하는 전통적인 방식

 

* 모델 학습 유형 선택의 고려사항

: 데이터 양, 학습 시간, 모델의 복잡성, 도메인 특성 등을 고려하여 적절한 전략을 선택해야 함

 

 

 

 

 

 

 

'FastCampus UpStage AI > ML' 카테고리의 다른 글

(2) ML - 데이터 샘플링  (0) 2024.11.26
(1) ML - 학습시킬 데이터 준비  (1) 2024.11.26
ML  (2) 2024.10.29
웹 크롤링  (0) 2024.10.28