Auto Labeling
Auto Labeling은 레이블이 되어있지 않은 데이터에 레이블링을 해주는 기법입니다. 실생활에서 데이터를 수집하면 당연히 레이블링이 되어 있지 않고 직접 레이블을 달아주는 작업을 수행합니다. 100개의 데이터까진 직접 레이블링 할 수 있겠지만 만개,십만개 이상의 데이터에 직접 레이블을 달아줄 순 없습니다. 이런 상황에서 소수의 데이터에 레이블을 직접 달아주고 AI 모델에 학습시켜 다수의 데이터에 레이블링을 해주는 방법입니다. 제가 진행했던 AI Cover Letter 프로젝트를 예제로 Auto Labeling을 설명하겠습니다. 저희는 자기소개서 데이터가 필요하기 때문에 잡코리아에서 합격자소서를 크롤링해왔습니다. 자소서 데이터의 레이블은 빈출 문항 9가지로 추려서 선정했습니다. 빈출 질문 9가지 lab..
프로젝트
2020. 4. 14. 11:48