Link

4장 문서에 꼬리표 달기

문서 분류(document classification)란 입력 문서가 어떤 범주일지 분류하는 과제(task)입니다. 예컨대 뉴스가 정치 기사인지, 경제 기사인지, 연예 기사인지를 가려내는 것도 문서 분류라고 말할 수 있겠습니다. 이 장에서는 영화 리뷰 댓글의 감성(sentiment)을 분류하는 모델을 만들어 보려고 합니다. 이 모델은 영화 리뷰가 긍정(positive) 댓글인지, 부정(negative) 댓글인지는 판단하는 역할을 합니다. 이 장을 차근차근 따라가다 보면 영화 리뷰 말고도 다양한 문서 분류 모델을 만들어볼 수 있습니다.


Table of contents