for textmining

명사(Noun)란 무엇인가

|

이번 글에서는 명사(Noun)와 관련된 여러 개념들을 살펴보도록 하겠습니다. 이번 글은 경희대 이선웅 교수님 강의와 표준국어문법론을 정리하였음을 먼저 밝힙니다. 그럼 시작하겠습니다.

명사의 정의

학교문법에 따르면 명사는 일반적으로 사물의 이름을 가리키는 품사입니다. 명사 검증 기준으로 흔히 사용되는 것은 ‘무엇이 무엇이다, 무엇이 어찌한다, 무엇이 무엇을 어찌한다’의 틀에 나타나는 ‘무엇’의 자리를 채울 수 있느냐는 겁니다. 이는 바로 기능(function)에 초점을 맞춘 기준이라고 할 수 있겠습니다. 명사의 예는 아래와 같습니다.

유정명사 : 아버지, 철수, 사람, 개, 고양이, 여우…

무정명사 : 꽃, 풀, 진달래, 돌, 바위, 책상…

현상 : 아침, 낮, 바람, 노을, 번개…

추상적 개념 : 민주주의, 개념, 명제…

아래 예시와 같이 동작성, 상태성의 의미를 지니는 명사들도 있습니다. 대부분 ‘하다’와 어울려 동사, 형용사로 기능합니다. 이와 관련 자세한 내용은 후술한 술어명사 챕터를 참고하시기 바랍니다.

동작성 : 입학, 독립, 합류, 희망, 일출…

상태성 : 곤란, 성실, 신성, 공평, 무한…

이후 설명은 문법적으로 이해하기 까다로운 명사 개념들 소개한 내용입니다.

의존명사, 형식명사

학교문법에 따르면 의존명사는 관형어의 선행을 필수적으로 요구하는 명사를 가리킵니다. 예컨대 아래와 같습니다.

*가 온다. (다른 가 온다)

*을 공경해야 한다. (저 을 공경해야 한다)

20세기 후반의 국어학 연구에서는 의존명사의 의미적 추상성/형식성에 초점을 맞췄습니다. 의존명사의 의미가 추상적/형식적이어서 실제 문맥에서 자립적으로 실현되지 못하고, 반드시 의미를 제한/보충하여 주는 선행 요소에 의존하여서만 문맥에 나타나는 특성을 지니기 때문입니다. 예컨대 아래와 같습니다.

(ㄱ) 갈 가 없다.

(ㄴ) 그 책을 다 읽는 3일 걸렸다.

(ㄷ) 머리 아픈 먹는 약

(ㄹ) 내가 준 을 아직도 갖고 있니?

(ㅁ) 그가 고백한 을 아직도 기억하고 있니?

(ㄱ)의 ‘데’는 본래 장소를 뜻하는 말이지만 (ㄴ)과 (ㄷ)에서 그 의미가 매우 추상적으로 확대되었습니다. (ㄹ)의 ‘것’은 본래 구체적 대상을 뜻하는 말이지만 (ㅁ)에서는 추상적 대상을 가리킵니다. 이렇듯 의존명사는 선행 요소에 의존적이면서도 그 의미가 추상적이거나 형식적입니다.

그러나 아래 같은 예들이 있어 분석에 주의를 기울여야 합니다.

(a) 3개월 이내에 소득 신고를 하지 않은 자(者)

(b) 그가 거짓말을 했기 때문

(c) 세 살 또래의 어린이가 가장 다루기 어렵다.

(d) 요즘 같은 세상에 아버지 노릇을 제대로 하기란 쉽지 않다.

(e) 강경 일변도의 정책

(f) 내수를 진작한다는 미명하에

(g) 추상적 사고의 소산

위에서 예로 든 의존명사들은 모두 구체적인 의미를 지니고 있습니다. ‘자’는 사람, ‘때문’은 이유, ‘또래’는 그 정도의 나이, ‘노릇’은 구실/역할 등을 뜻합니다.

따라서 아래와 같이 구분할 필요가 있습니다.

형식명사 : 의미가 추상적/형식적이면서도 통사적으로 의존적인 명사, 주로 고유어 계통 (예 : ‘데’, ‘것’)

의존명사 : 의미가 구체적이지만 통사적으로는 의존적인 명사, 주로 한자어 계통 (예 : ‘자’, ‘때문’, ‘또래’, ‘노릇’, ‘일변도’, ‘미명’, ‘소산’)

부접명사

부접명사(附接名詞)란 무표지 명사구를 보충어로 반드시 요구하며 그에 직접 결합하는 의존명사의 한 부류를 가리킵니다. 예를 들면 아래와 같습니다.

(1) 검찰(의) 발표

(2) 국문과(*의) 출신

(3) 빠른 선수 위주(爲主)

(4) *너는 위주가 무엇이냐?

(5) 시험(*의) 걱정

(6) 그 사람은 늘 걱정이 많다.

일반적으로 ‘명사+명사’ 결합에서는 중간에 속격조사 ‘-의’를 삽입하는 것이 가능합니다. (1)처럼 ‘검찰 발표’, ‘검찰의 발표’ 둘 다 맞는 표현입니다.

하지만 (2)에서는 ‘-의’를 넣으면 비문이 됩니다. ‘출신’이라는 명사는 ‘국문과’라는 명사(구)를 보충어로 반드시 요구하면서 그에 직접 결합하기 때문에 부접명사로 분류할 수 있습니다.

(3)과 (4)에서 ‘위주’는 선행 명사구(빠른 선수) 없이 자립적으로 쓰일 수 없고 선행 명사구와 직접 결합하고 있음을 알 수 있습니다. 따라서 ‘위주’는 부접명사입니다.

(5)에선 ‘걱정’이 의존적이지만 (6)에서는 자립적으로 쓰였습니다. 따라서 ‘걱정’은 부접명사로 분류할 수 없습니다.

술어명사

술어명사(predicative noun)는 사건, 행위, 상태 등 의미를 지니는 명사를 뜻합니다. 예컨대 ‘사랑’, ‘답변’은 대표적인 술어명사입니다. 그런데 술어명사는 동사나 형용사처럼 논항이 대체로 필요합니다. 논항이란 문장에서 문법적으로 중심 역할을 하는 이 요구하는 필수 성분을 말합니다. 아래 표를 볼까요?

구분 (가) (나)
1 철수의 영희 사랑 정부의 야당 질문에 대한 답변
2 철수가 영희를 사랑한다 정부가 야당 질문에 대해 답변하였다

위 표에서 1행과 2행은 같은 의미를 지닙니다. (가)-2의 경우 ‘사랑하다’는 동사의 논항은 행위주 ‘철수’, 대상역 ‘영희’로 실현돼 있습니다. (가)-1에서 ‘사랑’이라는 명사의 논항은 (가)-2와 마찬가지로 ‘철수’와 ‘영희’입니다.

(나)-2의 경우 ‘답변하다’는 동사의 논항은 행위주 ‘정부’, 대상역 ‘야당 질문’으로 실현돼 있습니다. (나)-1에서 ‘답변’이라는 명사의 논항은 (나)-2와 마찬가지로 ‘정부’, ‘야당 질문’입니다.

술어명사의 큰 특징 가운데 하나는 위 표에서처럼 술어명사의 논항이 그에 대응하는 용언 서술어가 형성하는 문장의 논항과 일치한다는 점입니다. 한국어 술어명사의 대부분은 논항을 요구합니다. 이러한 부류의 다른 예로는 ‘건강’, ‘공부’, ‘운동’, ‘여행’ 등이 있습니다.

물론 그 수는 작지만 예외가 있기는 합니다. 다시 말해 논항을 요구하지 않는 술어명사도 있다는 것입니다. 예를 들어보겠습니다.

비가 그친 후 출발하자.

‘비’는 두 가지 의미가 있습니다. ‘하늘에서 떨어진 물방울’이라는 실체와 ‘물방울이 하늘에서 떨어짐’이라는 사건을 나타낸다는 것이죠. 위 예문의 ‘비’는 사건에 가까운 의미일 겁니다. 그런데 ‘비’는 일반적인 술어명사와 달리 행위주, 대상역 등 논항을 필요로 하지 않습니다. 이러한 부류의 예로는 ‘눈’, ‘천둥’, ‘번개’ 등이 있습니다.

논항을 요구하지 않는 술어명사의 또 다른 예를 들어보겠습니다.

구분 (A) (B)
1 철수는 일을 마친 후 바로 귀가하였다 영희는 시험을 보는 도중에 잠이 들었다
2 *철수의 일 도중에 영희가 찾아왔다 *영희의 시험 중에 철수가 들어왔다

위 예시에서 ‘일’과 ‘시험’은 사건성, 행위성을 확인할 수 있지만 논항을 요구하지 않습니다. 행위주 논항이 실현된 명사구 ‘철수의 일 도중’, ‘영희의 시험 중’은 되레 비문이 됐다는 사실을 확인할 수 있습니다.

이선웅(2012)은 술어 성격을 지니는 명사를 술어명사라고 규정하는데요. 그는 술어를 아래와 같이 정의합니다.

술어(predicator)란 논항구조를 가지거나 상적특성을 지니면서 사건, 행위, 상태 등의 의미적 실체를 나타내는 언어 형식이다.

동일한 명사가 술어명사와 결과명사 두 역할 모두 하는 경우도 있습니다. 사건 표현에 방점을 두고 있다면 술어명사, 사건/행위의 결과 표현에 강조점이 있다면 결과명사로 분류되는 식입니다. 예를 들어보겠습니다.

(1) 술어명사 : 결정 후 생각해 보자.

(2) 결과명사 : 국민들은 정부의 결정에 격노하였다.

정희정(2000)은 ‘결정’이라는 명사는 ‘결정하는 행위(술어명사)’와 ‘결정한 내용(결과명사)’의 뜻을 가진 다의어로 규정했습니다. 다시 말해 (1)처럼 행위에 방점이 찍혀 있어야만 술어명사로 분류할 수 있다는 겁니다.

마지막으로 술어명사의 논항에 대해 한 가지 더 살펴보겠습니다. 아래 예를 볼까요?

(a) 미국의 이라크 공격

(b) 이라크의 공격

(c) 향가의 연구

(d) 그 사람의 생각

(a)에서 행위주는 미국, 대상은 이라크입니다. (b)에서 행위주는 이라크입니다. 별로 헷갈리지 않죠. 그런데 (c)와 (d)를 보면 알쏭달쏭해집니다. (c)에서 ‘향가’는 행위주로 읽히지 않습니다. 한국어를 모국어로 쓰는 화자라면 대부분 향가를 대상으로 인식할 겁니다. 반대로 (d)의 ‘그 사람’은 행위주로 읽힙니다.

(b), (c), (d)는 명사+’-의’+명사로 동일한 형태인데 문법적으로는 각기 다른 의미를 내포하고 있습니다. 통사 구조가 공격, 연구, 생각이라는 개별 어휘에 영향을 받고 있다는 이야기입니다.

명사 핵의 범위

문장을 만드는 동사와 달리 명사는 명사구를 만들 뿐입니다. 다시 말해 명사가 영향을 끼칠 수 있는 문법적 최대 단위가 명사구라는 이야기이죠. 예를 들어보겠습니다.

(1) 철수가 강아지를 대단히 사랑한다.

(2) 철수의 강아지 사랑은 대단하다.

동사 ‘사랑하-‘는 (1) 문장 전체에 문법적인 영향을 끼칩니다. 하지만 술어명사 ‘사랑’은 그 영향력이 명사구에 한정돼 있습니다. (2)의 ‘철수의 강아지 사랑’처럼 명사의 논항이 실현된 명사구를 복합명사구(complex noun phrase)라고 합니다.

분류사와 한국어 수량표현

분류사(classifier)란 어떤 명사의 특정 의미자질 혹은 문법자질을 범주화하여 가리키는 언어형식을 통칭하는 말입니다. Aikhenvald(2000)는 명사 분류사(noun classifier), 수량 분류사(numeral classifier) 등으로 나누어 분류하고 있습니다. 여기에서 명사 분류사는 그 분류사가 표시하는 성(sex), 유정성(animacy), 인간성(humanness) 등의 범주로 나뉩니다.

한국어에서는 단위명사가 분류사에 해당합니다. 한국어의 분류사는 부류화보다는 수량화의 기능이 더 크다고 합니다. 예를 들어보겠습니다.

행인 한 사람

개 두 마리

위 예시에서 ‘사람’, ‘마리’는 각각 사람, 동물의 의미 부류를 가리키는 기능을 하고 있는 걸 알 수 있습니다. 뿐만 아니라 둘 모두 수량을 나타내고 있습니다.

박진호(2011)는 수량 분류사를 단위사(unitizer)로 부르는데요. 그가 규정한 단위사 종류는 아래와 같습니다.

가. 수 단위사 (count unitizer)

ㄱ. 개체 단위사 (entity unitizer) : 개, 명, 마리, 그루, 송이, 대, 장, 자루

ㄴ. 집합 단위사 (group unitizer) : 켤레, 다스, 톳, 손

ㄷ. 사건 단위사 (event unitizer) : 번, 차례, 회, 바퀴, 순배, 판

나. 양 단위사 (mass unitizer)

ㄱ. 용기 단위사 (container unitizer) : 잔, 병, 컵, 그릇, 숟가락

ㄴ. 도량형 단위사 (measuring unitizer) : 미터, 킬로그램, 리터

한국어 수량표현의 종류는 크게 네 가지입니다. 아래와 같습니다.

(1) 명사 + 수사 : 학생 셋

(2) 명사 + 수관형사(수사) + 단위 명사 : 학생 세 명

(3) 수관형사(수사) + 명사 : 세 학생

(4) 수관형사(수사) + 단위명사 + ‘-의’ + 명사 : 세 명의 학생

한국어에선 수량표현을 하는 명사구가 부사구처럼 자리를 자유롭게 바꿀 수 있습니다. 이를 양화사 유동이라고 합니다. 예를 들어보겠습니다.

나는 맥주를 세 병 마셨다. / 나는 세 병 맥주를 마셨다.

셋이 학생이 왔다. / 학생이 셋이 왔다.

위 구문은 사실 이중목적어/이중주어 구문으로 이해할 수도 있습니다. 그런데 일반적인 이중목적어/이중주어 구문과 달리 전체/부분 등의 관계로 설명할 수 없어서, 국어학자들은 동격 구문이라는 설명을 하고 있습니다.

한국어 수량표현엔 고유어와 한자어 두 가지 종류가 있습니다. 그런데 실생활에선 혼용해서 쓰고 있어서 일반적인 규칙으로 만들기가 까다롭습니다.

열(고유어)십(한자어)십(한자어)

더하기

이십구명 / 일곱

칠십팔세 / 일흔여덟

대명사

대명사의 의미적 특징으로 직시(直示)대용(代用)을 꼽을 수 있습니다. 직시란 발화가 이뤄지는 상황에서 지시의 의미가 드러나는 걸 뜻하고, 대용이란 선행 언어형식이 의미하는 실체나 상황을 가리키는 걸 말합니다. 다시 말해 직시는 텍스트 외적지시, 대용은 내적지시에 해당합니다. 예를 들어보겠습니다.

(가) 직시 : (가방을 보면서)이거 어디서 샀니?

(나) 대용 : 나도 어제 가방을 하나 샀어. 그것을 가져 갈까?

(가)에서 ‘가방’은 명시적으로 언급된 적이 없지만, 청자는 발화가 이뤄지는 상황에서 ‘이거’가 뜻하는 사물이 ‘가방’이라는 점을 충분히 인지할 수 있습니다. 반대로 (나)에서 화자는 청자가 구입한 가방을 본 적은 없지만, ‘그것’이 뜻하는 사물이 가방이라는 점을 알 수 있습니다.

이선웅(2012)의 대명사 분류 표는 아래와 같습니다.

위 표에서 부정(不定, indefinite) 개념에 대해 살펴보겠습니다. 지시대상이 불명확하거나, 불명확하게 표현하는 경우를 뜻합니다. 예를 들어보겠습니다.

(ㄱ) (어둠 속에서 물건을 찾다가) 여기 가 만져지네?

(ㄴ) (피자를 먹으며 전화통화) 응, 좀 먹고 있어.

(ㄱ)의 경우 화자도 청자도 지시하는 대상을 명확하게 인식하지 못하는 상황이고, 그 표현도 불명확하게 이뤄졌습니다. (ㄴ)의 경우 화자는 지시하는 대상(피자)을 명확하게 알고 있지만, 그 표현만 부정칭으로 하고 있습니다. (ㄱ), (ㄴ) 모두 부정칭이라고 말할 수 있습니다.

재귀표현

한국어는 대명사 사용을 기피하는 경향이 큰 언어입니다. 한국어 명사는 대체로 그대로 재귀표현으로 사용할 수 있습니다.

저희 할아버지는 할아버지 시대 얘기만 하세요.

위 문장에서 ‘할아버지’는 재귀대명사가 아닌데도 재귀대명사처럼 쓰였습니다. 이선웅(2012)는 아래와 같이 규정했습니다.

한국어의 재귀표현에는 재귀대명사와 선행 명사 반복이 있다. 후자의 경우는 선행 명사의 지시물이 화자보다 높은 대상일수록 문법성이 좋아진다.

재귀대명사에도 높임의 등급이 있습니다. 예를 들어보겠습니다.

(1) 저희 할아버지는 당신 시대 얘기만 하세요.

(2) 당신은 누구요?

(3) 언니는 자기 생각밖에 안 해요.

(4) 언니는 지(저) 생각밖에 안 해요.

‘당신’은 3인칭 재귀대명사로 쓸 때는 극존대 의미를 갖지만, 2인칭일 때는 상대방을 낮춰 부르는 효과를 냅니다. ‘저’는 3인칭 상대방을 낮춰 부를 때 씁니다.

마지막으로 3인칭대명사와 재귀대명사와의 관계를 살펴보겠습니다. 예를 들어보겠습니다.

(A) 철수는 {그의, 자기} 형이 변호사이다.

(B) 철수는 {*그, 자기}가 직접 선생님을 찾아뵈었다.

(A)에서 3인칭대명사 ‘그(의)’, 재귀대명사 ‘자기’를 모두 쓸 수 있습니다. 여기서 둘의 차이점은 ‘그’는 철수 말고 다른 이를 가리키는 데 쓰일 수 있지만, ‘자기’는 반드시 철수를 가리킨다는 점입니다. (B)에서는 ‘그’를 쓰면 비문이 됩니다. 강조 용법으로 재귀대명사가 들어가는 자리에 일반 대명사를 절대로 쓰지 않는 것이 한국어 문법 규칙입니다.

Comment  Read more

False Discovery Rate

|

이번 글에서는 변수선택(Feature Selection) 기법으로 널리 쓰이고 있는 False Discovery Rate(FDR)에 대해 살펴보도록 하겠습니다. 이번 글 역시 고려대 김성범 교수님 강의를 정리하였음을 먼저 밝힙니다. 그럼 시작하겠습니다.

FDR의 문제 의식

제품의 ‘정상’, ‘불량’을 판별하는 이진분류 문제를 푼다고 칩시다. (정상, 불량이든 긍정, 부정이든 어떤 것이든 상관없습니다) 우리가 가진 데이터의 독립변수는 $x_1, x_2, x_3$ 세 개이고 하나의 행(레코드)은 관측치 하나에 대응한다고 가정하겠습니다. 그렇다면 세 변수 가운데 정상, 불량을 판별하는 데 가장 중요한 변수는 무엇일까요?

위 예시에서 $x_1$은 정상, 불량 범주를 판별하는 데 전혀 도움이 안 될 것입니다. 반면 $x_2$는 상대적으로 중요할 겁니다. 정상 관측치에선 작은 값(평균 : 10)을, 불량 관측치에선 큰 값(200)을 갖기 때문입니다. $x_3$는 $x_1$보다는 중요한 변수지만 $x_3$보다는 덜 중요한 변수일 겁니다.

지금까지 말씀드린 내용을 이를 수식으로 나타내면 아래와 같습니다. 이 식에 따라 좌변을 계산하면 각각 0, 190, 1.6이 됩니다.

[\left \overline { { x }{ i,normal } } -\overline { { x }{ i,abnormal } } \right \ge \tau]

그렇다면 $τ$가 얼마나 커야 유의미(=$x_i$가 중요변수)할까요? 이를 엄밀히 따져 보려면 통계학 기법을 써야 합니다. 다시 말해 귀무가설(Null Hypothesis)대립가설(Alternative Hypothesis)을 아래와 같이 설정하고, 변수마다 각각 가설검정(Hypothesis Test)을 실시해야 한다는 것이지요.

[{ H }_{ 0 }\quad :\quad \left \overline { { x }{ i,normal } } -\overline { { x }{ i,abnormal } } \right =0\ { H }_{ 1 }\quad :\quad \left \overline { { x }{ i,normal } } -\overline { { x }{ i,abnormal } } \right >0]

그런데 여기서 문제가 있습니다. 우리는 대개 변수가 100개를 훌쩍 넘는 다변량 데이터를 취급한다는 점입니다. 모든 가설을 동시에 검정하면 $x_i$가 중요하지 않은 변수($H_0$가 참)인데도 중요변수($H_0$를 기각)라는 결과가 나오는 경향이 있습니다. 이를 다중성(Multiplicity) 문제라고 합니다.

개별 가설검정의 유의수준(significance level)이 0.01, 다시 말해 개별 가설검정의 신뢰도가 0.99인 상황에서 가설검정을 실시한다고 합시다. 유의수준이란 귀무가설 $H_0$가 참인데 잘못해서 기각할 확률(제1종 오류)의 최대값을 뜻합니다.

그럼 변수가 100개인 다변량 데이터에 대해 변수선택을 하기 위해 100번의 가설검정을 실시한다면 100회 가설검정 전체의 신뢰도는 크게 낮아집니다. 다시 말해 중요하지 않은 변수인데도 중요변수라는 결과가 나올 가능성이 높아진다는 얘기입니다. 아래 표를 볼까요?

검정 횟수 검정 전체의 신뢰도
1 $0.99^1=0.99$
2 $0.99^2=0.98$
10 $0.99^{10}=0.90$
100 $0.99^{100}=0.37$

이를 그래프로 나타내면 아래와 같습니다.

FDR은 이러한 다중가설검정 문제를 해결하기 위해 제안된 방법입니다. 물론 개별 유의수준($α$)을 ‘목표값/변수개수’로 정하고 기존대로 가설검정을 수행하는 기법(Family-wise Test)이 제시되기도 했습니다. 예컨대 전체 목표 유의수준이 0.01이고 변수개수가 10개라면 개별 유의수준을 0.001로 놓고 가설검정을 각각 실시하는 방식이죠. 그러나 이 방식은 중요한 변수($H_0$가 거짓)인데도 중요하지 않다($H_0$가 참)는 결론을 내는 경우가 많은 단점이 있다고 합니다.

FDR 절차

FDR은 제1종 오류를 최대한 적게 범하면서도 중요한 가설을 최대한 많이 찾을 수 있도록($H_0$ 기각) 한다는 점이 강점입니다. 검정해야할 다중가설(데이터의 변수 개수)이 $m$개일 때 FDR은 아래와 같이 정의됩니다.

구분 $H_0$ 채택 $H_0$ 기각 Total
$H_0$가 참 $U$ $V$ $m_0$
$H_0$가 거짓 $T$ $S$ $m_1$
Total $W$ $R$ $m$

[FDR=E\left[ \frac { V }{ V+S } \right] =E\left[ \frac { V }{ R } \right]]

위 수식에 정의된 FDR을 해석하면 이렇습니다. FDR은 기각된 귀무가설($H_0$) 가운데 잘못 기각된 가설이 차지하는 비율의 평균으로 사용자가 지정해주는 값입니다. 바꿔 말해 $m$회 가설검정 가운데 각 $H_0$이 참인데 기각된 비율, 즉 검정 전체 유의수준에 가까운 의미라는 뜻입니다. 실제로 FDR 제안자는 FDR을 $α$라고 표기하고 있습니다.

그럼 FDR 절차를 살펴볼까요? 검정해야할 다중가설, 즉 데이터 변수 개수가 15개라고 합시다. 목표로 하는 FDR 값을 0.05로 정해보겠습니다. 우선 각각의 가설에 대해 $p-value$를 구한 뒤 이를 오름차순으로 정렬하고, 순위(rank)를 매깁니다. 아래 표와 같습니다.

$p-value$는 $H_0$이 참일 확률을 의미하므로, $α$를 0.05로 놓고 기존대로 단일 가설검정을 실시했다면 1~9번 변수 가 중요변수라는 결과를 얻었을 겁니다. Family-wise Test 방식대로 ‘목표 유의수준/변수 개수=0.05/15’로 가설검정을 실시한다면, 그 값이 0.0033이므로 1~3번 변수만 중요하다는 결론을 내렸을 겁니다.

FDR 절차에서 $i$는 rank, $m$은 변수 개수, $α$는 사용자가 정한 FDR 값입니다. 예컨대 1번 변수는 $1/15$에 0.05를 곱해 계산합니다. 마찬가지로 2번 변수는 $2/15$에 0.05를 곱해 구합니다.

이 값이 $p-value$보다 큰 변수 랭크의 최대값이 FDR 절차가 뽑은 중요변수의 개수가 됩니다. 위 표 기준으로 설명하자면 이렇습니다. 표 아래쪽부터 시작해 위쪽으로 훑어 가면서 $i/m*α$ 값이 $p-value$보다 큰 지 여부를 검토합니다. 처음으로 $p-value$ 값을 넘어서는 지점은 바로 4번 변수이네요. 따라서 1~4번 변수를 중요한 변수라고 결론을 내게 됩니다.

예제에서도 알 수 있듯 FDR은 단일 가설검정에 비해 제1종 오류가 낮고(비중요 변수 배제), Family-wise Test 방식에 비해 중요한 가설을 많이 찾아낸다는 장점이 있습니다.

FDR 예제

그럼 실제 데이터를 가지고 문제를 풀어보겠습니다. UCI data 가운데 하나를 가져왔습니다. 개요는 아래와 같습니다.

Ionosphere Data Set

데이터 설명 : 전리층(ionosphere)에 대한 레이더 관측치를 모은 데이터

관측치 개수 : 351개

독립변수 : 34개

종속변수 : 전리층의 패턴 유무 (good : 전리층에 특정 패턴 존재, bad : 패턴 없음)

모든 독립변수에 대해 T-test를 수행하였습니다. ($H_0$=두 집단의 평균이 같다, $H_1$=두 집단 평균이 다르다) 변수별 p-value는 아래 표와 같습니다.

변수 P-value 변수 P-value 변수 P-value 변수 P-value
1 2.303168e-11 11 3.060316e-03 21 6.897335e-05 31 7.025167e-07
2 NaN 12 8.189137e-03 22 5.051969e-02 32 5.547445e-01
3 2.339468e-15 13 9.549388e-04 23 3.350101e-04 33 3.748258e-06
4 5.941660e-02 14 1.341207e-03 24 9.191420e-01 34 2.747245e-01
5 3.153540e-15 15 1.017555e-04 25 1.162854e-03    
6 1.988959e-02 16 1.507825e-02 26 9.795861e-01    
7 7.577585e-13 17 1.036061e-01 27 5.055064e-02    
8 6.995369e-04 18 4.976238e-02 28 4.980595e-01    
9 5.545817e-07 19 3.255247e-02 29 2.570992e-05    
10 4.515815e-02 20 5.604890e-01 30 9.475607e-01    

Individual Test($α=0.05$) 결과 선택된 중요 변수는 22개입니다. (p-value가 0.05보다 작은 변수 선택)

1, 2, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 20, 22, 24, 28, 30, 32

Family-Wise Test($α=0.05$, $α/m$, $m$=전체 변수 개수) 결과 선택된 중요 변수는 15개입니다. (p-value가 0.0015보다 작은 변수 선택)

1, 3, 5, 7, 8, 9, 13, 14, 15, 21, 23, 25, 29, 31, 33

위 계산결과를 토대로 $α$값을 0.05로 두고 FDR을 수행한 결과는 아래 표와 같습니다.

변수 ID rank P-value $i/m*α$
3 1 2.339468e-15 0.001470588
5 2 3.153540e-15 0.002941176
7 3 7.577585e-13 0.004411765
1 4 2.303168e-11 0.005882353
9 5 5.545817e-07 0.007352941
31 6 7.025167e-07 0.008823529
33 7 3.748258e-06 0.010294118
29 8 2.570992e-05 0.011764706
21 9 6.897335e-05 0.013235294
15 10 1.017555e-04 0.014705882
23 11 3.350101e-04 0.016176471
8 12 6.995369e-04 0.017647059
13 13 9.549388e-04 0.019117647
25 14 1.162854e-03 0.020588235
14 15 1.341207e-03 0.022058824
11 16 3.060316e-03 0.023529412
12 17 8.189137e-03 0.025000000
16 18 1.507825e-02 0.026470588
6 19 1.988959e-02 0.027941176
19 20 3.255247e-02 0.029411765
10 21 4.515815e-02 0.030882353
18 22 4.976238e-02 0.032352941
22 23 5.051969e-02 0.033823529
27 24 5.055064e-02 0.035294118
4 25 5.941660e-02 0.036764706
17 26 1.036061e-01 0.038235294
34 27 2.747245e-01 0.039705882
28 28 4.980595e-01 0.041176471
32 29 5.547445e-01 0.042647059
20 30 5.604890e-01 0.044117647
24 31 9.191420e-01 0.045588235
30 32 9.475607e-01 0.047058824
26 33 9.795861e-01 0.048529412
2 34 NaN 0.050000000

위 표에서 $i/m*0.05$가 $p-value$보다 크다는 조건을 만족하는 rank의 최대값은 19입니다. 그 결과 19개 변수가 선택됐습니다.

3, 5, 7, 1, 9, 31, 33, 29, 21, 15, 23, 8, 13, 25, 14, 11, 12, 16, 6

FDR level 변화에 따른 중요 변수 선택 결과는 아래와 같습니다. FDR level이 클 수록 선택되는 변수 개수가 많아지는 경향을 보였습니다.

FDR level 선택변수(개)
0.01 16
0.02 17
0.03 18
0.04 19
0.06 20
0.08 24
0.09 25
0.14 26
0.35 27
0.61 28
0.64 30

Ionosphere Data Set을 7:3 비율로 학습셋과 검증셋으로 나누고, 학습셋에 대해 LDA 모델을 적합한 뒤 검증셋을 대상으로 단순정확도를 측정하였습니다. 통계적으로 유의한 일부 변수만으로 구축한 모델은 전체 변수를 모두 사용한 모델의 성능에 크게 뒤지지 않음을 확인할 수 있었습니다.

구분 전체 Individual Family-wise FDR
학습에 사용된 변수(개) 33 19 9 14
단순정확도 0.8762 0.8476 0.8286 0.8190

위 문제를 푸는 데 사용한 R 코드는 아래와 같습니다.

# load & split data
data <- read.csv('data.csv',header=F)
good <- data[which(data[,35] == 'g'),-35]
bad <- data[which(data[,35] == 'b'),-35]

# T-test
Ttest <- c()
for (i in 1:dim(good)[2]) {
  Ttest[i] <- t.test(good[,i], bad[,i])$p.value
}

# individual test
which(Ttest<0.05) 

# family-wise test (패키지 사용)
# bonferroni : p-values are multiplied by the number of comparisons
family.wise.test=p.adjust(Ttest, method = "bonferroni")
which(family.wise.test<0.05)

# family-wise test (자작)
which(Ttest < 0.05/length(Ttest))

# FDR (패키지 사용)
library(fdrtool)
fdr <-  fdrtool(Ttest, statistic='pvalue', cutoff.method = 'fndr')
fdr$param

# FDR (자작)
fdr.level <- 0.05
var_table <- matrix(0, nrow=length(Ttest),ncol=4)
colnames(var_table) <- c('id', 'rank', 'P-value', 'i/m*FDR')
var_table[,1] <- c(1:length(Ttest))
var_table[,3] <- Ttest
var_table <- var_table[order(var_table[,3]),]
var_table[,2] <- c(1:length(Ttest))
var_table[,4] <- var_table[,2] / length(Ttest) * fdr.level
max(which(var_table[,3] < var_table[,4])) # 중요 변수 개수
var_table[1:max(which(var_table[,3] < var_table[,4])),1] # 중요 변수 추출

# all variables model
library(MASS)
data[,35] <- as.numeric(data[,35])
colnames(data)[35] <- 'Target'
data <- data[,-2]
trn_idx <- sample(1:dim(data)[1], round(0.7*dim(data)[1]))
train_data <- data[trn_idx,]
test_data <- data[-trn_idx,]
allmodel <- lda(Target~.,train_data)

# var selection model
train_data_good <- train_data[which(train_data$Target == 1),-train_data$Target]
train_data_bad <- train_data[which(train_data$Target == 2),-train_data$Target]
Ttest <- c()
for (i in 1:dim(train_data_good)[2]) {
  Ttest[i] <- t.test(train_data_good[,i], train_data_bad[,i])$p.value
}
family.wise.test=p.adjust(Ttest, method = "bonferroni")
individual_model <- lda(Target~.,train_data[,c(which(Ttest<0.05),34)])
familywise_model <- lda(Target~.,train_data[,c(which(family.wise.test<0.05),34)])

# fdr model
fdr.level <- 0.05
var_table <- matrix(0, nrow=length(Ttest),ncol=4)
colnames(var_table) <- c('id', 'rank', 'P-value', 'i/m*FDR')
var_table[,1] <- c(1:length(Ttest))
var_table[,3] <- Ttest
var_table <- var_table[order(var_table[,3]),]
var_table[,2] <- c(1:length(Ttest))
var_table[,4] <- var_table[,2] / length(Ttest) * fdr.level
important_vars <- var_table[1:max(which(var_table[,3] < var_table[,4])),1] 
fdr_model <- lda(Target~.,train_data[,c(important_vars,34)])

# prediction
all <- predict(allmodel, test_data)
individual <- predict(individual_model, test_data)
familywise <- predict(familywise_model, test_data)
fdr <- predict(fdr_model, test_data)

# calculate ACC
ACC_all <- sum(diag(table(test_data$Target, all$class)))/length(all$class)
ACC_indi <- sum(diag(table(test_data$Target, individual$class)))/length(individual$class)
ACC_fdr <- sum(diag(table(test_data$Target, fdr$class)))/length(fdr$class)
ACC_family <- sum(diag(table(test_data$Target, familywise$class)))/length(familywise$class)

반복샘플링 기반 FDR

지금까지 설명해드린 FDR 기법은 우리가 가진 데이터가 특정 확률분포를 따르고, 이로부터 적당한 방법을 취해 $p-value$를 계산할 수 있어야만 적용이 가능합니다. 하지만 데이터가 특정 분포를 따르지 않거나, 그 분포를 모른다고 할 때는 $p-value$ 계산이 어렵습니다. 반복샘플링 기반 FDR은 말 그대로 반복샘플링을 통해 분포에 대한 가정없이 $p-value$를 계산할 수 있는 기법입니다.

가정과 절차는 이렇습니다. 특정 변수를 기준으로 관측치를 랜덤하게 섞습니다. 만약 해당 변수가 범주 분류에 의미 있는 변수라면 실제 데이터의 통계량이 관측치를 랜덤하게 섞은 데이터의 통계량보다 훨씬 클 겁니다. 아래 그림처럼요.

통계적 유의성을 확보하기 위해서는 이러한 과정을 충분히 많이 반복해야 합니다. 만약 아래처럼 100번을 반복 수행했다고 가정해보겠습니다. p-value는 아래와 같이 구할 수 있습니다.

\({ p-value }_{ { X }_{ 1 } }=\frac { { T }_{ { x }_{ 1 } }^{ (i) }\quad 중에 \quad{ T }_{ { x }_{ 1 } } 보다\quad 큰\quad값의\quad개수}{ 반복횟수\times변수의\quad수 } =\frac { { T }_{ { x }_{ 1 } }^{ (i) }\quad중에 \quad{ T }_{ { x }_{ 1 } } 보다\quad 큰\quad값의\quad개수 }{ 100\times 2 } \\ { p-value }_{ { X }_{ 2 } }=\frac { { T }_{ { x }_{ 2 } }^{ (i) }\quad 중에\quad{ T }_{ { x }_{ 2 } } 보다\quad 큰\quad값의\quad개수 }{ 반복횟수\times변수의\quad수} =\frac { { T }_{ { x }_{ 2 } }^{ (i) } \quad중에\quad{ T }_{ { x }_{ 2 } } 보다\quad 큰\quad값의\quad개수 }{ 100\times 2 }\)

이렇게 p-value를 구하게 되면 이후 절차는 지금까지 설명해드린 FDR 절차 그대로 따르면 됩니다.

이진분류 이외 문제에 FDR 적용하기

p-value만 구하면 이후엔 FDR 기법을 적용할 수 있습니다. 정규분포를 따르는 데이터의 이진분류 문제의 경우 T-test를 수행하면 p-value를 구할 수 있었고, 특정 데이터 분포를 가정할 수 없는 상황이라면 반복 샘플링 기반으로 p-value를 구할 수 있습니다.

그렇다면 $y$가 연속형 숫자인 회귀 문제에서 중요 변수를 찾아내기 위해 FDR을 적용해야 한다면 p-value를 어떻게 구해야 할까요? 귀무가설과 대립가설을 아래와 같이 설정하고 모든 변수에 대해 가설검정을 실시합니다.

[{ H }{ 0 }\quad :\quad { \beta }{ i }=0\ { H }{ 1 }\quad :\quad { \beta }{ i }\neq 0]

p-value는 귀무가설이 맞을 확률을 의미하므로 위 가설검정에서 p-value가 작게 나올 경우 $H_0$는 기각하게 됩니다. 바꿔 말해 $β_i$가 중요하다는 이야기이죠. 선형회귀 모델의 계수들은 t분포를 따른다고 합니다. 검정통계량 $t$는 아래와 같이 구합니다. \(t=\frac { \hat { { \beta }_{ i } } -0 }{ sd\{ \hat { { \beta }_{ i } } \} }\) 3개 이상의 범주 분류 문제의 경우 p-value를 어떻게 구할까요? 두 가지 방법이 있습니다. 첫번째는 범주 두 개를 한 세트로 묶어서 이진 분류 문제처럼 p-value를 구하는 겁니다. 나머지는 분산분석(ANOVA) 기법을 적용하는 것입니다.

Comment  Read more

Branching Entropy

|

이번 글에서는 말뭉치에서 단어를 추출하는 기법 가운데 하나인 Branching Entropy(이하 BE)에 대해 살펴보도록 하겠습니다. BE는 Jin&Tanaka(2006)이 제안한 모델인데요, 이 글은 김현중 서울대 박사과정이 진행한 2017 패스트캠퍼스 강의와 코드를 참고하였음을 먼저 밝힙니다. 그럼 시작하겠습니다.

기법 개요

Jin&Tanaka(2006)의 아이디어는 생각보다 간단합니다. 단어 내부에서는 불확실성(uncertainty), 엔트로피(entropy)가 줄어들고, 경계에서는 증가하는 현상을 모델링한 것입니다. 아래 그림을 먼저 볼까요?

알파벳 ‘n’ 한 글자만 주어졌을 땐 이 정보만으로는 어떤 단어가 등장할지 정확히 알기 어렵습니다(불확실성이 높은 상태). 하지만 글자가 ‘natur’까지 등장했다면 ‘nature’이거나 ‘natural’ 두 가지 경우의 수뿐입니다(불확실성이 낮은 상태). 그럼 ‘nature’ 다음에 나오는 글자는 무엇일까요? 다시 예측하기 어려워집니다. 이는 ‘natural’도 마찬가지입니다.

이미 주어진 글자정보를 활용해 다음 글자의 불확실성을 계산해보면 아래와 같은 그래프를 그릴 수 있습니다. 단어 내부에선 불확실성이 줄어들다가 단어 경계에서 불확실성이 다시 증가하기 때문입니다. Jin&Tanaka(2006)는 이런 점에 착안해 그 경계의 불확실성이 높은 글자들의 나열을 ‘단어’로 보자고 제안했습니다. 이때 쓰이는 불확실성 관련 지표가 바로 BE입니다.

BE는 아래와 같이 정의됩니다.

[H(X { X }_{ n })=-\sum _{ x\in X }^{ }{ P(x { x }_{ n })\times \log { (P(x { x }_{ n })) } }]

분석 예시

영화 리뷰 사이트 ‘왓챠’에서 655만306개의 리뷰를 수집했습니다. 우선 이를 글자 단위로 세었습니다. 전체 결과 가운데 세 글자로 이뤄진 문자열 ‘아직까’를 포함하는 모든 단어들의 빈도는 아래 표와 같습니다. 우리는 아래 표로부터 ‘아직까’의 출현빈도는 5349라는 사실 또한 알 수 있습니다.

구분 빈도수
아직까지 4714
아직까진 632
아직까니 3
총합 5349

그렇다면 ‘아직까’의 엔트로피는 어떻게 구할까요? 아래와 같습니다.


\(\begin{align*} H(X|아직까)=&-P(아직까지|아직까)\times \log { (P(아직까지|아직까)) } \\&-P(아직까진|아직까)\times \log { (P(아직까진|아직까)) } \\&-P(아직까니|아직까)\times \log { (P(아직까니|아직까)) }\\\\=&-\frac { 4714 }{ 5349 } \times\log { \frac { 4714 }{ 5349 } } -\frac { 632 }{ 5349 } \times\log { \frac { 632 }{ 5349 } } -\frac { 3 }{ 5349 } \times\log { \frac { 3 }{ 5349 } } \\\\ =&0.3679 \end{align*}\)

위와 동일한 방식으로 ‘아직’, ‘아직까지’, ‘아직까지도’의 BE를 구해 비교하면 아래 표와 같습니다.

구분 아직 아직까 아직까지 아직까지도
BE 2.95 0.37 3.46 4.69

위 표를 해석하면 이렇습니다. 우리가 온전한 단어로 쓰는 ‘아직’, ‘아직까지’, ‘아직까지도’는 그 경계에 다양한 글자들이 올 수 있으므로 BE가 비교적 높습니다. 하지만 ‘아직까’라는 문자열은 ‘아직까지’, ‘아직까지도’라는 단어의 내부에 있으므로 BE가 낮습니다. 바꿔 말해 BE가 높은 문자열을 단어 취급해도 크게 나쁘지 않은 결과를 낼 수 있다는 것입니다.

BE와 계열관계

형태소란 의미를 지니는 최소 단위인데요, 형태소를 분석하는 기준으로는 계열관계(系列關係paradigmatic relation)가 있습니다. 계열관계는 그 자리에 다른 형태소가 ‘대치’될 수 있는가를 따지는 것입니다. 자세한 내용은 이곳을 참고하시면 좋을 것 같습니다.

어쨌든 BE는 사실상 형태소(morpheme) 추출 기법입니다. 말뭉치에서 어떤 문자열이 자주 쓰이는지 빈도를 세어 문자열마다 형태소가 될 만한 지표를 반환(엔트로피가 높을 수록 형태소일 확률이 큼)해 주는데요. 이는 BE가 형태소의 중요 분석기준인 계열관계와 밀접한 관련을 맺고 있기 때문입니다. 아래 그림을 볼까요?

위 예시에서 ‘엔진’이라는 명사 뒤에는 조사 ‘-이’, ‘-에서’, ‘-을’ 등이 올 수 있습니다. 여기에서 ‘-이’, ‘-에서’, ‘-을’은 대치해서 쓸 수 있기 때문에 계열관계를 이룬다고 말할 수 있습니다. 그런데 이 경우 ‘엔진’의 BE는 매우 높을 겁니다. ‘엔진’ 뒤에 다양한 문자열이 등장할 수 있어 불확실성이 크기 때문입니다.

지금까지는 왼쪽에서 오른쪽으로 빈도수를 세는 걸 기준으로 설명을 해드렸지만, 오른쪽에서 왼쪽으로 빈도를 세어 BE를 계산하는 경우에도 마찬가지입니다. 아래 그림에서 ‘엔진’은 ‘Bracket’, ‘Head’와 계열관계를 맺고 있습니다. 아울러 ‘-에서’의 BE 또한 높습니다.

말뭉치 분석 결과

왓챠 리뷰 655만306개 리뷰를 학습해 BE 상위 500개 문자열을 나열한 결과는 아래와 같습니다. (left-side BE * right-side BE 결과를 내림차순 정렬)

만큼이나, 혹은, 처럼, 이나, 하고, 또는, 하며, 하거나, 하면서도, 덕분에, 이랑, 덕에, 대신, 속에서, 앞에서, 함과, 때문에, 에서의, 속의, 그리고, 했고, 보다는, 등등, 에서, 이라는, 또한, 이자, 하고도, 하다가, 땜에, 이든, 할때, 속에서도, 해서, 하던, 때문인지, 없이, 하게, 이라도, 위에서, 사이의, 마저도, 마저, 안에서, 조차, 조차도, 하나로, 하지만, 때매, 보단, 아저씨가, 에다가, 이지만, 했으며, 이후로, 같이, 인데, 같은, 스의, 마냥, 하는, 둘다, 감독은, 이며, 같은거, 함은, 들이, 아저씨의, 감독의, 감독이, 만큼은, 아래, 등의, 없이도, 만큼, 스가, 함이, 할만큼, 속으로, 해도, 으로, 이란, 함에, 했던, 거기에, 보다, 에서는, 에는, 했지만, 스와, 스는, 에서부터, 했다가, 들을, 세계의, 까지, 함으로, 에선, 에게서, 함을, 뒤에서, 감독님의, 들은, 씬에서, 이라며, 오빠, 위의, 만큼의, 만이, 속에서의, 시키고, 존나, 형의, 치고, 이라서, 하면서, 시가, 인지, 씬은, 사이에서, 한테, 당하는, 시키는, 하나는, 영화답게, 아저씨, 이었는데, 에만, 위에, 해지고, 에서도, 했으나, 이를, 집에서, 버전의, 형님의, 맞고, 이와, 뒤에, 적인, 적이고, 했다면, 그가, 할땐, 나는, 둘이, 영화의, 진짜, 액션의, 적이며, 함의, 특유의, 스를, 이었지만, 다가, 사이로, 보다도, 함도, 하다가도, 하나, 언니, 한데, 이기에, 발로, 형님이, 이처럼, 감독님이, 다음으로, 씬과, 에의, 들과, 이라면, 배우는, 그의, 시를, 시리즈는, 너의, 이었고, 하는게, 하듯, 들도, 대는, 할정도로, 거나, 성과, 해보이는, 졸라, 이거나, 작가가, 만을, 성의, 앞에선, 그를, 네가, 으로만, 되며, 일지라도, 하나를, 그렇게, 그는, 캐릭터는, 일때, 이라지만, 탓에, 인과, 함으로써, 했는데, 하다보니, 이후의, 하는데, 겁나, 감독을, 누나, 하니, 따위는, 2는, 에게, 이전에, 좀더, 했을때, 위를, 작은, 배우님, 형이, 씬이, 혼자, 만의, 하느라, 사이를, 드라마의, 하면, 뒤의, 옆에서, 영화들의, 결론은, 빨리, 없이는, 같은게, 수준의, 까지도, 감독님, 성을, 하더니, 이후에, 이었다면, 역의, 심지어, 이야기는, 언니가, 자체가, 버전, 아저씨는, 이라니, 했기에, 이고, 이름이, 영화로, 해놓고, 안에서의, 스도, 말고는, 이전의, 형은, 만으로는, 그들이, 영화는, 근데, 연기의, 액션이, 이요, 한건지, 방에서, 아주, 인데도, 인은, 과의, 주인공은, 세대의, 주제에, 이던, 부터, 빼고는, 영화라면, 자는, 속을, 해버리는, 딸이, 그녀가, 광고, 모두가, 이어도, 하니까, 이가, 1의, 영화인데, 캐릭터가, 커플이, 그나저나, 들까지, 감독에게, 하려면, 거리며, 스랑, 언니의, 당하고, 정도의, 사건을, 정의, 관객들이, 영화도, 갑자기, 시대의, 주인공이, 영화계의, 나를, 삼아, 스토리를, 게다가, 그러나, 들로, 같은건, 영화치곤, 작가의, 아이가, 중의, 모두를, 여자는, 터지는, 으로부터, 이였지만, 으며, 가서, 마지막에, 이후, 할때는, 이라고, 한건, 스에게, 시간에, 그것을, 보다가, 다른, 영화로는, 적으로, 피가, 자신이, 얼굴이, 결말은, 할때마다, 저런, 씬의, 주의, 밑에서, 영화지만, 영화처럼, 차는, 그녀의, 스처럼, 이면, 암튼, 이라는게, 손으로, 머리를, 자신의, 그래도, 맨날, 고도, 하라는, 부터가, 사는, 다들, 영화들은, 오빠가, 여자가, 속은, 영화와, 그치만, 하듯이, 이영화는, 영화이자, 드라마, 모두, 하지말고, 수준으로, 한듯한, 인이, 그에게, 시리즈의, 관계의, 버젼, 등이, 나의, 간지, 보니까, 시리즈를, 급의, 감독님은, 그것이, 모두에게, 괜히, 부분은, 치고는, 했는지, 시리즈가, 영화에서, 이라던가, 이냐, 남의, 해온, 물에서, 영화치고는, 액션은, 관객이, 시와, 그와중에, 레알, 드와, 속에도, 없는, 치며, 그들의, 팀이, 카드, 피는, 형님, 관객들은, 그것은, 성은, 장은, 인건지, 연출은, 점은, 캐릭터의, 인도, 트는, 드의, 배우들이, 스타일로, 스토리가, 시리즈에서, 시간을, 말고, 했어도, 주인공들이, 되게, 집을, 아줌마, 캐릭터를, 수와, 하다못해, 너는, 했으니, 강한, 할아버지가, 이의, 선생님의, 나오는, 화된, 모든게, 보는데, 게이, 되서, 문화를, 아빠가, 손이, 하도록, 타는, 지를, 온갖, 등으로, 중간에, 엄마가, 거리는, 살이, 몸이, 팬들은, 관객은, 이번엔, 이야기가, 이니까, 남자는, 마치, 적은, 그들은, 속에는, 하였고, 프로, 씬을, 엔딩은, 경찰이, 들이나, 어설픈, 배우가, 남자가, 나올때마다, 저렇게, 다며, 시켜서, 이렇게, 애니메이션의

코드

김현중 박사과정이 작성한 BE 코드를 사용했습니다. 저 역시 정리 용도로 남긴 것이니 문제되면 바로 삭제하겠습니다. 최신 코드는 김현중 박사과정의 깃헙 https://github.com/lovit/soy을 참고하시기 바랍니다.

사용법은 아래와 같습니다. 아래 코드에서 MaxScoreTokenizer 역시 김현중 박사과정이 만든 코드로 말뭉치에서 학습한 BE를 바탕으로 문장을 토큰으로 나눠주는 함수입니다.

import branching_entropy as tool
branching = tool.BranchingEntropy()
branching.train(reviews)
branchingtokenizer = tool.MaxScoreTokenizer(scores=branching.get_all_branching_entropies())
branching_tokenized_reviews = [branchingtokenizer.tokenize(review) for review in reviews]

Comment  Read more

Cohesion Probability

|

이번 글에서는 말뭉치 내 빈도로 단어를 추출하는 기법인 Cohesion Probabilty(이하 CP)에 대해 살펴보도록 하겠습니다. CP는 Kim&Cho(2013)가 제안한 모델인데요, 이 글은 모델 원저자인 김현중 서울대 박사과정이 진행한 2017 패스트캠퍼스 강의와 코드를 참고하였음을 먼저 밝힙니다. 그럼 시작하겠습니다.

기법 개요

CP는 연속된 글자의 연관성이 높을 수록 단어일 가능성이 높다는 가정 하에 구축된 모델입니다. $c_1$, $c_2$, …, $c_{n-1}$ 다음에 $n$번째 글자인 $c_n$이 많이 나오면 $n$개 문자열로 이뤄진 $c_1$, $c_2$, …, $c_{n-1}$, $c_n$은 단어일 것이라는 이야기입니다. 글자별로 조건부 확률을 구하여 모두 곱한 뒤 $1/n$승을 해서 구합니다. 아래 식과 같습니다.

[\begin{align} cohesion({ c }_{ 1 },{ c }_{ 2 },…,{ c }_{ n })&=\sqrt [ n ]{ \prod _{ i=1 }^{ n-1 }{ P({ c }_{ 1 },…,{ c }_{ i+1 }|{ c }_{ 1 },…,{ c }_{ i }) } }\&=\sqrt [ n ]{ \frac { Freq({ c }_{ 1 },{ c }_{ 2 },…{ c }_{ n }) }{ Freq({ c }_{ 1 }) } } \end{align}]

분석 예시

예를 들어보겠습니다. $cohesion(박태환)$은 아래와 같이 ‘박태환’ 빈도수를 ‘박’의 개수로 나눈 뒤 세제곱을 취해 구합니다. 아래 식에서 $N$은 말뭉치에 등장하는 단어 빈도수의 총합인데, 분자 분모에 동시에 있으므로 계산상 가능합니다. CP는 빈도만으로도 얼마든지 구할 수 있습니다.

[\begin{align} cohesion(박태환)&=\sqrt [ 3 ]{ P(박태|박)P(박태환|박태) } \ &=\sqrt [ 3 ]{\frac { P(박태) }{ P(박) } \frac { P(박태환) }{ P(박태) } } \ &=\sqrt [ 3 ]{ \frac { P(박태환) }{ P(박) } } \ &=\sqrt [ 3 ]{ \frac { Freq(박태환)/N }{ Freq(박)/N } } \ &=\sqrt [ 3 ]{ \frac { Freq(박태환) }{ Freq(박) } } \end{align}]

이번엔 실제 말뭉치를 가지고 예를 들어보겠습니다. 영화 리뷰 사이트 ‘왓챠’에서 655만306개의 리뷰를 수집했습니다. 우선 이를 글자 단위로 세었습니다.

구분 빈도수
14145
꿀잼 10179
꿀잼ㅋㅋ 306

위 표를 토대로 $cohesion(꿀잼)$과 $cohesion(꿀잼ㅋㅋ)$를 각각 구해보겠습니다.

[\begin{align} cohesion(꿀잼)&=\sqrt [ 2 ]{ \frac { Freq(꿀잼) }{ Freq(꿀) } } =\sqrt [ 3 ]{ \frac { 10179 }{ 14145 } } =0.8483\ cohesion(꿀잼ㅋㅋ)&=\sqrt [ 4 ]{ \frac { Freq(꿀잼ㅋㅋ) }{ Freq(꿀) } } =\sqrt [ 4 ]{ \frac { 306 }{ 14145 } } =0.3835 \end{align}]

위 결과를 해석하면 이렇습니다.

'꿀잼'이 단어일 확률은 '꿀잼ㅋㅋ'이 단어일 확률보다 두 배 가량 높다.

이를 토대로 ‘꿀잼ㅋㅋ’이라는 문자열을 토크나이즈(tokenize)하면 아래와 같습니다.

꿀잼,ㅋㅋ

말뭉치 분석 결과

지금까지 CP는 왼쪽에서 오른쪽 방향(forward)으로 빈도수를 세어 분석하는 방법만을 설명했는데요, 사실 오른쪽에서 왼쪽(backward)으로도 분석이 가능합니다. 우선 왓챠 리뷰 655만306개 리뷰를 학습해 forward 방향 CP 상위 500개 문자열을 나열한 결과는 아래와 같습니다. (CP * 빈도수 내림차순 정렬)

영화, 너무, 생각, 사랑, 연기, 액션, 스토리, 재미, 배우, 재밌, 사람, 최고, 스토, 있는, 정말, 우리, 느낌, 아니, 작품, 장면, 마지막, 캐릭터, 현실, 캐릭, 이야기, 감독, 만들, 없는, 있다, 음악, 진짜, 보고, 마지, 대한, 매력, ㅋㅋ, 영화를, 좋았, 처음, 기대, 내가, 없다, 하지만, 하지, 그리고, 인간, 괜찮, 기억, 같은, 하는, 이야, 함께, 주인공, 표현, 그리, 것이, 역시, 결말, 필요, 긴장, 다시, 좋은, 연출, 하나, 보는, 원작, 좋아, 같다, 않는, 영화가, 모든, 배우들, 가장, 시리즈, 주인, 엔딩, 지루, 소재, 마음, 훌륭, 반전, 인생, 그래, 모르, 영화는, 이런, 행복, 많이, 세상, 감동, 최고의, 뭔가, 흥미, 재미있, 완벽, 내용, 남자, 보여, 시간, 순간, 살아, 근데, gt, 긴장감, 몰입, ㅋㅋㅋ, 코미디, 계속, 조금, 시리, 이렇게, 아름, 존재, 있었, 밖에, 언제, 그냥, 만들어, 않았, 많은, 공포, 20, 지금, 된다, 애니, 친구, 결국, 코미, 충분, 히어로, 시작, 때문, 판타, 상상, 아름다, 한국, 판타지, ㅠㅠ, 위한, 사람들, 돌아, 노래, 히어, 관객, 싶다, 만든, 누구, lt, 귀여, 뻔한, 뛰어, 얼마, 다른, 로맨, 분위기, 위해, 새로, 감정, 그래도, 자신, 좋다, 영화의, 볼만, 엄청, 되는, 여자, 봤다, 모습, 떨어, 모두, 않은, 좋았다, 얼마나, 별로, 눈물, 억지, 끝까지, 아이, 봤는데, 애니메이션, 솔직, 들어, 느껴, 아닌, th, 새로운, 찾아, 보면, 생각하, 유쾌, 풀어, 애니메이, 분위, 정도, 킬링, 드라마, 나는, 이렇, 모르겠, 전개, 나오, 봐야, 못하, 항상, 속에, 때문에, 좋아하, yo, 의미, you, 굉장, 매력적, 그런, 아니라, 봤는, 부족, 드라, 없었, 화려, 애니메, 킬링타임, 못한, 아름다운, 있을, 킬링타, 문제, 영화에, CG, ㅋㅋㅋㅋ, 등장, 만드는, 따뜻, 개인, 느낌이, 않는다, 보여주, 무엇, 싶은, 끝까, 너무나, 극장, 내내, 궁금, 디즈니, 신선, 추억, 배우들의, 남는, 어떻게, 크리스, 아쉬, 당신, 로맨스, 설정, 한다, 머리, 봐도, 명작, 멋있, 그렇, 영상, 했다, 10, 잔인, 감독의, 힘들, 취향, 솔직히, 사람이, 초반, 미국, 엄마, 크리, 가족, 세계, 부분, 개인적, 약간, 잔잔, 사랑스, 얘기, 것을, 이해, 후반, 충분히, SF, 엑스, 개인적으, 훌륭한, 스릴, 좋아하는, 디즈, 집중, 대사, 순수, 말이, 개인적으로, 것은, 무서, 따라, 선택, 강동원, 든다, 지루하, 자체, 굉장히, 언제나, 일본, 재밌게, 누군가, 하고, ㅎㅎ, 만드, 서로, 확실, 복수, 기분, 돋보, 즐거, 201, 흘러, the, 귀엽, 혼자, 천재, 훨씬, 스릴러, 완벽한, 공감, 끝나, 충격, 재밌다, 엑스맨, 멋진, 평범, 섹시, 알았, 괜찮은, 청춘, 제목, 것이다, 환상, 연기가, 나오는, 깔끔, 사랑이, 제대로, 누군, 능력, 슈퍼, 말하, 생각이, 사랑하, 믿고, 캐릭터들, 장르, 역사, 1편, 아무, 제일, 중간, 연기력, 재밌었, 사실, 한번, 과거, 유치, 특히, 성장, 상상력, 실망, 어떻, 되었, 웃음, 통해, 느끼, 죽음, 희망, ㅋㅋㅋㅋㅋ, 모르겠다, 아쉽, 스타, 포스, 어떤, B급, 않았다, 빠져, 답답, 예상, 감독이, 타란티노, 멜로, 러닝타임, 전쟁, 강동, 생각보다, 알고, 개연성, 인상, 완전, 뻔하, 없었다, 얼굴, 목소리, 인간의, 속에서, 화려한, 만들었, 미친, 동화, 이상, 결말이, 그렇게, 있었다, 되어, 아름답, 특유의, 장면이, 있어, 병맛, 벗어, 떠나, 러닝타, 추천, OS, 후반부, 놀라, 흥미로, 현실적, 단순, 킬링타임용, ost, 맘에, 보여주는, OST, 실화, 중요, 나도, 분명, 있을까, 아쉽다, 러닝, 어디, 성공, 들었, 보다, 타란티, 아니다, 시대, 소름, 포스터, 굳이, 괜찮았, 못했, 없이, 그러, 공포영화, 사랑스러, 구성, 슬프, 헐리, 연기는, 누가, 갈수록, 영상미, 스토리가, 그래서, 절대, 생각보, 마지막에, 촬영, 않고, 철학, 좀비, 캡틴, 보기, 목소, 주는, 우리는, 씁쓸, 폭력, 놀란, 광기, 바라, 예술, 기억에, 5점, 보고싶, 아직, 가슴, os, 뮤지, 듯한, 주제, 재미없, 욕망, 왠지, 운명, 설명, 지나

backward 방향 CP 상위 500개 문자열은 아래와 같습니다. (CP * 빈도수 내림차순 정렬)

지만, 으로, 에서, 는데, 적인, 하고, 하게, 하는, 지막, 화를, 처럼, ㅋㅋ, 었다, 하다, 까지, 을까, 다면, 이다, 부터, 리고, 에게, 들이, 다는, 들의, 화가, 렇게, 으면, ㅋㅋㅋ, 하지, 지는, 적으로, 보다, 이란, 만큼, 영화, 라는, 면서, 야기, 았다, 해서, 었던, 니다, 하지만, 했던, 리는, 기를, 했다, 로운, 다고, 토리, 화는, 름다운, ㅋㅋㅋㅋ, 러운, 어요, 화의, 스러운, 라고, 기가, 에겐, 수록, 리가, 니까, 다운, 리즈, 대로, ㅠㅠ, 래도, 기에, 한다, ou, 인공, ng, 는건, 니라, 기엔, 라면, 미디, 이지만, 구나, 이나, 지도, 들을, 이라, 한테, 어서, 버린, 이라는, 다가, 같은, 는게, 보단, 들은, ing, ㅋㅋㅋㅋㅋ, 하며, 었는데, er, 동안, 에도, 인데, 으나, 다니, 문에, 을때, 가는, 하여, 는다, 기도, 기는, 없이, 이고, 네요, 하면, 리를, 는지, 은데, 서도, 주는, 았던, 라도, 았는데, 으로도, 하기, 이야, 이션, 니메이션, 에선, 전히, 어야, 인가, 어낸, 일까, 이랑, 히려, 었지만, 고의, 겠다, ll, 되는, he, 메이션, 릭터, 아서, 인지, 릴러, 더라, 습니다, 했는데, 있는, 했지만, 만으로도, 나는, 였다, 로도, 러나, 어진, 이크, 세요, 로써, 어난, 우들의, 이클, 라니, 이지, 마나, 여준, 래서, 분히, 면서도, 지고, 야기를, nd, 간의, 에는, 들에게, 이었다, 화에, 도록, 번째, 는걸, 라마, ㅎㅎ, 어도, 으며, 랑스러운, 조차, 떻게, 이는, 화중, 인적으로, 는거, 오는, 토록, 나마, 스트, 이라면, 드는, 장감, 겠지만, 았지만, 었음, 무리, 이언, 이라고, 리오, 인줄, 음을, 인듯, 럭저럭, 음부터, 맨틱, 쉬운, 력적인, 기와, 저럭, 청난, 없는, 닐까, 시간, 화에서, 만한, 진다, GV, 들과, 밌게, ow, 스맨, 0년대, 적이고, 아요, 때문에, 지를, 스터, 무나, 화관에서, 동원, 아하는, 미가, 독의, 리의, 어지는, 었으면, 시절, 토리가, on, 어버린, 지컬, 형적인, 하나, 장에서, 화로, ㅠㅠㅠ, 0, ic, 함을, ㅜㅜ, 고싶다, 도로, 란티노, 으니, 거야, 지가, 간이, 직히, 리와, 여주는, 지막에, 이트, 었을까, 타임, st, 마저, 잖아, 스의, 상을, 이가, 대를, 음에, 자의, ve, 대체, 쉬움, 이첼, 치는, 력이, 저씨, 스팅, 한데, 고자, 상미, 관에서, 링타임용, 실적인, 보다는, 었다면, th, re, 지지, 을텐데, 르겠다, 하면서, 적이다, 수를, 에서도, 을듯, 티노, 음으로, 있게, 았음, 다른, 우들, 보면, 보니, 성을, 하는데, 자가, 들어, an, 반부, 제나, 년대, 당히, 나도, 서는, 니퍼, 스가, 국식, 상적인, 람이, 거나, 거운, 영화의, es, 각보다, 르는, 웠다, 타임용, 더니, 있다, 으로써, ion, 음이, 장히, 기력, 맨스, 이드, 간에, 칼렛, 감이, 는가, 야기가, 만으로, 으론, 토리는, 보고, mp, 이라니, 인공이, 이며, 함이, ck, 정을, 라서, 여운, 들어낸, 종일관, 니깐, 이자, 이빗, 함과, 미를, ST, 각이, 된다, 미있게, 억에, 시킨, 리셰, 스를, 만에, 성이, 리우드, 지의, 대한, 텐데, ed, 레딧, 실히, 간중간, E0F, tic, 니엘, 티븐, 리도, 람들이, 신의, 임용, 입니다, 아갈, 려고, 해야, 랑을, 것도, 걸까, 합니다, ㅠㅠㅠㅠ, 학교, 면이, 프닝, 하긴, 스럽다, 쉽다, 15, 까운, 미로운, 정이, 해도, 랑하는, 웠던, ver, 에서는, 감을, 인의, 해요, 야할, 리에, 구하고, 쾌한, 나서, 나리오, 야지, 물이, 럼에도, 일관, 겠지, 들어진, ㄷㄷ, 번쯤, 해지는, 무나도, 에서의, 로는, 분이, 작을, 보는, 한다면, 영화를, 15, 우드, 더라면, ay, ove, 라이언, 간을, 졌다, 인공의, 리스토퍼, 직도, 들었다, 독이, 신이, 다는걸, 사가, 주인공, 이의, 렸다, 0F, 점을, 리지, 각하게, 하면서도, 력을, stic, ly, 준다, 사를, 벽한, 아온, 어가는, 정한, 서운, 화였다, 독님, 릴때, 중에, 화다, 한듯, 설픈, 해진, 토리를, 국판, 트맨, 이라도, 면은, 르게, hing, 나고, 하고자, 764

코드

김현중 박사과정이 작성한 CP 코드를 사용했습니다. 저 역시 정리 용도로 남긴 것이니 문제되면 바로 삭제하겠습니다. 최신 코드는 김현중 박사과정의 깃헙 https://github.com/lovit/soy을 참고하시기 바랍니다.

사용법은 아래와 같습니다. 아래 코드에서 CohesionTokenizer 역시 김현중 박사과정이 만든 코드로 말뭉치에서 학습한 CP를 바탕으로 문장을 토큰으로 나눠주는 함수입니다.

import cohesion_probability as tool
cohesion = tool.CohesionProbability()
cohesion.train(reviews)
cohesiontokenizer = tool.CohesionTokenizer(cohesion)
cohesion_tokenized_reviews = [cohesiontokenizer.tokenize(review) for review in reviews]


Comment  Read more

Word2Vec과 품사 정보 (1)

|

이번 글에서는 Word2Vec으로 임베딩한 단어 벡터가 품사의 종류와 어떤 연관을 맺고 있는지 살펴보도록 하겠습니다. 그럼 시작하겠습니다.

품사와 분포

한국어 품사를 분류할 때 가장 결정적인 기준은 바로 기능(function)이라고 합니다. 기능이란 해당 단어가 문장 내에서 어떤 역할을 하는지 나타내는 개념입니다. 그런데 한국어에서는 단어의 기능이 분포(distribution)와 매우 밀접한 관련을 맺고 있다고 합니다. 분포란 단어의 등장 순서나 위치를 말합니다. 이와 관련 자세한 내용은 이곳을 참고하시면 좋을 것 같습니다.

Word2Vec은 단어를 벡터로 바꾸는 임베딩(Embedding) 기법입니다. 특히 Skip-Gram(SG)의 경우 중심단어로 주변단어를 더 잘 예측하기 위해 단어벡터들을 조금씩 업데이트하면서 학습이 이뤄지는 구조입니다. 다시 말해 Word2Vec은 단어벡터를 만들 때 주변 단어의 분포 정보를 활용한다는 것이지요. 이와 관련 자세한 내용은 이곳을 참고하시면 좋을 것 같습니다.

어쨌든 제가 세운 가정을 다시 정리하면 아래와 같습니다.

(1) 한국어 품사 분류의 가장 중요한 기준은 기능이다.

(2) 한국어 단어의 기능은 분포와 밀접한 관련이 있다.

(3) Word2Vec은 말뭉치의 분포 정보를 학습에 반영한다.

(4) Word2Vec으로 임베딩된 단어 벡터엔 품사 정보가 내재해 있을 것이다.

(5) 같은 품사에 해당하는 단어 벡터는 서로 유사할 것이다.

실험 설계

이번 실험에 사용한 말뭉치는 영화 리뷰 사이트 ‘왓챠’에서 수집한 655만306개의 리뷰입니다. 여기에 Branching Entropy(이하 BE)Cohesion Probability(이하 CP) 기법을 적용해 각각 학습했습니다. BE와 CP는 모두 말뭉치를 글자 단위로 빈도를 세어서 단어일 가능성을 점수로 나타내는 기법인데요. BE는 단어의 외부 정보, CP는 단어의 내부 정보를 점수화한다는 점에 차이가 있습니다.

BE에 대해 자세히 살펴보시려면 이곳을, CP에 관해서는 이곳을 참고하세요. 아울러 코모란 형태소 분석기를 사용해 토크나이징을 한 뒤 실험을 수행한 결과를 보시려면 이곳을 참고하시면 좋을 것 같습니다.

어쨌든 BE와 CP를 동시에 고려해 단어 점수 표를 만들고, 이를 바탕으로 말뭉치에 tokenize를 수행했습니다. 토크나이저 함수는 김현중 서울대 박사과정이 만든 토크나이저를 약간 커스터마이징했습니다. 아래와 같습니다.

all_tokenized_contents = []
for review in reviews:
    tmp = [tokenize(token) for token in review.split()]
    tmp = flatten(tmp)
    all_tokenized_contents.append(tmp)

#############################################
# functions                                 #
#############################################
def tokenize(word, max_l_length=10):
    if (not word) or (len(word) <= 2):
        return word
    score = []
    for e in range(2, min(len(word), max_l_length)+1):
        subword = word[:e]
        _, branching = branching_dict.get(subword, (0, 0))
        cohesion, _, _, _ = cohesion_dict.get(subword, (0, 0, 0, 0))
        # (word, cohesion * branching entropy, length)
        score.append((subword, cohesion * branching, e)) 
    result1 = sorted(score, key=lambda x:(x[1], x[2]), reverse=True)[0][0]
    if len(result1) < len(word):
        result2 = word.replace(result1, "")
        if len(result2) > 2:
            result2 = cpbe_tokenize(result2)
        return [result1, result2]
    return result1
    
def flatten(tokens, basestring = str):
    result = []
    for token in tokens:
        if hasattr(token, "__iter__") and not isinstance(token, basestring):
            result.extend(flatten(token))
        else:
            result.append(token)
    return result

토크나이징한 결과물의 일부는 아래와 같습니다.

처리 전 처리 후
지금도 가슴 한 켠에서 상영되고 있는 그런 영화 지금, 도, 가슴, 한, 켠에, 서, 상영, 되고, 있는, 그런, 영화
마지막 장면은 책을 읽으며 상상했던 그대로였다 마지막, 장면, 은, 책을, 읽으며, 상상, 했던, 그대로, 였다
화려한 의상과 소품 인테리어 화려한, 의상, 과, 소품, 인테리어
억지스러운 반전에 씁쓸하고 슬픈 이야기 억지스러운, 반전, 에, 씁쓸하고, 슬픈, 이야기
핀처가 세운 야심에 루니 마라가 차지한다 핀처, 가, 세운, 야심, 에, 루니, 마라, 가, 차지, 한다

이렇게 토크나이징을 수행한 말뭉치에 Word2Vec 기법을 적용했습니다. 하이퍼파라메터 조합은 아래와 같습니다.

embedding 차원 수 : 100

window 크기 : 3

min_count : 100

Skip-Gram 적용

실험 결과1 (종결어미)

우선 종결어미를 중심으로 실험 결과를 살펴보겠습니다. 앞으로 나열할 표는 해당 단어벡터와 코사인 유사도가 가장 높은 단어들 100개 리스트입니다.

-다

다ㅋㅋ, 다ㅠㅠ, 다ㅠ, 다ㅜ, 다ㅎ, 다고, 다ㅡ, 다ㅋㅋㅋ, 다라는, 다ㅋ, 다ㅎㅎ, 다는, 다ㅋㅋㅋㅋㅋ, 다ㅋㅋㅋㅋ, 다더, 다던, 다구, 얌, 다며, 다면, 다란, 었다, 다던데, 다네, 다지만, 다거나, 다아, 다라고, 다의, 다와, 다잉, 에요, 구먼, 예요, 구만, 닷, 닼ㅋㅋㅋ, 다기, 라능, 었당, 엿다, 였다, 로구나, 죠, 었겠지, 다도, 에여, 야ㅠㅠ, 었군, 였음, 지요, 었음, 겠지, 였군, 었지만, 거든요, 더라, 단다, 노병은, 듯하다, 다에, 것같다, 거늘, 었는데, 란다, 라해도, 다라, 었달까, 엇다, 군, 더라도, 엇음, 랍니다, 야라는, 었더라, 였어, 구나, 었네, 다길래, 희안한, 었구나, 지ㅋ, 닼ㅋㅋ, 였어요, 었죠, 다진, 었으나, 였당, 지만, 네, 네요, 시다, 었잖아, 더군, 여, 엿는데, 군요, 로다, 었습니다, 당


-요

요ㅠㅠ, 요ㅎㅎ, 요ㅜ, 요ㅋㅋ, 요ㅠ, 요ㅎ, 효, 욤, 봐요, 요라, 욥, 염, 욧, 졌네, 봐, 부다, 봉가, 아뇨, 요로, 싶네요, 져요, 저는, 야해, 에요, 신가, 보오, 지네요, ㅜㅠ, 봅니다, HO, 야지, 그럼, 야돼, 썽, ㅎㅎ, 싶당, 지더라, 가요, 집니다, at, 나요, 싶습니다, 해요, 있답니다, 시벌, 암튼, 야징, 흑흑, 저처럼, 님, 요가, ㅎ, 찌, ㅜㅜ, 있잖아, 잘지내, 에여, 줄께, ㅠㅠ, 진다, 주세요, 제가, 쪙, 께요, 본데, 여, 쪄, 야됨, ㅇㅅ, 시다, 질거야, 졌다, 해여, 줘요, 님도, 미안해요, 해용, 있습니까, 아ㅏㅏ, 줄게요, 할아부지, 싶네, ㅠ, 8ㅅ8, ㅜ, 요를, 죄송해요, 예요, 씨, 야되, 보네, 죠, 주신, 여튼, 씀, 서요, 응, 어요, 진거, ㅅ


-구나

구만, 군, 구먼, 군요, 겠구나, 었구나, 겠지, 거구나, 네, 거니, 죠, 네요, 지요, 네ㅋㅋ, 었군, 단다, 단걸, 지ㅋ, 당, 더라, 거늘, 네ㅠㅠ, 였구나, 네여, 을까, 달까, 었나, 었지, 넹, 건가, 건만, 했구나, 었네, 였군, 지라는, 더라는, 대요, 거죠, 도다, 답니다, 더군요, 냐, 잖아, 쟈나, 거야, 거다, 었는데, 는가, 가보다, 나보다, 겠죠, 거겠지, 네ㅋ, 드만, 갑다, 네ㅋㅋㅋ, 자나, 는대, 어, 냐만은, 거든요, 오랜만이네, 많구나, 더이다, 하구나, 어라, 을줄이야, 건데, 을꺼야, 지ㅠㅠ, 거였어, 노라, 음, 나봄, 거지, 아냐, 지ㅠ, 댜, 지ㅜ, 당ㅋ, 더군, 말인가, 닼ㅋㅋ, 습니다, 있구나, 걸까, 더냐, 쪄, 거든, 거냐, 어요, 지뭐, 음을, 었을까, 겟지, 지ㅋㅋㅋ, 으려나, 나, 겠나, 나봐


-군

군요, 구만, 구나, 구먼, 네요, 당, 죠, 네, 네여, 더라, 넹, 더군요, 지ㅋ, 달까, 단다, 지요, 겠지, 소, 더라는, 겠구나, 더군, 습니다, 네ㅋㅋ, 답니다, 네ㅠㅠ, 당ㅋ, 음, 긴함, 었군, 네ㅋ, 대요, 슴, 슴다, 자나, 었구나, 따, 지라는, 도다, 드만, 어요, 네용, 더이다, 거늘, 음ㅎㅎ, 읍니다, 더만, 냐만은, 건만, 어, 으려나, 는가, 는뎅, 습니까, 엌ㅋㅋㅋ, 었는데, 내요, 거든요, 거니, 겠죠, 긔, 긴하지만, 는디, 쟈나, 든데, 잖아, 네ㅋㅋㅋ, 냐, 나요, 겠군, 더냐, 음ㅋ, 음ㅎ, 을까, 단걸, 나ㅋㅋ, 닼ㅋㅋ, 겠지만, 겟지, 다잉, 다던데, 댜, 였군, 지ㅋㅋ, 국, 닼ㅋㅋㅋㅋㅋㅋ, 나보다, 나ㅠ, 긴한데, 겠네, 드라, 나뿐인가, 다ㅋㅋ, 거보면, 거죠, 음ㅋㅋㅋㅋ, 러시아, 닼ㅋㅋㅋ, 법, 닼ㅋㅋㅋㅋ, 말입니다


-네

더라, 넹, 네요, 네ㅋㅋ, 네ㅋ, 네ㅠㅠ, 네ㅋㅋㅋ, 더이다, 네여, 구만, 더만, 당, 잖아, 네용, 죠, 긔, 더군요, 거든요, 겠지, 더라는, 군, 거든, 구먼, 었네, 자나, 습니다, 쟈나, 어요, 냐, 는디, 음ㅎ, 엌ㅋㅋㅋ, 음ㅋㅋㅋㅋㅋㅋ, 구나, 드만, 군요, 쟈냐, 던데, 도다, 든데, 어, 지뭐, 닼ㅋㅋㅋㅋ, 당ㅋ, 어ㅋㅋㅋ, 음ㅎㅎ, 긴함, 더군, 음, 닼ㅋㅋㅋㅋㅋㅋ, 졍, 거늘, 구요, 따, 닼ㅋㅋ, 니깐, 나봄, 댜, 얔ㅋㅋㅋ, 음ㅋㅋㅋㅋ, 나보다, 지요, 던가, 겠죠, 겠네, 겠어, 음ㅋ, 엉, 구, 아ㅋㅋ, 나봐, 슴, 긴하지만, 느냐, 슴다, 나요, 는뎅, 었죠, 지ㅋ, 는데, 더니, 는줄, 어라, 겠니, 었는데, 앜ㅋㅋㅋㅋ, 을꺼야, 건만, 닼ㅋㅋㅋ, 읍니다, 소, 내요, 나봐요, 더냐, 겠냐, 을거야, 긴하, 는대, 어ㅠ, 긴한데


-마

마요, 마라, 마셈, 말아라, 맙시다, 말자, 마세요, 말아요, 할아, 말라고, 줘, 작작, 마세, 제발, 말기, 말길, 말라, 말구, 말어, 건들지마, 말던가, 만요, 말아, 주오, 말것, 마소, 해줘, 마도, 그만, 다오, 않겠습니다, 줘요, 아르, 쉬세요, 않니, 미츠, 아오, 둬, 주세요, 내버려둬, 것좀, 말란, 그랬어요, 해라, 말라는, 말아야, 지마, 말지어다, 루, 마로, 해봐, 않어, 에잇, 나대, 해주세요, 않으, 들아, 와라, 님아, 됐잖아, 놔, 머니, 아씨, 않겠, 마오, 씨바, 욧, 오, ㅆ, 함부로, 않아도, 죄짓고, 해줘요, 마들, 소서, 얘들아, 말지, 마시, 말걸, 하지말고, 세요, 징한, 못했습니다, 말고, 힝, 못함, 데어, 않겠다, 러면, 쉬게, 년아, 말거, 시팔, 혀, 나카, 씨발, 못햇다, 노노, 미라, 하십


-냐

냐고, 더냐, 던가, 죠, 맞냐, 잖아, 었냐, 냐가, 좋냐, 겠는가, 얔ㅋㅋㅋ, 네, 냐는, 더라, 겠냐, 라구요, 거늘, 겠나, 구만, 야ㅋㅋ, 겠니, 자나, 겠어, 냐면, 느냐, 겠지, 냐를, 이냐, 었니, 냐의, 란말, 다냐, 쟈나, 구먼, 지요, 냔, 거든, 뭔데, 었잖아, 되냐, 네ㅋ, 더라는, 지ㅋ, 드만, 죄야, 었을까, 중헌디, 참나, 었나, 야이, 었네, 려나, 었더라, 네ㅠㅠ, 냐만은, 나요, 하냐, 겠습니, 란다, 었지, 냐며, 을줄이야, 뭐냐, 뭐여, 거든요, 뭐요, 로다, 넹, 는가, 란말이, 입니까, 니까, 십니까, 더만, 라구, 이딴게, 라더니, 든, 겟네, 뭐야, 묻자, 겠어요, 었군, 했냐, 었구나, 지ㅋㅋㅋ, 야ㅠㅠ, 봤냐, 네ㅋㅋㅋ, 나봐요, 을까, 네ㅋㅋ, 느니, 죽느, 되든, 니라, 긔, 방탄유리, 구나, 였군


-니

니ㅠㅠ, 니요, 길래, 니깐, 면, 느니, 하니, 뇨, 더니, 는게, 구, 구요, 던데, 능, 곤, 니까, 했더니, 든가, 며, 한들, 면야, 기보단, 던가, 려니, 시고, 고는, 맙소사, 시니, 면서, 다보니, 깐, 셨나, 게다가, 라구, 는거, 하하하하하하, 는건, 니라, 려나, 는데, 더만, 십니까, 셔서, 는거야, 는걸, 겠나, 해야하나, 네ㅠㅠ, 냐, 거기다, 오, 보니, 대다, 했는데, 와아, 랬지, 말어, 리라, 고보면, 고보니, 네, 기엔, 라니, 고, 셨어요, 겠어, 하하, 니만, 기에, 리라고, 그런데, 려면, 되니, 네ㅋ, 랴, 못해, 지마, 세요, 젠장, 있으니, 제길, 싶었는데, 고서, 고도, 시면, 아아, 하더라도, 왔더니, 핳, 더구나, 누, 고선, 메, 우니, 아놔, 오니, 시오, 든데, 앗, 않습니


-까

까요, 까나, 깐, 텐데, 려나, 까라는, 꺼같다, 꺼야, 테니, 꺼같, 꼬, 라나, 까봐, 껄, 테니까, 을까, 줄이야, 런지, 련지, 꺼에요, 았을까, 땐, 울까, 있나, 있을까, 있겠습니까, 꺼다, 테지, 질까, 없으니, 쏘냐, 좋냐, 꺼면, 으려나, 있으려나, 으니, 습니까, 게요, 겠나, 때엔, 테다, 때는, 진데, 은데, 래, 찌, 됐지, 됬지, 법하, 어ㅠ, 꺼, 테고, 없겠지, 랴, 래요, 때, 리가, 냐, 있겠는가, 졍, 까를, 있으니, 을라, 같냐, 없겠, 수록, 거란, 있었을까, 거다, 을꺼야, 을거야, 될까, 을듯, 을거, 지경, 거야, 때다, 을지, 줄텐데, 지라도, 때의, 았나, 수있, 줄은, 겠네, 있겠구나, 었니, 는뎅, 뿐인데, 됐잖아, 거라고, 없겠다, 없죠, 있겠, 때랑, 겁니다, 때에는, 겠는가, 있겠지, 냐고


-랴

겠는가, 있겠는가, 리오, 십니까, 있으, 있겠습니까, 므로, 리라, 어떠하, 리, 겠냐, 어떠, 냐고, 겠니, 려나, 렴, 려면, 겠습니, 시라, 겠나, 까요, 세요, 련다, 쏘냐, 신가, 리란, 겠어, 잊으, 든, 던간에, 냐, 리라고, 더냐, 던가, 있냐, 노니, 시오, 든지, 니깐, 없으, 리라는, 셨다, 어찌, 었으, 시니, 시죠, 어떻고, 시겠, 니까, 셨나, 든간에, 어쩌, 됬든, 하랴, 까, 죠, 시다, 겠소, 신다면, 누, 있을까, 시고, 있나, 되든, 셨어요, 없겠지만, 습니까, 은가, 하겠는가, 리나, 않으, 련지, 저쩌고, 없으니, 셨는, 셔, 어떠냐, 래요, 꼬, 없습니다, 있습니까, 느냐에, 겠어요, 던지, 려구, 너희는, 시는, 말인가, 려한다, 시나, 며, 느냐, 라구, 니, 대수, 려니, 없군, 너라, 시길, 누가


-라

라고, 라서, 라하, 여서, 라며, 라길, 라할, 래서, 라곤, 라네, 니까, 여, 라구, 라니, 야, 라지만, 어서, 야라, 작이라, 다라고, 이라, 리라, 거라, 에요, 라구요, 라능, 라면, 라해, 니깐, 라라, 랄까, 야ㅠㅠ, 었기에, 예요, 라는, 란다, 랬다, 시라, 라거, 일거라, 라도, 다고, 엿다, 라해도, 라를, 에여, 기에, 라그, 얌, 랍니다, 얍, 그런지, 라지, 라의, 다라, 였기에, 왔기에, 일것이, 라가, 란, 이니, 이라고, 라던, 라와, 야지, 란걸, 겠거니, 아무리, 을거라고, 라기엔, 란건, 주라, 였단, 닷, 므로, 뭐니, 여야만, 칭할, 보더, 줘서, 였다, 야가, 있느, 지뭐, 얔ㅋㅋㅋ, 야겠다, 래, 자랑스럽게, 였으니, 랬지, 이기에, 진다고, 사극이라, 졌으, 문에, 꺼라, 엿음, 이제는, 였구나, 그래서


-지

지가, 지도, 지를, 지ㅠ, 려하지, 지ㅜ, 지ㅋㅋㅋ, 지는, 지ㅠㅠ, 진, 지ㅋ, 지요, 겠어, 겠냐, 되지, 냐고, 겠는가, 그렇지, 하지, 지않, 띄지, 지라는, 철들지, 죠, 리지, 징, 겠지, 키지, 지ㅋㅋ, 녹슬지, 입지, 시지, 었는지, 기란, 려나, 울지, 죽지, 는지, 달지, 겠군, 지지, 지의, 는가를, 냐, 겟음, 좋지, 겟어, 겠니, 거나, 보지, 구만, 쉽지, 디, 구애받지, 묻지, 하질, 스럽지, 오지, 되, 남지, 네ㅋ, 보질, 답지, 돋지, 느냐, 있지, 질, 늦지, 던가, 긴했, 려는지, 겠지만, 늙지, 넹, 겠나, 끼지, 잃지, 더냐, 겠음, 들지, 화하지, 뛰지, 겠구나, 단걸, 더라도, 나진, 지이, 겠다, 살진, 었지, 나지, 네요, 면서도, 는진, 많지, 줄지, 벗지, 겠죠, 닮지, 겟네


-고

고도, 고는, 고만, 며, 기보다, 고선, 고들, 을거라고, 는거, 던가, 구, 면서, 기보단, 고나, 곤, 을거라, 는건, 고싶다, 고서, 다고, 고라, 거나, 다라고, 는걸, 라고, 는것, 는게, 면서도, 었고, 던데, 고야, 는데, 느니, 니, 더니, 부시고, 혹자는, 을때가, 는듯, 구요, 든가, 그렇다고, 는거야, 지만, 듯이, 면, 다못해, 기고, 튀고, 그러면서, 어라, 게끔, 다보니, 맞고, 게하는, 겠소, 길래, 능, 기까지, 유치하다, 자고, 기만, 때리고, 야하고, 자부, 하고, 고가, 기전에, 헌데, 지않고, 을만, 기도, 었으나, 죽이고, 겠냐, 고싶, 지못, 우고, 나고, 었냐, 려는지는, 을거라는, 으라, 지말, 겠구나, 었나, 는구, 던걸, 었는지, 던영화, 더만, 았나, 었더라, 까놓고, 파헤치고, 냐고, 롭다고, 뛰고, 심각하게, 물론


-며

면서, 면서도, 하며, 기보단, 거나, 고, 기보다, 도록, 고도, 고선, 니, 려한다, 듯이, 느라, 다보니, 려하는, 리라, 므로, 다보면, 기위해, 십니까, 이며, 던가, 다니, 느냐에, 든가, 게된다, 려다, 게함, 지말, 느니, 걸으면서, 게한다, 내며, 기에, 가며, 시고, 되, 곤, 던지, 게하는, 하면서, 셔서, 셨나, 느냐, 기전에, 공유하며, 리며, 기엔, 다못해, 쓰며, 기전, 려는, 시니, 시던, 련다, 기에는, 려고, 러, 지않고, 려면, 기까지의, 려하지만, 않으며, 안으, 다가, 리면서, 신듯, 여, 게끔, 기만, 리만치, 타며, 던, 그러면서, 치며, 더니, 않고, 더라도, 고싶다, 신다, 기에도, 못하고, 려, 려던, 랴, 기까지, 우며, 되며, 쥐며, 길래, 키며, 바밤, 자마, 시는, 시길, 려나, 낌없이, 세요, 게한


실험결과2 (조사)

종결어미와 같은 방식으로 조사도 분석했습니다.

-이

은, 이야말로, 이었는데, 이영화가, 이란, 홀이, 스완이, 이었을까, 쇼가, 성이, 이었다, 타이틀이, 이미지가, 내레이션이, 이였다, 체가, 이라, 이죠, 미가, 조커가, 후광이, 이었는지, 을, 이다, 품이, 흥이, 이가, 애정이, 이여서, 신이, 이라는, 갈증이, s가, 이였는데, 샘이, 이였을까, 화가, 이었구나, 가위손이, 2가, 시퀀스가, 수명이, 강박이, 기준이, 우울함이, 향이, 유쾌함이, 등이, 포가, 으로, 전체가, 이었던, 수퍼맨이, 고뇌가, 이라도, 이랑, 드래곤길들이기, 표가, 이었고, 이었지만, 실이, 이라고, 1이, 이구나, r가, 눙물이, 후가, 스러움이, 입담이, 스카이폴이, 정사씬이, 토토가, 이랄까, 이었음, 수다가, 후유증이, 이군, 배경음악이, 이나, 잭슨이, 이라면, 3이, 조페시, 이프온리, 들이, 이론이, 이잇, 그림자가, 이였어, 가가, 유치함이, 다움이, 싱이, 거인이, 3가, 업이, 씬이, 과, 감각이, 불협화음이


-가

는, 체가, 와, 를, 퀸이, 로가, 터가, 라인이, 디가, 노튼이, 관이, 후가, 트가, 애가, 젠버그가, 스가, y가, 이미지가, 링이, 마인드가, 시그널이, 아저씨가, 2가, 맨이, 보스가, 즈가, 물이, 쇼가, 3가, 력이, 파가, 역할이, 활약이, 색이, 공리가, 파커가, 립이, 틱이, 크가, 활이, 레저가, 핏이, 존슨이, 4가, 아빠가, 인어가, 들이, 하녀가, 부재가, 오빠가, 팀이, 이정현은, 트랙이, 너가, 등이, 로, 가수가, 키튼이, 맥도, s가, 아줌마가, 류가, 색깔이, 그루가, 엘레, 춤이, 자매가, 건이, 곰이, 무게감이, 와는, 성우가, 악역이, 주제의식이, 그레이가, 였기에, 대결이, 였을까, 언이, 포가, 브가, 위가, 형이, 쉽이, 빨이, 벨이, 더프, 짐이, 콘이, 노가, e가, 마녀가, 사만다가, 제다이가, 프가, 극이, 강철중은, 이영화가, 조커가, 담이


-께서

시던, 께, 님이, 셨다, 감사합니다, 들께, 님, 님께서, 하셨던, 셨던, 주신, 교수님이, 선생님, 신다, 시는, 님은, 쌤이, 고맙습니다, 님들, 선생님이, 존경합니다, 저희, 셨어요, 님께, 분들이, 하신, 많으셨습니다, 셨는, 하셨다, 세요, 셔서, 신, 목사님, 사마, 말씀, 오신, 분들, 드린다, 강사, 교수님, 어머니가, 수고하셨습니다, 안녕하세요, 왈, 님도, 어머님, 시면, 님을, 하신다, 오셨, 계신, 하시고, 지망, 하사, 께는, 주셨, 어머니, 시고, 분께, 하셨어요, 가셨, 주셔서, 아버님, 말씀을, 학교에서, 하십니, 가신, 님의, 주시는, 표합니다, 국어, 죄송해요, 만수무강, 하셔서, 존경하는, 분이, 선배, 느님, 두분이, 놓으, 표함, 제가, 1학년, 담임, 십니, 할아버지, 죄송합니다, 저는, 계셨, 부장, 하심, 저에게, 시죠, 왕년에, 계실, 않겠습니다, 님에게, 보셨, 계시, 시다


-에서

에선, 들에서, 안에서, 판에서, 로부터, 내에서, 씬에서, 이후에, 속에서, 여기서, 가에서, 상에서, 왕국에서, 사에서, 감옥에서, 거기서, 데서, 이후로, 부분에서, 계에서, 역에서, 1에서, 물에서, 신에서, 끝에서, 공항에서, 곳에서, 이후, 룸에서, 무대에서, 로에서, 책에서, 밑에서, 전편에서, 그곳에서, 동굴에서, 전작에서, 속, 2에서, 아래에서, 지점에서, 나라에서, 바닥에서, 삶에서, 중심에서, 판, 위에서, 작에서, 2편에서, 어둠속에서, 어로, 편에서, 거리에서, 사극에서, 함에서, 어디서, 에, 들로부터, 쪽에서, 에까지, 최근에, 이후부터, 병점, 그늘에서, 오면서, 이후의, 2관, 직전에, 땅에서, 통하여, 스카이폴에서, 드디어, 오디션, 크레딧에서, 극에서, 예전에, 모습에서, 스크린에서, 통해, 원에서, 앞에서, 상륙작전, 호텔에서, 3단, 에나, 부산에서, 시장에서, 꿈속에서, 점에서, 올나잇, 장에서, 속의, 길에서, 한가운데서, 방에서, 이전에, 한복판에, 통에서, 로, 진가


-을

등을, 들을, 만을, 사를, 링을, 고뇌를, 업을, 접점을, 우울함을, 씬을, 계를, 미를, 의식을, 권을, 이를, 그를, 식을, 팀을, 이라도, 시각을, 성을, 미래를, 코드를, 관점을, 이미지를, 열망을, 아름다움을, 섬을, 그것을, 신을, 으로, 스러움을, 향을, 아련함을, 모순을, 전설을, 먼을, 진을, 위대함을, 단어를, 가를, 미학을, 은, 무언가를, 해전을, 멋을, 것을, 대상을, 심을, 잔인함을, 재앙을, 자유를, 흔적을, 인연을, 상품을, 트라우마를, 꿈을, 그림자를, 가치를, 판을, 감성을, 자를, 원을, 론을, 것들을, 중력을, 즐거움을, 한계를, 스를, 전을, 감을, 이었음을, 시선을, 1을, 관념을, 위치를, 달을, 물을, 흐름을, 인격을, 공간을, 기술을, 대를, 슬픔을, 본질을, 감정을, 진정성을, 인을, 이순신을, 포를, 비극을, 력을, y를, 인들을, 요소를, 기록을, 가능성을, 임을, 여인을, 유산을


-를

룰, 릉, 물을, 둘을, 디를, 들을, 이것을, 2를, 급을, 즈를, 트를, 신화를, 1을, 왕을, 학을, 이영화를, 용을, 극을, 등을, 작을, 씬을, 접점을, 먼을, 이미지를, 즘을, 세계관을, 스러움을, 류를, 상품을, 전체를, 로를, 론을, 그를, 팀을, 계를, 람을, 나치를, 만을, 영활, 가, 뎀을, 체를, 유산을, 력을, 스를, 건을, 의식을, 편을, 전설을, 터를, 3를, 사를, 곰을, 이를, 바를, 칸을, 진을, 크를, 셋을, 전통을, 신을, 4를, 색을, 감을, 본을, 그녀를, 인을, 형을, 아름다움을, 미래를, 프를, 그림을, 락을, 맨을, 명성을, 대를, 인물을, 퍼를, 범을, 감성을, 훈을, 것들을, 7을, 무언가를, 야를, 장점을, 분을, 그림자를, 자를, 일생을, 대상을, 생애를, 관점을, 라를, 호를, 와, 괴담을, 인들을, 우를, 적을


-에

에만, 들에, 신에, 그에, 에는, 사상에, 물에, 등에, 업에, 에까지, 씬에, 론에, 쇼에, 화에, 에도, 감에, 관에, 선에, 곡에, 성에, 향에, 춤에, 본에, 작에, 진에, 상에, 도에, 책에, 즈에, 력에, 거기에, 로움에, 함에, 림에, 수에, 사에, 학에, 자에, 것에, 매체에, 빨에, 속에, 열풍에, 님에, 계에, 기술력에, 락에, 3에, 삶에, 면에, 다움에, 2에, 거에, 트에, 움에, 전체에, 힘에, 로에, 경에, 애에, 병에, 시장에, 판에, 4에, 1에, 홀에, 질에, 쪽에, 극에, 편에, 서에, 씨에, 색에, 이론에, 옷에, 스러움에, 글에, 에다, 권에, 팀에, 심에, 에의, 법에, 미에, 증에, 돈에, 뇌에, 꿈에, 가에, 디에, 나에, 엔, 공에, 치에, 값에, 형에, 식에, 자본에, 사물에, 프에


-에게

들에게, 한테, 그에게, 그들에게, 씨에게, 그녀에게, 님께, 들한테, 에겐, 님에게, 자신에게, 형에게, 둘에게, 들께, 님에, 당신에게, 아들에게, 이에게, 아이들에게, 내게, 나에게, 서로에게, 누군가에게, 한테는, 팬에게, 자식에게, 소년에게, 께, 사람들에게, 소녀에게, 이들에게, 톰에게, 역에, 들에게는, 부모에게, 아내에게, 한텐, 테, 존에게, 신에게, 관객들에게, 세대에게, 딸에게, 남에게, 자에게, 팬들에게, 관객에게, 애한테, 저에게, 가에게, 자들에게, 나한테, 들에겐, 타인에게, 마츠코에게, 남편에게, 분께, 사에게, 존경하는, 한명의, 팀에, 인류에게, 어른들에게, 로부터, 그대에게, 팀에게, 진에게, 삶에, 개인에게, 역의, 아낌없, 너에게, 신께, 상대에게, 말에, 제게, 분들에게, 놈에게, 들에, 네게, 계에, 들로부터, 약사에게, 님께서, 이기에, 세상에, 베푸, 불쌍한, 것에, 수에, 에의, 구하려, 대중들에게, 대중에게, 역을, 대우를, 답고, 연인에게, 그리하여, 잭에게


-께

들께, 분께, 께는, 께서, 분들에게, 님께, 드린다, 분들, 감사합니다, 시던, 님에게, 말씀, 주신, 들에게, 씨에게, 저희, 존경합니다, 부모님, 드립니다, 감사하고, 분들이, 선생님, 말씀을, 노고에, 묵념, 어머님, 게요, 표합니다, 고맙습니다, 한테, 표함, 진에게, 드려, 고마움을, 감사, 에게, 아버님, 셔서, 애도, 수고하셨습니다, 님들, 진심으로, 들한테, 저에게, 황석희, 힘내세요, 자분, 하셨던, 인사를, 죄송, 않겠습니다, 많으셨습니다, 하셨다, 시고, 께요, 외할머니, 교수님, 님이, 선배, 보셨으면, 어머니, 하신다, 주셔서, 셨다, 시면, 만수무강, 격려, 고마웠어, 하셔서, 보냅니다, 수고했다, 할머니, 교수님이, 님, 신께, 스럽습니다, 표하, 두분이, 존경, 쌤이, 세대에게, 십니까, 할아버지, 수고했어요, 쉬세요, 감사하다, 세요, 셨으면, PAUL, 선생님이, 이들에게, 남깁니다, 주시는, 할아부지, 인사, 신, 여보, 아드님, 고마워, 장군님


-한테

에게, 들한테, 애한테, 테, 씨에게, 들에게, 님께, 형에게, 님에게, 한테는, 나한테, 쌍으로, 싶냐, 께, 맞자, 오빠가, 꼬셔, 혼나, 들한, 들께, 형한, 개객끼, 둘에게, 한텐, 말좀, 쟤, 쌤, 때리고, 왈, 거보고, 싸라, 명치, 자신에게, 때메, 자식에게, 님에, 아내에게, 혼내, 사줘, 첨에, 불쌍한, 자나깨나, 새끼, 잘듣, 역에, 퍼주, 그녀에게, 불쌍하다, 패고, 맨날, 니뮤, 이거보고, 걔가, 안듣는, 패주고, 착해, 깝치, 살다살다, 남편에게, 죄송해요, 뻑, 아씨, 보러갔다가, 님이, 힝, 놈에게, 겨, 미안해, 서에, 그에게, 불쌍해서, 놈아, 역인, 안듣, 미안해요, 개한, 남친이, 쨩, 핵귀, 다짜고짜, 러냐, 줄라, 볼매, 안늙, 아들에게, 에겐, 너한테, 아놔, 마누라, 그나저나, 으휴, 덕통사고, 빨에, 개객, 건들지마, 약사에게, 교수님이, 다메요, 협박, 남에게


-더러

역겨, 징그러, 촌스러, 부담스러, 역겹고, 껄끄러, 무서, 부끄러, 괴로, 불쾌하다, 귀여, 안쓰러, 우스꽝스러, 가벼, 지겨, 괴기스러, 아름다, 불편하고, 싱거, 안무서, 징그럽고, 더럽고, 즐거, 안타까, 울, 얄미, 스러, 두려, 웟다, 황당하다, 웟음, 더러워, 불쾌, 역겨워, 힘겨, 우스, 무거, 조심스러, 섬뜩하다, 불쾌하고, 불편, 시끄러, 잔인하고, 매끄러, 웠다, 웠음, 웠어, 반가, 흥겨, 역겹다, 징그럽다, 어두, 울수, 아쉬, 스러울, 징그러운, 혐오, 꺼림, 당혹스러, 애처로, 불쾌했다, 웠기, 소름끼치고, 이장, 나빴다, 놀라, 징그러워, 거북, 솔직해서, 무서웠다, 나빠, 날카로, 토할, 더럽다, 웠을, 우면, 슬플, 울뿐, 부러, 괴상, 웠어요, 불쾌하, 무섭다, 나쁨, 자극적이고, 뜨거, 무섭고, 짜증나고, 사나, 무섭, 오글거릴, 어지러, 체할, 웡, 찝찝하고, 불편하다, 끔찍, 잔망스러, 우면서, 노골적이


-로

로만, 로도, 로까지, 물로, 쇼로, 들로, 로는, 로라도, 장으로, 으로, 로써, 똥으로, 관으로, 화로, 감각으로, 등으로, 자로, 로의, 상징으로, 성으로, 감으로, 만으로, 씬으로, 차원으로, 선으로, 극으로, 그림으로, 영상으로, 쯤으로, 중심으로, 희극으로, 수준으로, 편으로, 꿈으로, 로든, 개로, 로나, 표로, 론으로, 실력으로, 로부터, 그래픽으로, 시점으로, 기술력으로, 사건으로, 사극으로, 질로, 감성으로, 컷으로, 시로, 활로, 점으로, 악으로, 분으로, 양으로, 판으로, 를, 력으로, 3로, 인으로, 즈로, 로밖에, 디로, 모습으로, 장편으로, 신으로, 살로, 와, 연극으로, 년으로, 빛으로, 형으로, 너로, 아름다움으로, 담으로, 품으로, 권으로, 맨으로, 로가, 애로, 로를, 2로, 색으로, 색다르게, 톤으로, 춤으로, 번으로, 가, 대상으로, 식으로, 돌로, 통하여, 키로, 사진으로, 로서, 삼아, 것으로, 기법으로, 시각으로, 형식으로


-으로

아름다움으로, 쇼로, 사극으로, 들로, 유쾌함으로, 선으로, 물로, 신으로, 극으로, 감으로, 사건으로, 로, 이로, 함으로, 씬으로, 것으로, 업으로, 등으로, 양으로, 자로, 감각으로, 남으로, 연극으로, 힘으로, 상징으로, 그림으로, 원으로, 방으로, 도구로, 봄으로, 질로, 성으로, 술로, 을, 분으로, 색으로, 희극으로, 으러, 영웅으로, 나로, 장으로, 대상으로, 이라고, 죄로, 품으로, 결핍으로, 관으로, 시각으로, 표로, 삶으로, 거짓으로, 맨으로, 그것으로, 화로, 만으로, 애로, 금으로, 력으로, 줌으로, 다름으로, 꿈으로, 통해, 이면, 너로, 인으로, 쯤으로, 사진으로, 악으로, 과, 감성으로, 실력으로, 형으로, 0으로, 신념으로, 본으로, 판으로, 편으로, 부로, 그로, 으론, 음으로, 론으로, 곡으로, 모습으로, 법으로, 돈으로, 마로, 기쁨으로, 지로, 영상으로, 빛으로, 지옥으로, 시점으로, 움으로, 춤으로, 이라, 똥으로, 수단으로, 욕으로, 3로


-의

물의, 이미지의, 무협의, 링의, 즈의, 업의, 리플리의, 들의, 무비의, 춤의, 계의, 로써의, 맨의, 션의, 증의, 홀의, 기의, 누아르의, 슨의, 로의, 터의, 함의, 틱의, 카의, 와의, 단의, 스의, 지성의, 로서의, 돌의, 트의, 형의, 력의, 영웅의, 극의, 지의, 이름의, 쇼의, 사의, 글의, 질의, 화의, 관의, 리의, 시의, 눈의, 브의, 감의, 오의, 이전의, 감각의, 맞바꾼, 에의, 스완의, 드의, e의, 씬의, 아의, 시점의, 애의, 인공지능의, 노의, 최동훈의, 전체의, 전설의, 무성영화의, 끝의, 뺨치는, 시대의, 꿈의, X의, 만의, 파커의, 또다른, 0의, 디의, 1의, 락의, 과의, 이자, 케인의, 말의, 님의, 웨인의, 폭스의, 다의, 것의, 무협영화의, 루크의, 세대의, 해리의, 컨의, 산업의, 지닌, 전성기의, 더의, 도의, 등의, 누벨바그의, s의


-과

과의, 와, 들과, 감과, 아름다움과, 이랑, 과도, 등과, 이미지와, 그리고, 력과, 과는, 등, 신과, 만남, 관과, 화려함과, 및, 함과, 움과, 호연과, 삶과, 씬과, amp, 절묘한, 고뇌와, 등의, 스러움과, 심과, 유쾌함과, 3박자, 본성과, 화와, 삼위일체, 맨과, 끝과, 통한, 그와, 이라던가, 위트와, 애와, 불신과, 군과, 순수함과, 은, 홀과, 힘과, jihyun님과, 동서양의, 꿈과, 등이, 등등, 성과, 선율과, 접점, 시선과, 끝없는, 불일치, 쇼와, 집념과, 영상미와, 림과, 의, 모성과, 음과, 지식과, 인한, 증과, 지성과, 원과, 시공, 일궈낸, 대비되는, 등으로, 빚어낸, 이나, 이성과, 삼박자, 끊임없는, 미칠듯한, 아픔과, 콜라보, 사이의, 기와, 곡과, 신선함과, 스와, 면과, 아와, 미장센과, 또는, 장예모의, 식과, 미와, 에의, 차의, 빛과, 업의, 아슬한, 비롯한


-와

과, 등과, 라와, 킹과, 와의, 랑, 와는, 그리고, 이미지와, 력과, 들과, 즈와, amp, 관과, 삼위일체, 씬과, 스와, 신과, 만남, 호연과, 등, 라던가, 더와, 왕과, 및, 와도, 형과, 선율과, 먼과, 드와, 등의, 용과, 그와, 감과, 가, 이은, 애와, 영상미와, 크와, 맨과, 아와, 아름다움과, 등등, 절묘한, 엘레, 원과, 에다가, 힘과, 질과, 로와, 본과, 삼박자, 스러움과, 쇼와, 인물들과, 미장센과, 심과, 로의, 지와, 접점, 트와, 둘과, 존과, 의, 시선과, 점과, 세가지, 향연, 모성과, 위트와, 왕, 프와, 마와, 곡과, 미쟝센과, 삶과, 랑은, 유쾌함과, 법과, 면과, 랑도, 뺨치는, 치와, 로부터, 팀과, ㅆㅅㅌㅊ, 화려함과, 를, 비롯한, 홀과, 하모니, 이름의, 물과, 양대, 기법과, 새와, 통한, 스한, 조합, 화와


-하고

하면서, 하며, 해보고, 받고, 한건가, 시키고, 할수, 안하고, 하다가, 당하고, 하면서도, 하려고, 한적이, 하구, 해하고, 느끼고, 나누고, 한답시고, 피하고, 하겠다, 되고, 하자는, 듣고, 하지말고, 한듯, 하듯, 숨기고, 하거나, 찾고, 했구나, 한뒤, 햇나, 하여, 원하고, 미워하고, 포기하고, 해놓고, 욕하고, 하려다, 했지, 해버리, 이별하고, 하던, 보여주고, 한걸까, 한척, 하네, 한채, 하자, 했건만, 하듯이, 해지고, 할때, 한거지, 하니까, 의심하고, 하도록, 하러, 얻고, 동경하고, 부르고, 했구, 이루고, 하거, 했나, 하다, 일하고, 뛰고, 한적, 올리고, 떨고, 하려는, 하겠, 짓고, 전하고, 하는, 날리고, 묻고, 할려, 해내고, 내고, 했고, 이해하고, 했었, 하길래, 잘하고, 해서, 까고, 덮고, 하겠지, 할라, 했었나, 했었던, 받아들이고, 하라고, 아끼고, 하게, 하겠어, 하라는, 누르고


-보다

보단, 들보다, 그것보다, 훨씬, 것보다, 훨, 1편보다, 그보다, 못지않게, 만큼이나, 2보다, 훨신, 낫고, 3보다, 이상으로, 거보다, 작보다, 전작보다, 판보다, 이쪽이, 편보다, 전작들보다, 1보다, 물보다, 원보다, 책보다, 천배, 1탄보다, 2보다는, 이전에, 다음으로, 전편보다, 낫다, 3보단, 백배, 전보다, 본편보다, 2보단, 몇배는, 씬보다, 신보다, 보더, 못지, 때보다, 낫더라, 원스보다, 삶보다, 이것보다, 의외로, 일수록, 쪽이, 그보, 나음, 총보다, 일때가, 상대적으로, 웬만한, 0배, 보가, 것보단, 명량보다, 1보단, 개인적으론, 이후로, 오히려, 돈보다, 비하면, 이외에, 개인적으로, 비해, 왠만한, 뺨치는, 쬐끔, 보기전에, 더, 자보다, 비중이, 만큼, 때문인지, 말보다, 낫네, 들보, gt, 이전의, 보디, 유난히, 낫지만, 치보, 누구보다, 이후에, 바닐라스카이, 전편보단, 무엇보다, 갠적으로, 다웠던, 이상의, 이보다, 다워, 알고보니, 한층


-처럼

들처럼, 같은, 같았던, 같던, 것처럼, 같이, 같게, 같고, 만큼이나, 같았고, 같았다, 마치, 마냥, 같달까, 다르게, 인것처럼, 제목처럼, 물처럼, 쯤으로, 같구나, 속, 인양, 지듯, 같지, 같다, 답게, 비슷하게, 보듯, 같으면서, 같았, 같아, 창문으로, lt, 같았음, 비처럼, 불꽃처럼, 내음, 총천연색, 겉은, 삶처럼, 같네, 같을까, 달리, 과도, 하듯, 만큼, 꿈처럼, 기계처럼, 같지만, 시베리아, 똑같이, 야생의, 책처럼, 황야의, 같음, 같군, 같진, 들판, 파도처럼, 같을, 그림처럼, 반대로, 같기도, 마찬가지로, 위에서, 느리게, 하듯이, 같으면서도, 랬더니, 곁으로, 같으, 낙엽, 노킹, 인냥, 같구, 봄날의, 톤으로, 무심히, 조차도, 못지않게, 사진처럼, 듯이, 속에서, 섬에서, 그렇게, 개처럼, 판, 공원에서, 마저도, 같으면, 얼핏, 같, 슬프게, 안타깝게, 속으로, 쇼와, 철로, 같냐, 같단, 무취의


-만큼

만큼이나, 그만큼, 한만큼, 못지않게, 정도로, 만은, 1만큼, 이상으로, 충분히, 엄청나게, 정도, 누구보다, 못지, 크기는, 마저도, 때보다, 들만큼, 마져도, 대단히, 만치, 그보다, 조차도, 만한, 뿐, 위력, 꽤나, 보단, 훨씬, 그이상, 처럼, 이만큼, 보다, 지언정, 짙고, 제법, 만으론, 스케일, 만으로도, 가장, 해전은, 같구, 큰만큼, 커졌지만, 이상의, 큼, 확실히, 엄청, 짧지만, 짧고, 강렬하고, 할만큼, 이것보다, 클수록, 급으로, 무섭도록, 놀랍도록, 다음으로, 위용, 해전씬은, 결코, 단순하지만, 무게는, 뿐이다, 전작들보다, 꽤, 발끝, 작지만, 변함없이, 매우, 마찬가지로, 영향력, 어마어마하게, 수준, 완성도는, 정말, 없을만큼, 조차, 또한, 여러모로, 만하지만, 비례, 1편보다, 강렬함, 상당히, 압도적으로, 무척이나, 크지만, 굉장히, 세련되고, 등은, 여전히, 화려하고, 규모, 하난, 컨데, 이보다, 무척, 전작보다, 여전한, 로도


-같이

함께, 손잡고, 다같이, 똑같이, 단둘이, 처럼, 비슷하게, 울면서, 밥먹고, 옆에서, 먹으며, 같은, 몰래, 밤새, 집에서, 썸남, 거실에서, 떨며, 마찬가지로, 옹기, 술마시, 같게, 먹으면서, 연달아, 술한, 울고, 공원에서, 부모님이, 모여서, 같구나, 마시며, 애인이, 지하철에서, 술마시고, 울며, 다르게, 같을까, 나란히, 같아서, 붙잡고, 끼리, 셋이, 동생이, 친구, 같았음, 번갈아, 웃으며, 사촌동생, 덩달아, 동시대에, 칭구, 들처럼, 춤추고, 꺅꺅, 멋모르고, 옆, 둘이, 미친듯이, 배구공, 추며, 전학, 연인들이, 들끼리, 맞으며, 같았다, 같아, 신나게, 밤마다, 달리, 같고, 애랑, 웃으면서, 밑에서, 웃고, 해맑게, 친해, 단체로, 친척, 마냥, 내친구, 둘씩, 닮아, 비슷하다, 탁구, 설거지, 조용히, 불끄고, 일행, 남친이, 동생, 모시고, 누워서, 춤을, 밤에, 추석에, 야자, 누워, 빙수, 놀고, 술먹고


-아

하, 아아, 으아, 아아아, 씨발, 아오, 하아, 아악, 으, ㅅㅂ, 시벌, 앜, 아ㅏㅏ, 어휴, 아아아아, 아ㅋㅋ, 아놔, 아ㅠㅠ, ㅆ, Aㅏ, 젠장, 아아아아아아, 시팔, 아씨, 개좋, 아아아아아아아, 씨바, ㅠㅠ, 와씨, 앜ㅋㅋㅋㅋ, 앙, 오, 으악, 썅, 아아아아아, ㅏㅏ, ㅡㅡ, ㅜㅜ, 어우, 와아, ㅠㅜ, ㅜㅠ, ㅁㅊ, 으앙, ㅏ, ㅆㅂ, 그니, ㅡ, 응, ㅠ, 아유, 어어, 우어, 흑흑, ㅜ, 니미, 우와, 오오, 으어, 내사랑, 제길, 오오오오, ㅏㅏㅏ, 으으, 으윽, 에휴, 헐, 아인, 히익, ㅂㄷㅂㄷ, ㅎㅇ, 오우, ㅅ, ㅁ, 흐엉, 하하하하하하, 글고, 시발, 하하, 흐, ㅇㅁ, 엉, 은데, 샤이, 에잇, 이거, 핳, ㄴ, 윽, 어후, ㄹㄹ, 워후, 얜, 잘잤다, 뭐야, 왜그랬어, ㅋ아, 와아아, 근데, 8ㅅ8


-야

야만, 야지, 야돼, 야됨, 줘야, 져야, 야했다, 내야, 야되, 여야, 나야, 야ㅠㅠ, 야해, 가야, 야죠, 야된다, 와야, 야하, 야함, 어야, 여야만, 얘들아, 야했, 야한, 줄께, 야할, 욧, 라, 야겠, 야라는, 서야, 둬야, 드려야, 졌어, 줬으면, 냈어야, 이래야, 줬음, 버렸을까, 봐야, 야징, 봤어야, 야될, 야라, 얌, 얍, 해야, 야ㅋㅋ, 왔어, 에요, 되야, 봤자, 랏, 돼야, 년아, 였어, 예요, 에여, 줘라, 니가, 라도, 얔ㅋㅋㅋ, 야했던, 워야, 줬더니, 라구, 남으려면, 야겠다, 줬어, 주었으면, 너넨, 임마, 다오, 배워야, 줍시다, 야하지, 그래, 줄거야, 라며, 졌으면, 그러니까, 넌, 란거, 야하고, 줘요, 타야, 줘, 이겨내야, 니네, 지려, 보아야, 란다, 제맛, 욤, 주세요, 쳐야, 다녀야, 작작, 들아, 너


-만

들만, 만을, 력만, 로만, 만이, 씩만, 만이라도, 신만, 만은, 씬만, 만하고, 힘만, 거만, 분만, 색만, 화만, 만도, 멋만, 만해, 부만, 맛만, 에만, 증만, 만요, 욕만, 둘만, 진만, 전만, 점만, 함만, 말고, 옷만, 최소한, 것만, 2까지만, 끝만, 마져, 잘라서, 어땟을까, 감만, 주구장창, 거라곤, 판만, 딱, 평만, 마저, 질만, 도만, 면만, 반만, 일만, 엑기스만, 애만, 쫌만, 편만, 이라도, 곡만, 놈만, 춤만, 만해서, 성만, 나머진, 쯤으로, 도, 말만, 겉만, 딴거, 만했, 짓만, 관만, 그뿐, 값을, 승부, 뿐, 나머지는, 만으로, 어땠을까, 만함, 뼈만, 을걸, 큼만, 값으로, 봐줄만, 몸만, 줄창, 만큼, 단지, 하지말고, 짜린데, 그저, 만하, 쯤, 대로, 만보, 마저도, 조차도, 그냥, 만하지만, 재롱잔치, 볼건


-도

들도, 조차도, 심지어, 조차, 물도, 또한, 력도, 관도, 춤도, 까지, 뭐도, 마저도, 마저, 원도, 좋고, 만은, 씬도, 멋도, 마져도, 자도, 도도, 무엇보다, 은, 함도, 맛도, 감도, 색도, 꿈도, 등은, 그렇고, 디도, 에도, 쩔고, 톤도, 는, 성도, 욕도, 작도, 그렇다고, 딸도, 뭣도, 것도, 로도, 합도, 까진, 집도, 있고, 한것도, 선도, 음도, 물은, 나쁘지도, 셋다, 무엇하나, 트도, 옷도, 만하고, 일도, 책도, 들은, 씨도, 탄탄하고, 지도, 안무서움, 힘도, 만, 결도, 님도, 가, 이것도, 리도, 미도, 스럽지도, 뭣보다, 움도, 뿐더러, 뿐아니라, 누구도, 물론, 들까지, 마도, 암튼, 야하지, 신도, 따윈, 마져, 엿는데, 총도, 더군다나, 잇고, 게다가, 잘하고, 원은, 좋았고, 얘도, 없고, 암것도, 개굿, 랄데가, 싶고


-은

만은, 신은, 이, 그림체는, 함은, 화는, 들은, 과는, 과, 물은, 끝은, 이라면, 스러움은, 씬은, 캐미는, 해전씬은, 판은, 만남은, 성은, 으론, 크기는, 컷은, 님은, 톰형은, 등은, 1은, 도, 감은, 을, 이니까, 감각은, 음은, 전투씬은, 시퀀스는, 기술은, 왕은, 훈은, 본은, 이나, 해전은, 움은, 류는, 조합은, 힘은, 결과는, 앞엔, 꿈은, 관은, 실력은, 증은, 모습은, 력은, 내용은, 질은, 마모루는, 쇼는, 이든, 이야말로, 2편은, 에선, 이영화는, 신선함은, 선은, 까진, 이란, 색은, 조차도, 길은, 맨은, 극은, 추격씬은, 전은, 원은, 본질은, 면은, 만으론, 합은, 랩은, 방법은, 이라기엔, 편은, 큼은, 재능은, 씬들은, 본인은, 하울은, 과의, 팬은, 그는, 트릭은, 폴은, 첼은, 형은, 춤은, 용은, 영광은, 2는, 이죠, 이라지만, 락은


-는

는건, 가, 고는, 관은, 로는, 는게, 물은, 력은, 조합은, 합은, 스는, 라는, 2보다는, 빈은, 실력은, 는거, 완은, 2는, 파커는, 도, 이영화는, 강철중은, 옹은, 만은, 4편은, 자체는, 3는, 왕은, 톰형은, 2편은, 2탄은, 극은, 들은, 였단, 카는, 내용은, 젠버그는, 등은, 란, 와는, 이것은, 신은, 를, 정체성은, 란건, 스러움은, 립은, 감은, 포는, 와, 개인적으론, 아담스는, 무어는, 이민기는, 아직까진, 전투장면은, 이정현은, 점은, 로서는, 완성도는, 는걸, 난, 스나이더는, 성은, 씨는, 론, 1보단, 님은, 역은, 상팔자, 형은, 2보단, 그는, 틱은, 즈는, 4는, 감각은, 1은, 이땐, 이번에는, 로서, 뎁은, 장점은, 까진, PS, 언은, 그렇지만, 력만큼은, 캐미는, 이론은, 랑은, 함은, 급은, 맨은, 주온은, 아들은, 껀, 원은, 총격씬은, 이번엔


-조차

조차도, 마저도, 마저, 따위는, 따윈, 도, 마져, 밖에, 아무것도, 누구도, 무엇하나, 것조차, 미처, 밖엔, 아무도, 좀처럼, 쉬이, 1초도, 따위, 들조차, 한치, 만으로는, 전혀, 외에는, 외엔, 수조차, 1도, 도무지, 쉽사리, 마져도, 앞도, 때문인지, 없인, 만은, 로밖에, 더이상, 한순간도, 도저히, 차마, 끝끝내, 틈도, 만으론, 치도, 아무, 로도, 런, 결코, 심지어, 또한, 말곤, 력으로도, 더는, 만큼이나, 눈꼽만큼도, 애당초, 망정, 절대, 차도, 것밖에, 주체, 함부로, 그마저, 에도, 도통, 이외에, 그저, 만도, 그마저도, 일말의, 역설을, 말도, 만큼, 곤, 래야, 답도, 들을, 도리어, 커녕, 아예, 또는, 없을만큼, 지도, 애초에, 별다른, 만이, 어떠한, 않으면, 만하고, 혹은, 거라곤, 틈은, 언정, 일부러, 라곤, 일도, 특별함을, 채, 그다지, 틈을, 딱히


-마저

마저도, 마져, 조차도, 조차, 마져도, 들조차, 또한, 감마저, 무엇하나, 도, 까지, 만큼이나, 감까지, 심지어, 들까지, 모조리, 따윈, 전체가, 도리어, 그마저, 따위는, 미칠듯한, 삼위일체, 만은, 들도, 만을, 게다가, 만이, 과, 함까지, 진부함을, 등이, 그마저도, 모두, 함마, 들을, 3박자, 만, 모든, 력까지, 한없이, 숨막힐듯, 화려함과, 경박한, 오히려, 들마, 나까지, 자칫하면, 관객을, 지나친, 퀸의, 풍덩, 늪, 장예모의, 그리고, 비장함이, 정도로, 질만큼, 뿐만, 싹다, 함도, 과도한, 3박자가, 강박, 등은, 을, 시종일관, 만으로는, 들만, 자칫, 영혼을, 자체가, 따위, 스며드는, 버리는, 기운, 부재가, 싹, 지거나, 대신, 만큼, 덩이, 싸그리, 관객들을, 금세, 것조차, 찬물을, 덮어, 것마저, 점차, 이를, 빈틈을, 끝끝내, 넋을, 순식간에, 전락, 젖은, 때문인지, 뭐하나, 력도


-까지

부터, 심지어, 3박자가, 마저도, 도, 쯤부터, 마저, 직전, 크레딧까지, 들까지, 무엇하나, 까진, 껏, 삼박자, 삼박자가, 력까지, 씬까지, 거기다, 3박자, 게다가, 에까지, 마져, 쯤에, 조차도, 함까지, 크레딧, 거기에, 7편, 했으며, 에다, 전까지, 쯤의, 으로, 만으로, 부로, 3편까지, 에도, 등은, 크래딧, 고루, 부턴, 들부터, 장엄, 백점, 직전에, 쌔끈한, 끌다가, 마져도, 덤으로, 초장, 편까지, 꿀재미, 갖춰, 골고루, 2014년, 깔끔하다, 좋고, 4까지, 만하면, 쯤엔, 결도, 미칠듯한, 한씬, 위트, 덧, 것까지, 완벽, 갈때까지, 더해져, 시퀀스가, 훌륭하고, 클라이막스, 깔끔한, 데다, 쯤이, 삼위일체, 또한, 열까지, 을, 이르, 등등, 3단, 숙모, 종반, 요근래, 이후, 엔딩, 탄력을, 올해, 쌍팔년도, 쌓아온, 모의고사, 등, 1분, 장진감독의, 그리고, 때까지, 오프닝, 모두, 곡으로


-부터

쯤부터, 부턴, 하자마자, 때부터, 처음, 까지, 시작, 씬부터, 시작해서, 끝까지, 열까지, 애초, 쯤엔, 초장, 5분만에, 첫장면부터, 첨부터, 끝날때까지, 마자, 이후부터, 급격히, 에야, 부에서, 끝만, 벌써, 중반부터, 쭈욱, 도입부, 쭉, 이미, 나올때, 로부터, 이영화의, 넉다운, 터, 부, 후부터, 이후로, 갑자기, 어디서, 이어지는, 중간, 줄곧, 뭐야, 왜이래, 끝의, 부에, 심상치, 이때부터, 그뒤로, 끝인가, 즈음, 어느순간, 일관, 채고, 하더니, 볼줄이야, 첨으로, 흥미로웠는데, 끝냈어야, 결핍으로, Come, 슬슬, 만봐도, 들부터, 했더니, 글러, 오프닝, Color, 끝가지, 나래이션, 보자마자, 가면서, 꺼는, 쯤에, 온통, 중반이후, 만보, 크레딧까지, 에서, 나오면서, 헐, 조차도, 분만에, 멈췄어야, 첫, 출발, 끝났어야, 헉, 인해, 수미쌍관, 끝과, 나왔을때, 마저도, 시놉, 첨, 기승, 끌다가, 언제, 인트로


-이나

이든, 예나, 이랑, 이라던가, 이라도, 이니, 및, 등은, 나, 이지만, 이라지만, 과, 서편제, 이었고, 이였지만, 이었는데, 은, 업의, 이라면, 등, 등의, 이었나, 이고, 이면, 이었다면, 등등, 이랄까, 이야, 이였다면, 이여서, 투박한, 이었다, 셋트, 상의, 이더라, 이네, 이었으나, 아무래도, 이였, 볼법한, 연스러운, 2나, 이라, 이니까, 지났지만, 이었겠지, 이며, 이, 이다, 이려, 이였는데, 라던가, 촌스러운, 라던지, 이었지만, 인데, 여전하지만, 이였다, 이였고, 이겠지만, 딥임팩트, 용가리, 등을, 벤허, 날것의, 위주의, 제나, 이죠, 암만, 에다가, 이구나, 으려나, 마, 군과, 방의, 이였던, 주객전도, 씨티, 부족했지만, 과의, 이었음, 이냐, 그보, 이당, 씩이나, 그렇고, 방불, 유치했지만, 이해하는데, 원과, 을, 오락실에서, 이던, 기식, 특수, 로나, 애서, 학과, 마와, 화와


-나마

잠시, 간접적으로, 하여금, 간접, 대리, 떠올리며, 간접체험, 인해, 되었고, 해주었다, 설렘과, 해줬다, 함마, 아델을, 됐습니다, 느낍니다, 엿볼, 해준, 만끽, 유년시절, 간접경험, 공기를, 병을, 억울함을, 냄으로써, 저의, 환멸을, 셔서, 됨으로써, 써, 나또한, 그동안, 읍니다, 기쁨을, 떨림을, 편히, 즐거움을, 보며, 위안을, 주었다, 바라보며, 해줘서, 아픔과, 대리만족, 열망을, 계기가, 내모습을, 경험, 있었고, 되었습니다, 해준다, 아쉬움을, 현장을, 해줌, 쉬세요, 갈증을, 줘서, 생전, 루의, 통해, 애환을, 고통을, 맘껏, 해놔서, 그녀들이, 나설, 천국에서, 잊혀졌던, 터라, 참혹함을, 살았던, 한줌의, 룸을, 심정을, 생활을, 것만으로도, 빌어, 마가렛, 샐러, 잊었던, 불편함을, 겪었던, 됐다, 어린시절, 찼던, 유년, 있도록, 체험, 로그, 되었다, 월터, 경을, 리마, 당혹, 실의, 시켜준다, 평온, 다녀왔다, 아픔을, 차츰


-라도

든지, 만이라도, 든, 이라도, 로라도, 라면, 여도, 니까, 됐잖아, 야, 최소한, 겠니, 야지, 였더라, 뭐해, 라, 나, 그나마, 좋으니, 만요, 됬지, 뭐든, 것좀, 래도, 라며, 망정이지, 되거, 없든, 뭐, 었더라도, 으련만, 란말, 려면, 였으면, 냐만은, 였으니, 라지만, 던가, 어도, 야죠, 든요, 냐, 라구요, 든간에, 쯤은, 봐준다, 됐지, 망정, 려나, 되든, 란다, 하든, 씩만, 여야만, 더라도, 란게, 거면, 어때, 패, 거든, 란걸, 했어도, 언정, 겨우, 거라면, 겠습니, 쯤, 셋을, 라해도, 랴, 죠, 겠는가, 제발, 생겨도, 번이라도, 쯤이, 없으면, 라능, 랍니다, 룰, 겠지, 란거, 라구, 일단, 랬다, 든가, 지든, 꼭, 었을텐데, 깎음, 니깐, 없어도, 랬는데, 둬, 래요, 라서, 그만, 명만, 없으니, 잔을


-이야

이네, 이잖아, 이군, 이었어, 이죠, 이다, 이구나, 이었다, 이였어, 이었는데, 이겠지, 이였다, 이여, 일세, 이니, 이예요, 이당, 이더라, 이냐, 이요, 이었구나, 인영화, 이니까, 이었음, 이구, 이었, 이였는데, 이네요, 이라, 이였음, 이였, 이라지만, 이었고, 이지, 이였지만, 이여서, 이었습니다, 이었지만, 이아, 시벌, 이라면, 이엿다, 이고, 이지만, 쓰레, 인데, 와씨, 이오, 임, 뭐람, 임ㅋ, 이였고, 이라고, 헐, 어휴, 이래, 일줄이야, 뭐래, 아냐, 인가보다, 긴데, 이겠, ㅋ아, 이었을까, 참나, 이었으나, 인마, 입니다, 이란, 히익, 어머, 이었던, 이었나, 이었기에, 이었겠지, 입니까, 이든, Aㅏ, 이건, 인거, 모야, 이긴한데, 응, 으악, 도아, 이거, 씨발, 앜, 아ㅏㅏ, 이었다면, 인걸, 개잼, 뭐야, 이겠지만, 밑장빼기, 하하하하하하, 어쩌라고, 콩가루, 이였던, 웡


품사별 빈도 순위

김홍규&강범모(2000)가 밝힌 한국어 품사별 단어 사용 빈도 순위표는 아래와 같습니다. 이후 이 표에 등장한 단어벡터와 코사인 유사도 기준 가장 비슷한 단어 100개 리스트를 나열할 예정입니다.

순위 일반명사 동사 형용사 부사 감탄사
1 사람 하다 없다
2 있다 그렇다 다시 그래
3 되다 같다
4 보다 어떻다
5 사회 대하다 이렇다 가장
6 위하다 다르다 함께 아니
7 문제 말하다 크다 바로
8 문화 가다 많다 모두
9 받다 좋다 없이 글쎄
10 경우 보이다 이러하다 아아


실험결과3 (명사)

사람

한사람, 이들, 사람이, 당신, 사람들은, 사람들의, 주변사람들, 여인, 그사람, 남들, 이과생, 사람들이, 일반인, 여자, 누군가를, 남자, 자들, 자식, 군중, 이웃들, 반려동물, 이들은, 년놈, 동물, 이방인, 노인, 유인원, 딸들, 사람들에게, 생물, 너희들, 세상, 주인공, 서민들, 주위, 상대를, 놈들, 주민들, 애완견, 학생, 인간, 나밖에, 이의, 자들은, 놈도, 사내, 인조인간, 인들, 관객, 누군, 그들, 타인, 이웃, 꾼들, 분들, 연인, 지인들, 주변인들, 손님, 저들, 유괴범, 군인, 영혼, 위인, 이들이, 백성들, 어른들, 개개인, 초식동물, 주인, 이들을, 가들, 부모, 남편, 내것, 맹수, 애인, 민간인, 남정네, 당사자, 아랍인, 외국인, 이에게, 이웃사람, 육식동물, 환경, 이들의, 타인을, 자를, 시민, 그네들, 이들에게, 선생, 지휘관, 자들을, 반려견, 시청자들, 적군, 상대방을, 우리


떄, 때는, 때의, 땐, 때에, 때야, 때쯤, 때부터, 때에는, 무렵, 을때, 때나, 때면, 때에도, 때마다, 때엔, 때와, 때만, 때인가, 땐가, 때라, 때다, 때처럼, 했을때, 때가, 때였, 할때, 때까지, 때보다, 때도, 테니, 적에, 뿐인데, 때랑, 즈음, 을땐, 을때의, 갈때, 줄이야, 그때, 껄, 수록, 3학년, 비로소, 까봐, 텐데, 적엔, 2학년, 고등학교때, 초등학교, 교실에서, 일때, 적부터, 지라도, 테니까, 까나, 테지, 때를, 올때, 질때, 시절, 줄때, 뻔, 나올때, 초딩때, 왔을때, 뿐이다, 낼때, 중3때, 중학교, 까, 학교에서, 났을때, 나왔을때, 그날, 꺼에요, 릴때, 언젠가, 칠때, 지언정, 을때는, 방에서, 단체로, 실에서, 장에서, 연등, 중학교때, 고딩때, 어릴때, 시기에, 꺼다, 뿐, 문뜩, 대에서, 어릴, 고등학교, 만났을때, 직전에, 졌을때, 나갈때


였을, 아닐, 일수도, 이었을, 일수, 인, 거일, 일지도, 일것이다, 일것, 일일, 것일, 물일, 뿐일, 같을, 일거, 자일, 이였을, 일뿐, 싫을, 인것, 울, 다울, 기일, 인거, 꿈일, 일듯, 될, 어쩌면, 낳을, 인걸까, 인것을, 였던, 일꺼, 적일, 살, 있을, 인듯, 부끄러울, 기쁠, 비단, 없을, 것인, 나일, 일텐데, 만할, 라할, 었을, 일인, 겪을, 웠을, 일런, 슬플, 2, 일것이, 임, 틀릴, 였으니, 일로, 칭할, 악일, 가일, 생길, 떠오를, 워할, 월, 속일, 행할, 취할, 일만, 임을, 택할, 쉬울, 들일, 원할, 인가보다, 스러울, 믿을, 로울, 였기, 일줄, 일이, 닥칠, 영원할, 삼을, 인건가, 중일, 이겠지, 일임을, 무거울, 이겠, 그에겐, 편할, 뿐일까, 뿐인, 또는, 이었던, 년인, 1일, 뿐임


말은, 말을, 말이, 한마디, 마디, 말만, 말과, 이말, 그말, 몇마디, 말한, 말인, 얘기, 말도, 말씀, 말밖에, 말들, 제안을, 말입니다, 말야, 소릴, 충고, 좆, 말에, 너나, 수식어가, 대사, 말로, 얘길, 한마디에, 안듣, 한마디가, 외친, 요라, 말들이, 말인지, 얌마, 말보다, 외침, 말처럼, 문자, 개소리, 곰을, 소리, 딴따, 덜도, 짓, 단어가, 평, 아부, 웃프다, 단어, 도완득, 뜻, 말좀, 대답, 염병, 발음, 내뱉는, 말씀을, 두말, 대답을, 사과, 말안, 영어, 안듣는, 문장, 외침이, 말고, 건들지마, 말의, 잘듣, 말하는, 요약, 글자, 참견, 수식, 일을, 설명, 말란, 밖엔, 수식어, 조언, 뭐라, 뜻인, 외치는, 내뱉, 말해주는, 년아, 고백, 인사, 이름, 한마디로, 까불, 슈발, 히셔, 명언, 외칠, 평에, 할일


사회

자본주의, 사회의, 계급사회, 제도, 체제, 사회에서, 세태, 체계, 전체주의, 독재, 병폐, 빈부격차, 유주의, 경제, 인종문제, 시스템, 현대사회의, 현시대, 계급, 정치, 윤리, 비판, 부조리한, 공동체, 의료보험, 부조리, 계층, 부패, 관료주의, 미디어, 이데올로기, 약자, 인본주의, 가부장제, 국가, 매스미디어, 다문화, 실태, 현대, 환경, 공리주의, 물질만능주의, 법치, 고령화, 기득권, 인종차별, 식민, 규제, 만연한, 관료, 의료민영화, 부정부패, 물질주의, 집단, 민주주의, 부패와, 현대인들의, 공권력, 가부장적, 질서, 생태, 문명, 시대, 소수자, 중산층의, 종교, 풍자, 외모지상주의, 고발, 내부고발자, 이념, 불합리, 군국주의, 비정규직, 시스템의, 사법, 외교, 외부, 이기주의, 불합리한, 의료, 정부, 생태계, 성차별, 좌파, 현, 획일화, 불평등, 획일, 획일화된, 억압, 민족주의, 상류, 공산주의, 민국의, 소수, 행정, 정치적, 매카시즘, 법률


속의, 속에, 속에서, 안의, 속엔, 속으로, 안에서, 그림같은, 갇힌, 갖힌, 속을, 밖, 내의, 총천연색, 위의, 비친, 밖의, 감춰진, 이미지와, 진주같은, 안에, 머릿속, 인물들과, 흩뿌려진, 사막의, 펼쳐지는, 둘러싼, 휘말린, 가운데, 공허한, 안과, 너머의, 처럼, 파노라마, 대비되는, 위에서, 곳의, 위에, 눈속, 떠다니는, 오필리아의, 한가운데, 틈에, 꿈속의, 만큼이나, 한공주의, 머릿속에, 담긴, 놓인, 밑에, 그속, 잿빛, 트래비스의, 박힌, 너머로, 져진, 같았던, 묶인, 에서, 심연의, 스며든, 그려지는, 유영하는, 빛, 프레임, 궁전, 섥힌, 덮힌, 이민자의, 소용돌이, 그림자, 회색빛, 사이의, 꿈의, 스코틀랜드의, 이면에, 파묻, 별들의, 녹아있는, 한켠에, 관통하는, 관과, 설원의, 사이에서, 잔혹한, 가득찬, 네모난, 공간, 숨겨진, 갖혀, 투영된, 표류하는, 사이에, 깊숙히, 갇혀, 시리도록, 근현대사의, 장의, 숨어있는, 텅빈


문제

이슈, 오류, 제도, 증거, 논의, 원인이, 차이, 병폐, 한계, 윤리, 원인, 인종차별, 고질, 인종문제, 젠더, 화두, 소수자, 사회, 심각한, 딜레마, 빈부격차, 성차별, 견해, 폐해, 관계, 민영화, 체계, 모순이, 결함, 근거, 외모지상주의, 도덕적, 부르주아, 상관관계, 정답, 결함이, 성범죄, 민감한, 성소수자, 공동체, 세태, 의견, 알레고리, 화제, 난제, 이데올로기, 논리, 피해자, 불통, 포비아, 통계, 사회문제를, 이민자, 복지, 기호, 법적, 승패, 인과, 오류가, 인본주의, 인과관계, 구조, 단점, 차별, 대안, 공통분모, 공리주의, 모럴, 외교, 논란이, 도덕성, 불감증, 학적으로, 중요한, 근시, 처벌이, 경우, 약점, 합리, 모순, 태생적, 진로, 갈등, 내부고발자, 오답, 관료주의, 변수, 격차, 다문화, 인권, 미혼모, 가해자, 실태, 경제, 예시, 아동학대, 컴플렉스, 논란, 계급, 사정이


문화

이슬람, 다문화, 군국주의, 민족주의, 언어, 지역, 전통, 식민지, 정서, 국가, 식민, 중국, 컨텐츠, 사회, 인들의, 현대, 콘텐츠, 사상의, 인본주의, 아시아, 경제, 실태, 컬쳐, 산업, 기독교, 종교, 관료주의, 프랑스, 인종, 빈부격차, 회관, 제도, 무속, 인종문제, 정서의, 계급, 미디어, 개신교, 업계, 인종차별, 의료보험, 비주류, 서구, 제3세계, 계층, 민족, 세태, 의료, 신세대, 전체주의, 서양, 유럽의, 인도, 카톨릭, 계급사회, 미국, 부르주아, 서양의, 복지, 생태, 한민족, 좌파, 정서와, 유럽, 이국, 1940년대, 물질주의, 제국주의, 매체, 러시아, 문학, 터키, 근현대사, 인들이, 다양성이, 현주소, 아르헨티나, 스페인, 민주화, 오리엔탈리즘, 중동, 사상과, 화폐, 교육, 탄압, 사회의, 유희, 이데올로기, 남미, 노예제도, 공산, 일본, 통치, 일제, 그시대, 파시스트, 전라도, 민주주의, 누벨바그, 동양


아파트, 집에, 수족관, 마트, 집의, 집과, 집을, 집은, 동네, 창고, 식당, 침대, 냉장고, 횟집, 집이, 근처, 옆, 호텔, 신발, 부엌, 술집, 2층, 골방, 장롱, 집도, 정원, 옷장, 텐트, 방, 가방, 밭, 회사, 집으로, 사무실, 집에서, 백화점, 오두막, 약국, 거실, 산속, 맥도날드, 모텔, 감옥, 서점, 박스, 거실에서, 교실, 옆집, 잔디, 어항, 수조, 창, 근처에, 식탁, 집안, 경비, 집들, 창문, 박물관, 앞, 농장, 네모난, 사장인데, 숲, 지하실, 아쿠아리움, 빙수, 공장, 밭에서, 문방구, 초밥, 옆의, 떡볶이, 주차, 현관, 허름한, 호박, 도깨비, 산골, 고향, 광산, 이집, 밥, 과자, 방안에, 스위스, 도넛, 주방, 지하철, 버스, 주머니, 쇼윈도, 뒤주, 주인, 휴대폰, 세탁기, 방에서, 트렁크, 새우, 섬


경우

사례, 부류, 이유가, 요인, 부분이, 경향이, 결함이, 부작용, 점들이, 지점, 부분, 일보다, 점도, 데에는, 데는, 예가, 점이, 많기에, 대다수, 것인데, 일은, 문제, 도움이, 일도, 변수, 사람들이, 나라에서, 것입니다, 확률이, 것도, 법, 점들, 승패, 겁니다, 거일, 팬덤, 점은, 컨텐츠, 법인, 일들이, 대표적인, 것까지, 논란이, 포인트, 분야, 예시, 것일, 대부분, 해외, 쪽에서, 요소들이, 경향, 거고, 단점, 패착, 인기, 가능성이, 이유, 데엔, 맥락, 사회적으로, 듯하다, 평도, 어려움, 체인, 계층, 장점, 여럿, 기업이, 오류가, 박한, 이슈, 많습니다, 것은, 많다, 듯함, 7급공무원, 요소가, 확률은, 결점, 단점이, 간혹, 장애, 평들, 장벽이, 의견, 법이, 거다, 텍스트, 영향, 것부터가, 것이, 것들이, 걸수도, 듯싶다, 약점, 뉘앙스, 글들, 커뮤니티, 결과


실험결과4 (동사)

하다

하네요, 하더라, 했다, 하구나, 하네, 하당, 햇다, 하구만, 함, 했음, 하군, 해진다, 하달까, 허다, 해졌다, 하였다, 하죠, 한듯, 한데, 그지없다, 할듯, 했습니다, 해짐, 했겠지, 하단, 할뿐, 했달까, 했었다, 했겠다, 하잖아, 했으며, 해보이는, 하겠지, 했고, 함ㅋㅋ, 함까지, 해지기도, 했더라, 해ㅠ, 했구나, 합니다, 하면서도, 함ㅋ, 해지는, 하겠다, 했네요, 해용, 하긴, 했어요, 했지, 해진, 히다, 했구, 하니, 함ㅋㅋㅋ, 했군, 해, 아찔하다, 하구, 하고, 했네, 하게, 한, 적나라하다, 함을, 했당, 치밀하다, 애매하다, 할수, 하니까, 했어, 했지만, 답답하다, 해지니, 하겠지만, 화려하다, 하다가, 함의, 졸립다, 치열하다, 해지, 심심하다, 하더니, 햇어, 할까, 우울하다, 해질, 한영화, 처절하다, 어색하다, 햇고, 잔인하다, 하였으나, 했으, 하심, 했으나, 하더, 햇지만, 항, 거칠다


있다

있었다, 잇다, 있습니다, 있음, 있더라, 있으며, 있죠, 있답니다, 있군, 있네요, 있었습니다, 있음을, 있겠지, 있네, 있는, 있군요, 있지만, 있지, 있듯이, 있엇다, 있단, 있구나, 있고, 있듯, 있었고, 있던, 없다, 있당, 있겠다, 있으니, 있었을까, 있었는데, 있으나, 있기에, 있냐, 있겠지만, 있으려나, 있었던, 있을까, 있나, 있기, 없었다, 있겠구나, 있잖아, 있었을텐데, 잇음, 있기를, 있어, 있었지만, 있었, 넘친다, 있느냐, 있음에도, 없더라, 있소, 있겠는가, 있습니까, 있어서, 있길, 있거든, 잇엇, 많다, 있니, 없단, 있자, 잇는, 있으, 있은, 있더, 잇지, 있을, 있거, 있었으나, 없거든, 있긴, 있더라도, 있, 있건, 없나보다, 담겨있다, 없겠지, 있으면, 없엉, 숨어있다, 있겠습니까, 논다, 있진, 져있다, 없음을, 없겠다, 있겠, 가졌다, 없듯이, 테니까, 없자나, 공존한다, 있었기에, 졌다, 나왔다, 없죠


되다

되었다, 된다, 되고, 되었고, 됨, 됐다, 되더, 됬다, 되며, 되면서, 되니, 된, 되네, 되듯, 되버렸다, 되었습니다, 된듯, 되엇다, 되더라, 돼버렸다, 되어버린, 되겠지, 될때, 되다니, 되는, 됩니다, 되지만, 되었을때, 되었지만, 되니까, 되서, 됐으, 되버린, 됐네, 됐지만, 되자, 되던, 되버리, 됐음, 되죠, 됐었다, 됫다, 되기까지, 됐고, 되어, 돼버린, 된건지, 돼있다, 된건, 시킨다, 될듯, 됌, 돼, 됬고, 된것, 될줄, 되지, 되었는데, 되리, 해버렸다, 하려다, 되거나, 돼서, 되가는, 됐던, 될수록, 될거, 됨으로써, 시켰다, 되버, 될뿐, 되겠다, 되기, 어느새, 될까, 되길, 될, 오다, 됐는데, 되려, 될꺼, 되면, 됬지만, 되긴, 됐어, 된게, 되느, 됐나, 되거, 됨을, 됨에, 될뻔, 바뀐다, 되나, 어느순간, 되요, 된걸까, 되네요, 되겠, 나타났다


보다

보단, 들보다, 그것보다, 훨씬, 것보다, 훨, 1편보다, 그보다, 못지않게, 만큼이나, 2보다, 훨신, 낫고, 3보다, 이상으로, 거보다, 작보다, 전작보다, 판보다, 이쪽이, 편보다, 전작들보다, 1보다, 물보다, 원보다, 책보다, 천배, 1탄보다, 2보다는, 이전에, 다음으로, 전편보다, 낫다, 3보단, 백배, 전보다, 본편보다, 2보단, 몇배는, 씬보다, 신보다, 보더, 못지, 때보다, 낫더라, 원스보다, 삶보다, 이것보다, 의외로, 일수록, 쪽이, 그보, 나음, 총보다, 일때가, 상대적으로, 웬만한, 0배, 보가, 것보단, 명량보다, 1보단, 개인적으론, 이후로, 오히려, 돈보다, 비하면, 이외에, 개인적으로, 비해, 왠만한, 뺨치는, 쬐끔, 보기전에, 더, 자보다, 비중이, 만큼, 때문인지, 말보다, 낫네, 들보, gt, 이전의, 보디, 유난히, 낫지만, 치보, 누구보다, 이후에, 바닐라스카이, 전편보단, 무엇보다, 갠적으로, 다웠던, 이상의, 이보다, 다워, 알고보니, 한층


대하다

min_count 조건(빈도가 100 이하인 단어는 Word2Vec 임베딩에서 제외)에 의해 결과가 나오지 않았습니다. 흔한 단어임에는 틀림 없으나 기본형보다는 활용형으로 자주 쓰이기 때문으로 풀이됩니다.


위하다

min_count 조건(빈도가 100 이하인 단어는 Word2Vec 임베딩에서 제외)에 의해 결과가 나오지 않았습니다.


말하다

min_count 조건(빈도가 100 이하인 단어는 Word2Vec 임베딩에서 제외)에 의해 결과가 나오지 않았습니다.


가다

가면서, 가다가, 가며, 걷다, 가듯, 가더, 간다, 가더라, 가니, 오다, 오며, 뛰다, 풀다, 오면서, 가나, 갈때, 가던, 놓다, 갔다, 치다, 가고, 왔다, 가도, 거슬러, 가는, 하려다, 내다, 가버리, 가네, 서다, 온다, 왔지만, 가서, 가면, 가겠지, 섰다, 갔고, 가자, 갔으, 갈, 오듯, 돌렸다, 간듯, 서서, 잡다, 가버렸다, 가냐, 가보, 오더, 주다, 갈지, 살다가, 갈수, 갔지만, 쓸려, 가느라, 담다, 오지만, 가려는, 다닌다, 어느새, 곧장, 가니까, 갈까, 가거나, 와서, 넘기, 숲속으로, 쫓다, 나간다, 막다른, 오고, 갔네, 하다가, 오듯이, 리다, 허겁지겁, 갈땐, 갑니다, 가더라도, 가기, 천천히, 갔더, 다님, 갔구나, 서둘, 올때, 가지, 달려가는, 나갔다, 왔을때, 가겠다, 비춘다, 가길, 나가다가, 놓고, 가선, 간, 듣다, 타다


받다

받았다, 받음, 받고, 받은, 받으, 주다, 받으면, 받는, 받게, 받으며, 받을, 당했다, 받았, 받아, 받지, 받기, 받으려는, 당함, 받았던, 버림, 받겠, 받으러, 듣다, 받던, 상속, 갑니다, 전해진다, 싸다, 조기, 퍼진다, 당해서, 풀다, 온, 울다, 받거나, 주입식, 당하고, 당하는, 주자, 왔다, 당한, 보내는, 해버렸다, 선사한다, 부른다, 전한다, 가한, 받길, 이오, 당하, 빅엿, 기쁘, 한답시고, 받으려고, 받긴, 선사하는, 담다, 표한다, 얻다, 이룩한, 왔습니다, 표함, 먹다, 해대, 주다니, 얻는, 치다, 남기는, 되더, 전파, 후라, 가더, 선사했다, 셀프, 이었겠지, 질렀다, 하려다, 하라, 투수, 어퍼컷, 오는, 모의고사, 건내는, 옴, 당했지만, 값싼, 돌림, 노벨, 날리는, 온다, 전하는, 준다, 안기고, 주거, 보냄, 남긴, 옛다, 날렸다, 마땅하다, 내린다


보이다

min_count 조건(빈도가 100 이하인 단어는 Word2Vec 임베딩에서 제외)에 의해 결과가 나오지 않았습니다.


실험결과5 (형용사)

없다

없었다, 없음, 없더라, 없네, 없구나, 없당, 없네요, 없습니다, 없군, 음슴, 없엉, 없는, 없죠, 없지만, 없겠지, 없었고, 없으나, 없으며, 없나보다, 없고, 없단, 없으니, 없거든, 없겠지만, 없었지만, 없듯이, 없단다, 없겠다, 없었던, 없자나, 없어, 없던, 없달까, 없구, 없을, 없음을, 없으, 없었, 없엇, 없듯, 없더, 없은, 있겠는가, 없기에, 있다, 없었는데, 없, 없겠, 없긴, 없지, 없어서, 없나, 없잖아, 없기는, 없잖, 있나, 있었다, 있겠습니까, 없니, 없냐, 없거나, 있을까, 잇다, 있냐, 많다, 있엇다, 없을만큼, 이렇다, 없게, 도없, 있겠다, 없기, 적다, 있죠, 있겠, 없어도, 안난다, 있었을까, 있군요, 있더라, 있겠지만, 껴진다, 못찾겠다, 있군, 있답니다, 있으려나, 있음, 못느, 쏘냐, 많았다, 있었습니다, 덜하다, 있습니다, 래야, 없으면, 잃었다, 많음, 수없, 안남, 진부하다


그렇다

그랬다, 그랬지만, 평범하다, 그렇고, 식상하다, 좋다, 진부하다, 엉성하다, 그렇지, 지겹다, 훌륭하다, 그렇듯, 진부했다, 어설프다, 그렇, 좋긴, 심심하다, 어색하다, 뻔하다, 평타, 무난했다, 그래, 마찬가지, 불편하다, 그렇지만, 멋지다, 참신하다, 논외로, 글쎄, 괜찮았다, 지루했다, 지루하다, 볼만하다, 불친절하다, 볼만했다, 좋지만, 그랬는데, 유치하다, 싫다, 이렇다, 맞다, 그랬듯이, 오글거린다, 잔잔하다, 약하다, 참신했는데, 질린다, 외롭다, 울뿐, 독특하다, 그랬던, 별거없, 좋았다, 신선하다, 신선했다, 멋있다, 슬프다, 좋기, 암만, 구리다, 이뻤다, 참신했다, 촌스럽다, 나아졌다, 나쁘다, 중박, 이니까, 훌륭하지만, 별게, 멋지지만, 졸립다, 작다, 특이하다, 솔직히, 심했다, 허술하다, 즐겁다, 대단했다, 옳다, 예쁘다, 무난하다, 우수하다, 묘하다, 치더라도, 새롭다, 별론데, 화려하다, 싫지만, 이기적이다, 감각적이다, 과하다, 만족스럽다, 피곤하다, 아름답다, 잔인하다, 쏘쏘, 이쁘지만, 신기했다, 서글프다, 억울하다


같다

같음, 같습니다, 같네요, 같았다, 같당, 같고, 같네, 같긴, 같아, 같지만, 같았고, 같았던, 거같다, 같애, 같군, 같기도, 같어, 같았음, 같았지만, 것같다, 같았는데, 듯하다, 같, 같아서, 거같음, 같던, 같은, 듯, 같단, 같구, 같진, 것같음, 같달까, 같으면서도, 같으, 같았, 듯싶다, 같냐, 같기, 같구나, 거같은데, 인거같다, 듯ㅋ, 듯ㅎㅎ, 듯ㅠㅠ, 것, 듯ㅋㅋㅋ, 같으면서, 듯했다, 거같고, 뿐임, 같더, 같지, 듯ㅋㅋ, 듯함, 거라는, 처럼, 듯합니다, 거같은, 꺼같다, 거다, 거에요, 인것같다, 뿐이다, 테니까, 같을까, 이다, 것처럼, 거란, 듯하고, 뻔했다, 가싶다, 인듯하다, 거같아, 맞죠, 같으니, 인듯, 테고, 텐데, 가요, 듯한, 같을, 거야, 데ㅠㅠ, 몇안되는, 뎅, 아냐, 것임, 닮았다, 데ㅋㅋㅋ, 듯하지만, 였습니다, 같으면, 거라고, 테지, 이었다, 였다, 거네, 것인데, 데요


어떻다

min_count 조건(빈도가 100 이하인 단어는 Word2Vec 임베딩에서 제외)에 의해 결과가 나오지 않았습니다.


이렇다

저렇, 평범하다, 없다, 그렇다, 진부하다, 왈가왈부, 뭐라, 없습니다, 틀렸다, 틀리다, 그렇지, 범접, 바뀌었다, 어떻, 반댈세, 식상하다, 다르다, 갈린다, 이렇, 딱히, 복잡하다, 전무후무, 뻔하다, 지루하다, 그렇듯, 불완전하다, 동의, 답, 글쎄, 나쁘다, 그러, 무난하다, 장담, 어쩌라고, 그랬다, 없긴, 저러, 음슴, 애매하, 졸립다, 없겠지만, 덜하다, 지겹다, 답이, 없기는, 가능하다, 갈리, 그렇, 허술하, 분분, 다라고, 없더, 고들, 그랬듯이, 말하자면, 감히, 평하, 화라, 무의미하다, 적으, 단하, 부족하다, 졌으, 겉핥기, 어차피, 잊으라, 맞다, 원체, 옳다, 깔끔하다, 독특하다, 뭐니, 없더라, 난해하다, 그다지, 없으, 없당, 어짜피, 주관적인, 지향해야, 따분, 이러, 애매하다, 일것이, 불가능하다, 별로, 담겨있다, 달랐다, 허술하다, 안한다, 평도, 논외로, 별거없, 시시, 불확실, 없었다, 단일, 마션이, 명확하, 색다르


다르다

달랐다, 비슷하다, 틀리다, 다르지만, 다르고, 비슷하, 다르, 다르게, 다른, 닮았다, 비슷하지만, 달랐던, 닮아있다, 확연히, 달라, 엄연히, 다름, 달랐, 똑같, 비슷, 틀렸다, 바뀌었다, 정반대, 특이하다, 다를, 과는, 별개, 달랐지만, 맞다, 별개의, 갈린다, 상관없다, 비슷한, 반대로, 달리, 새롭다, 유사하다, 오글거린다, 별개로, 달라지는, 틀린, 틀리, 차원, 흡사, 상관없는, 와는, 평범하다, 상관없이, 어색하다, 거칠다, 낮다, 떨어진다, 동떨어진, 무관, 궤를, 중요하다, 무의미하다, 옳다, 똑같은, 바뀐다, 불완전하다, 신선하다, 비슷해서, 진부하다, 복잡하다, 나아졌다, 독특하다, 사뭇, 틀려, 빠르다, 차이, 닮았, 다름을, 상반된, 마찬가지로, 동일, 2라, 겹친다, 나뉜다, 바뀐다는, 비교, 불가능하다, 안맞, 겹치, 밝다, 바꼈다, 동떨어, 일반적인, 멀다, 상극, 느리다, 안맞는, 동일한, 약하다, 허술하다, 공존한다, 입는다, 급이, 그렇다, 다름이


크다

컸다, 컷다, 큰듯, 컸고, 크네, 크긴, 크지만, 컸지만, 적다, 컸기에, 클수록, 컸음, 작다, 크지, 크나, 깊다, 큰, 강했다, 작았다, 크니, 컸던, 커졌다, 큰법, 강하다, 높다, 깊었다, 낮다, 컷던, 큰데, 어마어마하다, 큰만큼, 크고, 많다, 대단했다, 약하다, 클, 크면, 큰지, 심하다, 커진, 커서, 짙다, 크진, 덜하다, 많았다, 강렬했다, 굉장하다, 얕다, 작지, 세다, 무겁다, 스러웠다, 컸나, 컸는, 어마어마, 짧다, 약했다, 길다, 작아서, 심함, 늘었다, 적어서, 크나큰, 커질, 나아졌다, 컸으면, 어마어마하, 넓다, 높음, 적었, 느껴진다, 심했다, 떨어진다, 높았, 깊음, 스럽다, 낮음, 느껴졌다, 진하다, 약해서, 커지, 커졌, 커져, 심하고, 중요하다, 돋보였다, 길었다, 상당, 덜함, 띄었다, 커지고, 커, 크기가, 쎄다, 넓어, 위험하다, 커지는, 대단하다, 덩치, 심한


많다

많았다, 많음, 많습니다, 많고, 많았고, 많지만, 많기에, 많았는데, 많네, 많았던, 많아서, 많구나, 많아, 많으니, 많았지만, 많은, 많지, 많긴, 많겠지만, 많았, 적다, 많더라, 많으, 많을, 크다, 심하다, 많기, 거슬린다, 없더라, 컸다, 약하다, 과했다, 강했다, 없다, 컷다, 강하다, 인상적이다, 심했다, 산만하다, 심하고, 있긴한데, 작위적이다, 허술하다, 있다, 길다, 작다, 길었다, 짙다, 높다, 적어서, 많으면, 몇몇, 세다, 인상적이었다, 인상깊었다, 없네요, 낮다, 담겨있다, 큰듯, 빠르다, 짧다, 없습니다, 늘었다, 띄었다, 과하다, 깊다, 친절하다, 숨어있다, 인상깊다, 티나는, 있었다, 멀다, 약했다, 등, 대부분이, 적었, 있었습니다, 찰지다, 작았다, 있긴, 적고, 얕다, 심심하다, 위험하다, 느리다, 없네, 심함, 등등, 어색하다, 멋졌다, 가득하다, 적게, 나아졌다, 없기는, 낫다, 적지, 피곤하다, 나았다, 없었다, 뻔하다


좋다

좋음, 좋았다, 좋당, 좋더라, 좋타, 좋네, 좋앗다, 좋네요, 조으다, 조음, 좋구나, 좋았고, 좋습니다, 좋고, 좋드라, 좋던데, 좋구, 좋앙, 멋지다, 좋지만, 훌륭하다, 조타, 인상적이다, 좋군, 좋긴, 멋졌다, 인상적이었다, 귀엽다, 싫다, 인상깊다, 멋있다, 싫었다, 신선하다, 깔끔하다, 편했다, 신선했다, 괜찮았다, 돋보인다, 돋보였다, 일품이다, 예쁘다, 만족스럽다, 흥겹다, 굳, 인상깊었다, 좋으니까, 신기했다, 좋았지만, 맘에, 찰지다, 정겹다, 존좋, 좋앗, 반갑다, 그렇다, 귀여웠다, 참신하다, 유쾌하다, 굿, 좋잖아, 구리다, 어색하다, 반가웠다, 좋, 경쾌하다, 좋았는데, 감각적이다, 아름답다, 곱다, 좋았, 흥미로웠다, 즐겁다, 싫음, 조아, 이뻤다, 독특하다, 설렌다, 좋더, 좋아, 이쁘다, 탁월하다, 조은, 재밋다, 불편하다, 예뻤다, 좋은, 특이하다, 자연스럽다, 아름다웠다, 짱임, 나빴다, 묘하다, 달달하다, 시원시원하다, 색달랐다, 아쉬웠고, 따뜻하다, 웃기다, 즐거웠다, 굿굿


이러하다

min_count 조건(빈도가 100 이하인 단어는 Word2Vec 임베딩에서 제외)에 의해 결과가 나오지 않았습니다.


실험결과6 (부사)

훨씬, 더욱, 더더, 덜, 좀더, 훨, 더더더, 훨신, 몇배는, 한층, 천배, 더더욱, 백배, 전보다, 오히려, 원스보다, 때보다, 0배, 배로, 제일, 더한, 스탁, 두배, 가장, 배는, 쫌만, 좀만, 3보다, 알수록, 2보다, 이것보다, 배럴즈, 이보다, 이만큼, 이쪽이, 덜했, 전편보다, 1편보다, 그보다, 나은, 보다, 더보, 젤, 더줌, 더해, 그나마, 그것보다, 1탄보다, 보단, 외려, 울수록, 수록, 전작보다, 얼마나, 으련만, 피그, 나왔더라면, 개인적으론, 5배, 더가, 2보다는, 할수록, 백, 다듬었, 한단계, 명량보다, 더와, 확실히, 그만큼, 일수록, 이라도, 덜하지만, 볼수록, 2배, 워낙, 넘, 상대적으로, 2보단, 조금, 나아, 덜해, 강해진, 덜함, 이상으로, 다빈치코드, 나았, 더했다, 작보다, 덜한, 굉장히, 1보다, 차라리, 쪽이, 덜하, 낫네, 괜시리, 간한, 전작들보다, 무척, 낫더라


다시

금, 한번, 또다시, 번, 또, 나중에, 곱씹어, 새롭게, 두번, 몇번이고, 세번, 되짚어, 되돌아, 년뒤에, 찬찬히, 언젠가, 또또, 다신, 번이고, 뒤늦게, 년만에, 되새겨, 두고두고, 곱씹으며, 몇번이나, 매년, 우연히, 쯤, 꺼내, 몇번을, 두세번, 일년, 돌아, 조만, 찾아, 특선으로, 문뜩, 뒤돌아, 번을, 네번, 또보고, 돌이, 새삼, 얼마전, 전으로, 첨으로, 최근에, 번씩, 각잡고, 두번째, 보고, 년후, 째로, 엄두가, 기념으로, 되감, 번이나, 백번, 감회가, 내년에, 기회가, 정주행, 오랫만에, 2번, 느낍니다, 오랜만에, 지우고, 세번째, 켜, 볼때마다, 꼭, 3번째, 광복절, 씻고, 만에, 번은, 매번, 때마다, 그제서야, 이영화를, 해마다, 올때마다, 보라, 곰곰, 복습하고, 몇번, 번쯤은, 서야, 드디어, 언젠간, 공부하고, 번만, 년뒤, 진면목을, 문득, 확인, 김질, 엔에서, 월에, 며칠


웬만, 못, 안되는, 안봤는데, 안됐다, 안돼, 안된다, 왠만, 안나, 안본, 안가, 안나오는, 안해, 안됬다, 못알아, 안됐, 왠만하면, 안될, 안됨, 안그, 안보고, 안맞아, 안되, 안봐도, 안봅니다, 안해도, 안되지만, 안들어, 안봐, 안하는, 말안, 안되고, 어케, 안되게, 못봐, 안대, 에혀, 적게, 안맞는, 이상하게, 안났다, 안갔, 안와, 나랑, 도저히, 사서, 안봄, 안만, 나중에, 술먹, 못보는데, 못봤다, 뭘해도, 안무서웠, 안되서, 못본, 안봤, 도무지, 안무서워, 만하면, 못보겠, 비만, 뭔말인지, 안맞, 못보는, 안함, 2배속으로, 못봄, 야한거, 안한, 안봤다, 못봤, 당연히, 안됩니다, 안난다, 무서워서, 솔직히, 트포, 안가고, 억울해서, 첨에, 안볼, 해선, 큰일, 열받아서, 안감, 음슴, 울면서, 안한다, 얼추, 족족, 없거나, 계속, 백퍼, 잊어버려, 같이, 애랑, 곱게, 많이, 아나


훌륭하게, 적절하게, 제대로, 멋지게, 맛깔나게, 적절히, 탄탄하게, 세련되게, 정확하게, 매끈하게, 섬세하게, 깔끔하게, 감각적으로, 완벽하게, 자알, 똑똑하게, 절묘하게, 매끄럽게, 멋드러, 세심하게, 충실히, 실감나게, 재치있게, 기똥차게, 영리하게, 예쁘게, 명확하게, 완벽히, 충실하게, 정교하게, 맛있게, 명확히, 독특하게, 잘은, 확실하게, 조화롭게, 멋들어, 잘이, 흥미롭게, 성공적으로, 치밀하게, 막히게, 정확히, 자연스럽게, 아기자기하게, 상업적으로, 대충, 감있게, 아름답게, 담백하게, 참신하게, 무난하게, 설득력있게, 이쁘게, 유쾌하게, 얼추, 생생하게, 극적으로, 귀엽게, 흥미진진하게, 잘도, 적나라하게, 세세, 찰지게, 알차게, 있게, 위트있게, 잘만, 재밋게, 넘치게, 절절하게, 잘된, 잘한, 다양하게, 매혹적으로, 어울, 맛나게, 성실히, 자세히, 부드럽게, 잘그, 단적으로, 맞게, 무난히, 솔직하게, 어울렸다, 색다르게, 무섭게, 말끔, 어설프게, 선명하게, 성실하게, 세밀하, 극단적으로, 기발하게, 잇게, 경쾌하게, 잘맞, 열심히, 허술하게


가장

제일, 젤, 유일하게, 재일, 무척이나, 젤로, 이토록, 유독, 굉장히, 중에, 몇안되는, 꽤나, 중, 손꼽히는, 이처럼, 다음으로, 더없이, 상당히, 매우, 단연, 단연코, 참으로, 무척, 통틀어, 것중, 유난히, 사상, 유일한, 중에서도, 이다지도, 비교적, 아주, 물중에, 이보다, 얼마나, 이만큼, 최초로, 더, 물중, 만큼이나, 더욱, 누구보다, 꽤, 훨씬, 엄청나게, 이리도, 최고의, 그토록, 놀랍도록, 정말, 드물게, 독창적이고, 대단히, 장예모의, 참, 으뜸, 지독히도, 지극히, 최대의, 못지않게, 단언컨데, 중엔, 유일, 최초의, 들중, 그만큼, 훨신, 꼽힐, 꼽을, 단언컨대, 만큼, 손꼽, 더불어, 제법, 역대, 진정으로, 의외로, 영리하고, 유일무이한, 지나치게, 무엇보다, 꼽는, 압도적으로, 극도로, 여태, 첫, 이렇게, 너무, 모처럼, 외화, 최악의, 개인적으로, 투탑, 위트있고, 요근래, 아이러니하게도, 극히, 것보다, 첫번째, 대체적으로


함께

같이, 더불어, 나란히, 손잡고, 수님, 정님과, m님과, 지님, 이희, e님과, 동시대에, 님과, 쌍벽을, 원님, 단둘이, 희님과, 영님, 현님, 진님과, 경님과, o님과, 공유하며, 마찬가지로, 용산에서, 김유, 강민, 동반자, 정혜, 씨름, 산책하는, 이현, 공원에서, 조우, 맞으며, 김우, 먹으며, 다같이, 여의도에서, 맞바꾼, Chan, 동시에, 들으며, 추며, 로에서, 공명, 티몬, 이태, 비슷, 문점에서, 연님과, 김지, 준님과, 한소희님과, 필히, 동행, Moon, 합주, ya, 김태, Pa, 배웅, 일산에서, 김기, 강변에서, 동반, 어깨를, 스노, 백상민님과, Mi, 김진, 상암에서, ae, 흡사, 이강, 럴점에서, 사카모토의, 들으면서, 산책, 맞이, 비슷하다, Le, 술한, 즐겁게, 강영은님과, 바닷가에서, 신촌, GV, 김동, Je, 궤를, Ko, 오가며, 재회, SH, 주님, Da, 춤을, 맞먹는, 공유하는, 정든


바로

야말로, 전부, 곧, 진정한, 만약, 아마도, 이곳이, 당장, 이것이, 정녕, 아닐까, 그러니까, 뭐냐, 묘미, 너가, 불현듯, 반드시, 유일한, 너야, 이었구나, 과연, 진정, 뭐임, 아마, 뭐에요, 꼭, 였구나, 트레이, 정수, 만일, 설마, 마치, 나혼자, 당신이, 즉, 꿈인가, 뭔데, 아니라, 빌어먹을, 국익이, 캬, 여담이지만, 드디어, 진짜, 끝자락에, 월에, 뭐니, 이구나, 다움이란, 비로소, 모든, 혹시, 서고, 곧바로, 다야, 시초, 시빌, 이곳, 일거, 나인가, 뭐야, 먼저, 그제, 원하던, 앞과, 이전에, 있소, 보자마자, 반댈세, 어딜가나, 뭡니까, 이자, 시부, 직전에, 찾던, 프렌즈, 궁극, 참교육, 별에서, 빈라덴, 비단, 원래, 즉시, 마자, 우선, 여기에, 진정으로, 명실상부, 꿈인지, 이야말로, 누군가가, 미져리, 정답이, 무엇인지, 아하, 자넨, 서슴없이, 아차, 말구, 매직


모두

모든, 또한, 전부, 각각의, 각자, 모조리, 각자의, 대부분의, 3박자, 둘다, 골고루, 각, 대다수, 나머지, 대부분, 한명한명, 두가지, 각의, 각기, 저마다의, 외, 뿐아니라, 수많은, 두마리, 챙긴, 개개인의, 들도, 들까지, 얼라이언스, 두루, 다수, 세명의, 물론, 누구나, 세가지, 자신들의, 무엇보다, 고루, 삼박자, 결핍된, 죄다, 주조연, 싸그리, 각각, 오롯이, 외의, 개성있는, 포함한, 무엇하나, 이외, 곧, 대부분이, 결국, 저마다, 시청자, 들마, 공평하게, 3박자가, 주위, 동시에, 스스로, 마저도, 마져도, 개개인, 싹다, 한마음, 우리, 조화롭게, 당연히, 3명의, 세세한, 진정으로, 총체, 즉, 마저, 둘, 력까지, 누구, 온전히, 주변, 완벽하게, 진정, 왕도, 성까지, 몽땅, 들의, 들조차, 완벽히, 삼박자가, 망자, 외적인, 일그러진, 이동휘, 사카모토의, 양쪽, 아낌없, 주변의, 당대, 선남선녀, 셋은


없이

감없이, 안하고, 아무, 틈없이, 아무생각없이, 없고, 정보없이, 런, 없는, 단순하게, 낌없이, 없으며, 없게, 이상으로, 내려놓고, 가볍게, 이유없이, 것없이, 망설임, 배제하고, 기교없이, 웃으면서, 없지만, 부담없이, 비우고, 편하게, 않고, 맘으로, 별생각없이, 웃으며, 없었고, 물흐르듯, 없기에, 무시하고, 없음, 없어서, 정신없이, 대며, 겨를, 쉴새, 별다른, 도없, 없던, 막무가내로, 꾸밈없이, 없었지만, 없으나, 사전정보, 많고, 쉴세없이, 마음으로, 하며, 조용하게, 같이, 없다, 만으로, 놓고, 유쾌하게, 말없이, 모른채, 잔잔하게, 소소하게, 있게, 쉼없이, 내며, 먹으며, 가볍고, 컷으로, 끝도, 하면서, 없었는데, 거없, 먹으면서, 원없이, 날림, 안했는데, 웃으려고, 없더라, 쉬지않고, 없을만큼, 거침없이, 단순하고, 막힘없이, 맘편히, 군더더기, 안들고, 마디로, 무심히, 없듯이, 쉴새없이, 외에는, 없었던, 넘치게, 깔끔하고, 무작정, 틈도, 면으로, 무난하게, 렇지, 상태로


다ㅋㅋ, 다ㅠㅠ, 다ㅠ, 다ㅜ, 다ㅎ, 다고, 다ㅡ, 다ㅋㅋㅋ, 다라는, 다ㅋ, 다ㅎㅎ, 다는, 다ㅋㅋㅋㅋㅋ, 다ㅋㅋㅋㅋ, 다더, 다던, 다구, 얌, 다며, 다면, 다란, 었다, 다던데, 다네, 다지만, 다거나, 다아, 다라고, 다의, 다와, 다잉, 에요, 구먼, 예요, 구만, 닷, 닼ㅋㅋㅋ, 다기, 라능, 었당, 엿다, 였다, 로구나, 죠, 었겠지, 다도, 에여, 야ㅠㅠ, 었군, 였음, 지요, 었음, 겠지, 였군, 었지만, 거든요, 더라, 단다, 노병은, 듯하다, 다에, 것같다, 거늘, 었는데, 란다, 라해도, 다라, 었달까, 엇다, 군, 더라도, 엇음, 랍니다, 야라는, 었더라, 였어, 구나, 었네, 다길래, 희안한, 었구나, 지ㅋ, 닼ㅋㅋ, 였어요, 었죠, 다진, 었으나, 였당, 지만, 네, 네요, 시다, 었잖아, 더군, 여, 엿는데, 군요, 로다, 었습니다, 당


실험결과7 (감탄사)

참으로, 정말, 무척, 굉장히, 무척이나, 넘, 매우, 너무, 겁나, 상당히, 꽤나, 몹시, 디게, 꽤, 아주, 되게, 느무, 왜이리, 젤, 느므, 넘넘, 제일, 존나, 왜이렇게, 제법, 엄청, 대체적으로, 왜케, 졸라, 더없이, 어찌나, 증말, 여러모로, 왤케, 막히게, 대단히, 이렇게, 진짜, 너므, 이리도, 의외로, 예쁘고, 참신하고, 무엇보다, 너어무, 신선하고, 희안하게, 어쩐지, 이처럼, 더럽게, 거참, 드럽게, 왜캐, 얼마나, 이쁘고, 넘나, 좋고, 특히, 워낙, 나름, 소름끼치게, 은근히, 좋긴, 유독, 겁내, 독특하고, 썩, 더할나위, 가장, 원체, 젤로, 부럽고, 색다르고, 엄청나게, 어쩜, 은근, 기막히, 어쨌든, 이런, 열라, 더더욱, 어마어마하게, ㅈㄴ, 독특해서, 아무튼, 반갑고, 아따, 은이, 꾀, 훈훈하고, 만큼이나, 말밖, 쫌, 이토록, 유난히, 이래서, 훌륭하고, 특이하고, 훨씬, 이세영


그래

그럼, 그러니까, 뭐, 너네, 응, 임마, 니네, 시벌, 어때, 얜, 아, 이건, 이니까, 봤냐, 그냥, 어차피, 봐봐, 그니, 니들은, 울지마, 얘들아, 왜그랬어, 머, 니가, 잖아, 죽였어, 얘는, 어머, 이봐, 그렇다, 니들, 에휴, 걍, ㅆ, 이래야, 하하하하하하, 기냥, 너도, 니깐, 닥치고, 넌, 근데, 아ㅏㅏ, 라구, 만요, 욧, 하, 그렇, 미쳤어, 잘생기면, 좆까, 그랬, 야해, 으음, 다워, 지뭐, 야호, 쳤어, 하니까, 할래, 사줘, 다야, 씨발, 이잖아, 볼래, 막나가, 이거, 어떠냐, 데헷, 이래, 있잖아, ㅏㅏ, 키야, 내버려둬, 느그, 거기, 너넨, 니까, 음음, 러면, 아아, 뿌셔, 하하, 너는, 살거, 했니, 하잖아, 잘했어, 씨바, 저래, 나야, 찍자, 아뇨, 알잖아, 얘, 기야, 너랑, 에잇, 하아, 건들지마


하, 아아, 으아, 아아아, 씨발, 아오, 하아, 아악, 으, ㅅㅂ, 시벌, 앜, 아ㅏㅏ, 어휴, 아아아아, 아ㅋㅋ, 아놔, 아ㅠㅠ, ㅆ, Aㅏ, 젠장, 아아아아아아, 시팔, 아씨, 개좋, 아아아아아아아, 씨바, ㅠㅠ, 와씨, 앜ㅋㅋㅋㅋ, 앙, 오, 으악, 썅, 아아아아아, ㅏㅏ, ㅡㅡ, ㅜㅜ, 어우, 와아, ㅠㅜ, ㅜㅠ, ㅁㅊ, 으앙, ㅏ, ㅆㅂ, 그니, ㅡ, 응, ㅠ, 아유, 어어, 우어, 흑흑, ㅜ, 니미, 우와, 오오, 으어, 내사랑, 제길, 오오오오, ㅏㅏㅏ, 으으, 으윽, 에휴, 헐, 아인, 히익, ㅂㄷㅂㄷ, ㅎㅇ, 오우, ㅅ, ㅁ, 흐엉, 하하하하하하, 글고, 시발, 하하, 흐, ㅇㅁ, 엉, 은데, 샤이, 에잇, 이거, 핳, ㄴ, 윽, 어후, ㄹㄹ, 워후, 얜, 잘잤다, 뭐야, 왜그랬어, ㅋ아, 와아아, 근데, 8ㅅ8


머, 걍, 그냥, 암튼, 그럼, 그래, 그럭, 어쩌라고, 어쩌라는, 쨌든, 어때, 그거, 이것도, 저냥, 기냥, 흐음, 음음, 뭐가, 어차피, 개망, 아무튼, 여튼, 글쎄, 어떠냐, 응, 원래, 어쩌, 뭐하자는, 이건, 뭐랄까, 어쨌든, 에휴, 저건, 저럭, 어쨋든, 뭐래, 솔직히, 으음, 겟고, 뭔, 이정도면, 다들, 딱히, 에효, 그래도, 그럭저럭, 뭐야, 별거없, 하튼, 할말이, 쩝, 그니, 일단, 어쨌, 흠, 구냥, 얜, 잼이, 안그, 뭐하, 쨋든, 솔까, 근데, 어휴, 흠흠, 다야, ㅋ, 핵노, 거없, ㅇㅇ, 뭣, 하하, 않습니, 니깐, 별게, 깐, 니까, 말구, 시벌, 안무서움, 지뭐, 뭐니, 어떻, 쏘쏘, 쟤가, 뭥미, 뭐다, 저래, 별론데, 어찌됐든, 좋잖아, 머가, 머랄까, 당연히, ㅡㅡ, 볼만, 개막장, 뭐라, 잼난다, 그러니까


자는, 자와, 고자, 자인가, 자에, 자가, 자의, 자이, 싶어하는, 싶었던, 자들, 세요, 자로, 자하, 자라는, 자였다, 려는, 시길, 싶나, 싶소, 픈, 자들은, 려, 려고, 려한다, 싶었으나, 자였, 싶던, 자니, 자도, 자를, 자에게, 자들의, 자로서의, 싶었다, 싶었, 자라면, 자라고, 자들에게, 싶은, 시라, 려하는, 싶어, 박애, 지말, 자마, 자보다, 범, 않으려, 겐지, 자인지, 소서, 싶구나, 갈팡질팡, 담당, 자다, 싶다, 자로서, 싶냐, 싶, 패배, 려던, 만다, 신대, 자만, 자들이, 왕관을, 고싶다, 열등, 하자, 되라, 강연, 시전, 자일, 전하고, 자들을, 자인, 파, 기전에, 왕, 셈, 하라, 길, 스승은, 지망, 방랑, 신듯, 후원자, 덮으려, 하려, 의뢰, 자만이, 기도, 양, 남으려, 시게, 싶었지만, 러, 반역, 싶고


아니

아님, 아니라, 아닙니다, 아냐, 아닌, 아녀, 아닐, 능사는, 반칙이, 급이, 몫이, 였더라, 탓이, 수준이, 아니지만, 아닐지, 어딨, 아님을, 덕분이, 이냐, 짱이, 모양이, 비단, 맞다, 였으, 뿐이, 바뀌, 이것은, 뻥이, 도아, 제쳐두, 덤이, 되버리, 죄라, 변함없, 였어, 나뿐, 에러, 확실하다, 오랜만이, 맞습니다, 였, 인척하, 내것이, 이건, 애시, 이하, 너였, 대상이, 마찬가지, 정상이, 그렇다면, 었어, 나였, 흔치않, 였군, 그건, 개판이, 에요, 최선이, 갑이, 인줄, 줄어들, 안찍, 였으니, 낫겠, 개쩔, 란말이, 란다, 해먹, 야라, 로다, 라해도, 전유물이, 이되, 이아, 차치하, 드물, 일줄, 되버렸, 터이, 였구, 엉망이, 덕이, 원한, 틱하, 였으면, 였네, 싫으, 못됐, 어쩔뻔했, 였었, 올시다, 내스타일, 모독이, 미남이, 였나, 입니까, 못되, 이랬


사례, 예시, 대표적인, 본보기, 예가, 예이, 표본, 모범, 답안, 격, 예로, 모범답안, 작명, 바람직한, 온고지신, ㄹ, 모범적, 폐해, 정석, 법, 효시, 레시피, 화의, 퍼무비, 한글제목, 방법, 성교육, 중요성, 운수, 합, 전형, 현지화, 조기교육, 드문, 미학, 단적으로, 놈과, 모범적인, 재능낭비, 워너, 교본, 인거같다, 삼위일체, 아더, 가성비, 취지, 한글, 대표, 영리한, 대명사, 뻐, 활용, 바이, 장점을, 표상, 부제, 벗, 작법, 틴무비, 순기능, 의역, 예를, 두유, 인듯하다, 메이드, ㅓ, 끝판왕, 프랜차이즈, 표준, 레어, 아닙니, 법이, 별미, 번역, 밑바, 공식을, 교과서, 례, 최정, 미덕, 망치는, 절한, 망친, 콜라보, 전형적인, 봉, ㅈ, 클리, 삼박자, 톤과, 점과, 라노, 경우, 좋은, 대중영화의, 사용, 것입니다, 전성시대, 프렌차이즈, 리부트


뭐야, 음음, 시벌, 엥, ㅅㅂ, 헐, 아ㅏㅏ, 오잉, 데헷, 어어, 앜, 으응, ㅇㅅㅇ, 그럼, 어어어, 그래, ㅁ, 아, 으음, 아아아아아, 우오, 씨바, ㅎㅇ, 모야, ㅇㅅ, ㅡㅡ, 히익, 하하하하하하, 하, 참나, 으아, 아놔, ㅇㅇ, 개쩌, 그러니까, 으, 오오오오, 뭐여, ㅇ, ㅆ, 앗, 이럼, 우와, 걍, 시팔, 뭐지, 어쩌라고, 어어어어, ㅆㅂ, ㅋㄱㅋ, 하하, 아아, 하핳, 휴우, 아아아아아아아, ㅏㅏ, 잉, 다야, 오, 읭, 머야, ㅋ, 얜, ㄴ, 우어어, 하하하, 뭐, 아아아아, 뭥미, 아악, 만요, ㅏㅏㅏ, 오오, ㅗ, 힝, 예쓰, 우오오, 으잉, 오오오, 으악, 아씨, 푸슝, 뭐임, 와아아, 젠장, 허허, 구, 헉, 아하, 아아아, 왜이래, 욤, 제길, Aㅏ, 씨발, 트루러브, 아아아아아아, 꺅, ㅅ, 존나


글쎄

글세, 솔직히, 그닥, 올시다, 뭐랄까, 그럭저럭, 불호, 어쨋든, 쏘쏘, 빵점, 어쨌든, 아무래도, 뭐, 별루, 적어도, 별로, 보통, 그래도, 별론데, 흐음, 솔찍히, 딱히, 아쉽게도, 볼만했다, 그다지, 글쌔, 그렇다, 그외, 잘모르겠다, 2프로, 머랄까, 노코멘트, 어쨌, 어찌됐든, 애시, ㅍㅌㅊ, ㅂㄹ, 썩, 당초, 참신했는데, 으음, 저냥, 개인적으로, 논외로, 일단, 애초에, 어떻든, 머, 차치하, 괜찮았다, 볼만, 낫배드, 부족하지만, 물론, 뭥미, 어찌되었든, 그럭, 망했지만, 자체는, 애매하다, 어땠, 괜찮았는데, 그냥, 못미치지만, 못느, 모르겠으나, 모르겠고, 나름대로, 부족하다, 그정도, 이작품, 별5개, 괜츈, 기본적으로, 그렇지, 거기까지, 괜찮았지만, 그뿐이, 좋으나, 무교인, 당연히, 별거없, 볼만하다, 나쁘, 괜찬, 면에선, 몰라도, 확실히, 다좋, 정작, 나름, 반댈세, 쫌, 못미친, 무난했다, 그랬다, 진부했다, 나한텐, 알겠지만, 극찬


아아

으아, 아아아아, 아아아, 아아아아아아아, 아아아아아, 아, 아악, ㅏㅏ, 아ㅏㅏ, ㅏㅏㅏ, 하, 아아아아아아, 으어어, 하아, 우우우, 앜, 와아아, 앙, ㅁ, 우어어, 오, 으으, 으, ㅜㅠ, 으윽, 으악, 시벌, 흐, 아유, 하하하하하하, ㅠㅠ, 오오, 시팔, ㅜㅜ, Aㅏ, 으앙, 우어, ㅅㅂ, ㅠㅜ, 우오, 흑흑, 오오오오오, 시바, 아놔, 핳, 젠장, 흐엉, 꺅, 씨발, ㅏ, 엉, 으어, ㅜ, ㅁㅊ, 어휴, 아오, 우우, 어어어어, ㅠ, 어어, 아앙, 씨바, 어어어, 우와, 하악, 맙소사, 오오오오, 우아, 내사랑, 우오오, 잉, 크아, 오오오, ㅅ, 8ㅅ8, 하악하악, 어우, 하앍, 띠리, 쨔응, ㅗ, 이이이, 개좋, ㅆㅂ, ㅆ, 오마이, 응, ㅡ, 지져스, 호우, 꺄, ㅂ, 다아, 와아, 쏘리, 썅, 앗, 캬, 헐, 여신님

Comment  Read more