for textmining

한국어의 유형론적 위치

|

이번 포스팅에서는 한국어가 세계 언어 가운데 유형론적으로 어디에 위치해 있는가에 대해 살펴보도록 하겠습니다. 이번 글은 경희대 이선웅 교수님과 고려대 정연주 선생님 강의, 이화여대 최형용 교수님 저서를 참고로 했음을 먼저 밝힙니다. 그럼 시작하겠습니다.

언어 유형론

언어유형론(linguistic typology)이란 ‘공유하는 형식적 특징에 근거한 언어나 언어 성분의 분류’를 뜻합니다. 쉽게 얘기하면 비슷한 언어끼리 묶어보는 거죠. 더 나아가서는 인간의 언어가 가지는 보편적인 성격을 탐구하는 학문입니다.

이와 관련해 Greenberg(1966)는 세계 언어를 연구한 뒤 “전치사를 가진 언어에서 소유격은 거의 언제나 지배 명사를 뒤따르지만 후치사를 사용하는 언어에서 소유격은 거의 언제나 지배 명사를 앞선다” 따위의 45개나 되는 보편성을 확인했다고 밝힌 바 있습니다.

Whaley(1997)에 의하면 구강 폐쇄음을 가진 언어의 38%는 6개에서 8개의 구강 폐쇄음을 가지고 있는 것으로 나타났고 14개 이상의 구강 폐쇄음을 가진 언어는 매우 희귀한 언어 유형에 속한다는 사실을 확인했습니다.

이렇듯 유형론은 언어 사이의 공통점과 차이점, 그리고 전반에 나타나는 보편성 등을 연구하는 학문입니다.

위 그림은 각국 언어학자들이 분석해 만든 언어의 세계지도(The World Atlas of Language Structures) 가운데 일부 분석 요소를 기준으로 한 지도를 캡처한 화면입니다. 보시다시피 한국어는 주변 나라들과 뚜렷한 차이가 나는 언어라고 볼 수 있겠네요.

위 그림에서도 나타나듯 지역적으로 가까운 거리에 있다고 해서 비슷한 유형의 언어일 것이라는 가정은 오해입니다. 실제로 이러한 오해 때문에 한국어는 몽골어와 함께 알타이 어족으로 20세기 초반부터 오랫동안 묶여 있었는데요. 알타이어족으로 분류하기 어렵다는 연구성과가 속속 소개된 최근에 이르러서야 한국어가 주변국과 다른 유형의 언어인 것 아니냐는 공감대를 얻고 있습니다. 어쨌든 언어 유형을 분류하는 작업은 언어유형론의 기본 관심사 가운데 하나입니다.

고립어, 굴절어, 교착어, 포합어

세계 언어는 형태론적 유형에 따라 고립어(孤立語), 굴절어(屈折語), 교착어(膠着語), 포합어(抱合語)로 나뉩니다. 분류 기준은 크게 두 가지가 있다고 합니다.

첫째는 ‘통합’의 지표입니다. 한 단어에 얼마나 많은 형태소들을 사용하는가에 따라 언어 유형을 분류할 수 있습니다. 한 단어가 하나의 형태소로 이뤄져 있는 경우 고립어로 분류됩니다. 중국어가 대표적인 고립어입니다. 반대로 한 단어에 다수의 형태소가 있는 언어를 포합어라고 합니다.

둘째는 ‘융합’의 지표입니다. 형태소들이 얼마나 쉽게 분리되는가에 따라 굴절어와 교착어로 나뉩니다. 이상적인 고립어와 이상적인 포합어 사이에 있는 언어(=한 단어에 여러 형태소들을 사용하는 언어)들을 대상으로 따지는 기준입니다.

교착어의 경우 형태소들을 비교적 쉽게 분리할 수 있는 언어를 말합니다. 대표적인 것이 한국어입니다. 어간과 접사, 어미 사이의 경계가 상대적으로 명확합니다. ‘드시었겠다’라는 형태의 경우 ‘드-(eat)’, ‘-시-(높임)’, ‘-었-(과거)’, ‘-겠-(추측)’, ‘-다(평서/종결)’로 분석할 수 있습니다.

반면 굴절어는 형태소의 경계가 명확하지 않습니다. 굴절어인 라틴어의 경우 flora(꽃)이란 단어가 flora(주격-단수)-florae(속격-단수)-floram(대격 단수)-florarum(속격-복수)처럼 변화한다고 합니다. 굴절어에서는 이처럼 시제, 수, 성(性), 격 등 문법 정보에 대응하는 형태소를 하나씩 떼어서 분석해내기가 어렵습니다.

Bickel&Nichols(2005)는 단어당 문법 범주 수를 토대로 고립어, 굴절어, 교착어를 양적으로 분석한 바 있는데요. 예컨대 한국어의 ‘들리시었겠습니다’의 경우 이 방법에 따른 범주 숫자는 7입니다. 한국어는 아래 표 가운데 단어당 범주수가 6~7개인 언어로 분류되어 있습니다. 고립어인 영어는 2~3개, 굴절어인 러시아어는 4~5개로 분석됩니다.

구분 개체수
단어당 범주수 0~1개인 언어 5
단어당 범주수 2~3개인 언어 24
단어당 범주수 4~5개인 언어 52
단어당 범주수 6~7개인 언어 31
단어당 범주수 8~9개인 언어 24
단어당 범주수 10~11개인 언어 7
단어당 범주수 12~13개인 언어 2
145

한국어의 특성

세계 969개 언어를 조사한 Dryer(2013)는 언어의 유형을 아래와 같이 총 6개로 정리했습니다.

구분 개체수
굴절이 거의 없거나 전혀 없는 언어 141
접미사가 지배적인 언어 406
접미사를 선호하는 언어 123
접미사와 접두사가 대략 같은 언어 147
접두사를 선호하는 언어 94
접두사가 지배적인 언어 58
969

위 연구 결과를 한국어를 대상으로 따져보도록 하겠습니다. 우선 국립국어연구원(2002)이 ‘표준국어대사전’의 표제어를 분석한 결과 전체 44만594개 표제어 가운데 조사는 357개, 어미는 2526개, 접사는 656개인 것으로 조사됐습니다. 접사 656개 가운데 접두사는 200개, 접미사는 456개입니다.

조사와 어미는 물론 접사가 아닙니다만, 교착어인 한국어를 세계 다른 언어들과 비교하려면 이를 접사로 분류해야 분석의 일관성과 체계를 세울 수 있다고 합니다. 굴절어나 고립어에는 조사나 어미에 해당하는 문법범주가 존재하지 않기 때문이라고 합니다.

어쨌든 한국어에서 조사와 어미를 접미사로 분류하게 되면 한국어의 접두사와 접미사 비율은 200:3339, 즉 1:17 정도나 됩니다. 위 연구에서도 한국어를 ‘접미사가 지배적인 언어’로 분류하고 있습니다.

실제로 한국어는 어간에 조사나 어미와 같은 문법 형태소들이 차례로 결합하여 문법적인 기능을 실현하는 ‘교착어’입니다. 어간이나 명사에 여러 개의 문법 형태소가 결합돼 복합적인 문법적 기능을 실현합니다. 예컨대 ‘나는 빵을 먹는다’는 문장을 분석하면 다음과 같이 7개 형태소로 나뉩니다.

나,는,빵,을,먹,는,다

‘나(me)’라는 명사에 격조사 ‘-는’이 붙어 주어로 실현됐습니다. 마찬가지로 ‘빵(bread)’과 격조사 ‘-을’이 붙어 목적어로, ‘먹-(eat)’과 선어말어미 ‘-는-(현재)’, 문말어미 ‘-다(평서형)’가 붙어 서술어로 실현됐습니다. 한국어에서 조사/어미의 형식과 기능은 대개 이와 같이 1대1 대응됩니다.

한국어 문법 범주의 실현은 거의 문법 형태소에 의해 이뤄집니다. 아래 예시와 같이 영어 의문문을 만들 때 중요한 요소는 어순인 반면 한국어는 어미가 그 핵심입니다.

구분 평서문 의문문
한국어 철수가 방에 있다. 철수가 방에 있느냐?
영어 John is in the room. Is John in the room?

이러한 성격은 어순이 자유로운 한국어의 특징과도 밀접한 관련이 있습니다. 명사구(Noun Phrase)의 자격이 격조사 등과 같은 문법형태소로 표시되기 때문입니다. 아래 예시에서 (ㄱ)과 (ㄴ)은 같은 의미를 갖지만, (ㄷ)과 (ㄹ)은 그 의미가 완전히 다른 문장입니다.

(ㄱ) 철수가 영희를 만났다

(ㄴ) 영희를 철수가 만났다

(ㄷ) John met Mary

(ㄹ) Mary met John

다만 한국어에서 기본이 되는 어순은 주어(S), 목적어(O), 동사(V)입니다. Dryer(2013)은 전세계 1377개 언어를 대상으로 아래와 같이 조사했는데요. 이 기준에서 보면 한국어는 그렇게 별난 언어는 아닌 것 같습니다.

구분 개체수
SOV 565
SVO 488
VSO 95
VOS 25
OVS 11
OSV 4
지배적 어순이 없는 언어 189
1377

한편 Nichols&Bickel(2005)에서는 235개 세계 각 언어들이 소유격 명사구에서 어디에 소유격 ‘표지’를 나타내는지에 대해 다음과 같은 통계를 제시하고 있습니다. 소유격 명사구에서 핵은 명사입니다.

구분 개체수
핵인 명사에 표시하는 언어 77
의존어에 표시하는 언어 98
핵과 의존어에 모두 표시하는 언어 22
핵과 의존어 모두 표시하지 않는 언어 32
기타 유형의 언어 6
235

그럼 한국어를 살펴볼까요? 한번 예를 들어보겠습니다. 아래 예시에서 볼 수 있듯 한국어에서 소유격은 의존어에 표시되고 있다는 걸 알 수 있습니다.

(가) 나의 책, 그의 발, 너의 집

그럼 동사 핵은 어떨까요? Nichols&Bickel(2005)은 직접 목적어와 관련해 표지가 어디에서 실현되는지 조사했습니다.

구분 개체수
핵인 동사에 표시하는 언어 71
의존어인 목적어에 표시하는 언어 63
핵과 의존어에 모두 표시하는 언어 57
핵과 의존어 모두 표시하지 않는 언어 42
기타 유형의 언어 2
235

또 한국어 예시를 살펴보겠습니다.

(나) 철수가 책을 동생에게 주었다.

(나) 문장의 전체 핵심어 ‘주-‘는 나머지 성분을 지배하고 있습니다. 이 경우 주어 ‘철수가’, 목적어 ‘책을’, 부사어 ‘동생에게’는 의존어라고 할 수 있습니다. 그런데 자세히 살펴보면 지배 표지(가, 을, 에게)가 모두 의존어에서 실현되고 있는 점을 알 수 있습니다. 실제로 한국어는 명사 핵이든 동사 핵이든 그 표지를 일관적으로 의존어에 표시하는 언어라고 합니다.



Comments