▲ 언어정보연구원 소속 연구원들이 사전 편찬을 위한 회의를 하고 있다. /사진 조진옥 기자 gyojujinox@yonsei.ac.kr

‘말뭉치'라는 단어를 아는가? 사고뭉치도 아니고 말뭉치라니. 일반인들에게는 생소한 이 단어는 국어학을 전공하는 사람들에게는 없어서는 안 될 개념이다. 1980년대 후반 국내에 컴퓨터를 이용한 언어연구가 도입되고, 그 대상이 되는 텍스트들의 집합인 ‘코퍼스(corpus)’ 역시 필요했다. 당시  이 용어를 이상섭 명예교수(우리대학교·영시/비평)는 ‘말뭉캄라는 용어로, 고려대에서는 ‘말모둠’이라고 번역해 사용했다. 하지만 현재 국어학에서는 ‘말뭉캄라는 용어가 자리를 잡았고, ‘말뭉치언어학’이라는 전공분야까지 생겨나게 됐다.


지난 1986년 문과대 교수들은 한국어의 모든 것을 과학적으로 처리해 담은 『한국어 큰 사전』을 편찬할 것을 제안했고, 2년 뒤 사전 편찬을 위한 연구소가 태어났다. 바로 현재 ‘언어정보연구원’의 전신인 ‘한국어사전 편찬실’이다. 한국어사전 편찬실에서는 위에서 말한 바로 그 말뭉치를 이용해 사전 편찬 작업에 착수한다. 당시 연구원으로 참여했던 유현경 교수(문과대·국어학)는 “연구관 지하 작은 연구실에서 기증 받은 컴퓨터 몇 대만 갖고 사전 편찬을 위해 말뭉치를 구축하는 작업을 했다”며 당시 열악했던 환경을 회상했다. 사전 편찬의 방법론인 과학적 처리는 국어학에 있어 다양한 프로그램이 필요했지만 당시에는 국어학과 전산학(오늘날의 정보학)을 함께 전공하는 사람이 없어 새로운 프로그램을 만드는 데 많은 어려움을 겪었다고 한다. 유 교수는 “전산학 전공자들과 함께 일을 하기도 했지만 각기 다른 전공으로인해 유기적인 연구가 이뤄지지 못했다”고 전했다. 하지만 국어학에 있어서도 전산학이 필요했기에 당시 몇몇의 교수들이 독학으로 전산학을 공부해 현재는 2세대 연구가 이뤄지고 있다.

국어학과 정보학. 어울릴 것 같지 않은 두 분야의 학문이 만나 처음으로 탄생된 가시적 결과물이 바로 지난 1998년에 편찬된 『연세 한국어사전』이다. 이 사전은 언어정보연구원의 현재 목표인 『연세 현대한국어대사전』을 만들기 위한 중간 단계의 사전이다. 이 사전의 가장 큰 장점은 내용의 충실함 보다는 단순히 등재 단어의 수에 중점을 둔 기존의 사전과는 달리 우리들이 일상생활에서 주로 사용하는 단어 5만개를 말뭉치에서 선정해 그 의미와 함께 수많은 용례를 수록했다는 것이다. 유 교수는 “사전은 한 언어를 쓰는 집단의 문화를 집대성해놓은 공간”이라며 “이 사전 역시 수많은 용례를 통해 한국어를 사용하는 주체들이 한국문화의 창조자라는 긍지를 가질 수 있다”고 그 의의를 전했다.

현재 언어정보연구원은 사전편찬실이 확대·개편된 <사전 연구센터>, <언어정보 연구센터>, <전문용어 연구센터>, <외국어로서의 한국어교육 연구센터>, <지명 및 역사자료 연구센터>, <음성분석 연구센터>, <정보기술 연구센터> 등 7개의 산하 센터가 있다. 초창기 열악했던 환경에 비하면 엄청나게 확대된 것이다. 사전 연구센터는 언어정보연구원의 중심사업인 『연세 현대한국어대사전』 편찬 프로젝트를 수행 중에 있다. 그리고 언어정보 연구센터 역시 사전편찬 연구센터와 더불어 말뭉치 구축 사업에서 중심적인 역할을 담당하고 있다. 또한 외국어로서의 한국어교육 연구센터는 세계화 시대 한국어의 해외 보급을 큰 목적으로 『외국인을 위한 한국어 학습 사전』 개발 등 여러 활동을 하고 있다. 그 외에도 각각의 센터에서는 활발한 연구를 진행하고 있다.

외솔 최현배 선생이 국어 연구에 큰 획을 그었듯 언어정보연구원 역시 한국어 발전에 큰 역할을 하고 있다. 출판사의 편집이라는 차원에서 사전학을 학문적인 측면으로 끌어올리고, 국어정보학이라는 분야를 최초로 연구하고 발전시켰다는 점은 이루 말할 수 없이 값지다. ‘국어 운동의 요람이자 국학 연구의 중심’인 우리대학교. 언어정보연구원은 바로 그 맥을 잇는 중심에 서 있다.

저작권자 © 연세춘추 무단전재 및 재배포 금지