“국제 공동연구로 연구 탁월성 견인”

2025~2021 “국제 공동연구로 연구 탁월성 견인”

작성일 2024-01-31


영어영문학과 김종복 교수가 ‘2023년 교육부 학술·연구지원사업 우수성과’ 50선에 선정됐다. 김 교수는 영어 유사공백에 대한 직접해석적 분석 연구를 수행했다.


영어영문학과 김종복·미디어학과 최수진 교수 ‘교육부 학술·연구지원사업 우수성과’ 선정
김종복 교수, ‘영어 유사공백에 대한 직접해석적 분석’ 연구 수행


교육부가 최근 ‘2023년 교육부 학술·연구지원사업 우수성과’ 50선을 선정해 발표했다. 창의적 지식 창출 견인과 균형 있는 학문 생태계 조성을 위해 2022년 한 해 동안 인문사회, 이공, 한국학 등 분야별로 21개 사업에 총 9,104억 원을 지원했다. 사업의 지원을 받은 13,600여 개의 과제 중 공모와 추천으로 179건의 후보 과제를 접수해 3단계 평가를 진행했다. 그 결과 인문사회 26선, 이공 20선, 한국학 4선 등 총 50선을 우수성과로 선정했다. 영어영문학과 김종복 교수가 인문 분야에, 미디어학과 최수진 교수가 사회 분야에 선정됐다. 김종복 교수를 만나 선정 성과와 소감 등을 들었다.<편집자 주>


김종복 교수는 2017년부터 2020년까지 3년간 글로벌연구네트워크 사업의 지원으로 연구를 수행했다. 영어를 비롯한 여러 언어에서 빈번하게 발견되는 생략과 같은 불완전 문장이 어떻게 만들어지고, 우리가 그것을 어떻게 인지하는지에 관한 연구였다.


“그동안 쌓아온 국제화 연구의 성과”


Q. 교육부 학술·연구지원사업 우수성과는 국가가 인정한 우수 연구라는 의미다. 선정 소감을 밝힌다면?


해당 연구는 한국연구재단이 대학 연구 국제교류 강화의 일환으로 지원한 글로벌연구네트워크(Global Research Network) 사업으로 진행했다. ‘침묵구문 처리에 관한 이론적, 실험적 연구’라는 과제였는데, 2017년부터 2020년까지 3년간 진행했던 연구로 결과가 지난해 출간됐다. 이 연구과제의 주요 목표는 영어와 여러 언어 사용에서 빈번히 발견되는 ‘생략(ellipsis)’을 포함한 불완전 문장이 어떻게 만들어지고 인지하는지를 언어학적 빅데이터를 통해 살펴보고 규명하는 것이다. 즉 발화되지 않는 공백 속의 표현을 우리가 어떻게 인지하는지 살펴보는 글로벌 연구과제다. 이 과제에는 미국 로체스터(Rochester)대학교 제프리 러너(Jeffrey Runner) 교수가 공동 연구자로 참여했고, 프랑스와 스웨덴 학자들도 참여했다. 다국적 연구자들이 참여했던 이번 과제로 여러 결과물을 출판했는데, 이번에 수상한 연구 결과물은 그중 하나이다. 국제화 연구의 좋은 결실이라 생각한다.


Q. 우수성과인 ‘영어 유사공백(pseudogapping)에 대한 직접해석적 분석’에 대해 설명 부탁드린다.


이 연구 과제의 성과는 ‘Pseudongapping in English: A direct interpretation approach’라는 제목의 논문으로 언어학 분야의 저명 국제지(A&HCI)인 <The Linguistic Review>라는 저널에 게재됐다. 예를 들어 ‘I could no sooner do without music than I could oxygen’에서처럼 일상생활에서 빈번하게 나타나는 영어 생략현상(elliptical phenomena)의 하나인 ‘유사공백(pseudogapping)’에 관한 연구다. 말뭉치(corpus) 자료를 활용한 경험적 연구와 함께 이를 활용해 이론적으로 분석했다. 이 연구에서는 유사공백과 친족생략구문인 동사구 생략(VP-ellipsis)과 공백(gapping) 간의 문법적 공통점과 차이점을 파악하고, 유사공백 허가(licensing)에 대한 올바른 분석을 제시하려 했다. 논문에서는 구문문법적 분석을 제시했다.


분석 결과를 이야기하자면, 유사공백과 동사구 생략 간의 문법적 공통점은 두 구문의 상위구문(macro-construction)인 생략 구문의 구문적 속성을 상속하기 때문이었다. 차이점은 생략구문의 하위구문(micro-construction)으로서 각자 고유한 구문적 특성 때문에 기인한다고 여겨진다. 연구에서는 생략된 요소의 의미를 도출하기 위해 구조화된 담화 구조를 활용한 담화기반 분석을 제공해, 문법정보 간 상호작용의 중요성을 제시했다.


연구는 국제화 연구라는 점과 빅데이터 기반의 언어학 연구였다는 점이 특징이었다. 김종복 교수는 “언어 빅데이터 자료 기반에 바탕을 두고 있어 빅데이터를 이용한 경험적 연구의 롤모델이 된다면 좋겠다”라고 밝혔다.


빅데이터 기반 언어학 연구, 글로벌 과제 통해 국제화 연구 기반 쌓아


Q. 연구의 특성은 무엇인가?


이 연구와 같이 경험적 연구를 토대로 한 구문 기반 분석은 기존의 이동 및 생략(movement & deletion) 분석과 기저생성(base-generation) 분석이 설명하지 못하는 유사공백구문의 다양한 문법적 속성을 체계적으로 설명한다는 점이다. 구문 간의 상속 네트워크(inheritance network)를 통해 유사공백과 동사구 생략뿐만 아니라 다른 다양한 생략구문 현상들 사이의 문법적 관련성도 용이하게 설명할 수 있는 분석적 틀을 마련했다.


지금까지 개별적으로 연구됐던 생략구문 현상들을 하나의 상위구문인 생략구문의 유형으로 분석해 생략구문 간의 공통점도 설명할 수 있다. 각 구문 간의 차이점은 생략구문의 하위구문으로 각자 고유한 구문적 속성을 지니고 있어 나타나는 결과라고 설명할 수 있다. 그동안 이동과 생략에 기반해 이런 구문의 생성문법적 연구가 활발히 이뤄졌다. 하지만 제약기반이론인 구문문법 관점에서는 거의 최초의 연구이다. 관련 문법 발전에 기여했다는 뿌듯함도 있다. 이번 연구는 언어 빅데이터 자료 기반에 밑바탕을 두고 있어 빅데이터를 이용한 경험적 연구의 롤모델이 된다면 좋겠다.


Q. 연구 기획의 이유는 무엇인가?


생략현상은 의사소통의 최적화(optimal) 혹은 경제성을 위해 사용된다는 점에서 언어의 본질을 이해하는 데 주요한 위치를 차지한다. 특히 생략 현상은 통사, 의미, 화용, 정보구조의 밀접한 상호 작용을 보여줄 뿐만 아니라 통사구조와 의미구조 사이의 비전형적 사상(mapping) 관계를 갖고 있다는 점에서 현대 언어학 연구에 주 관심사가 되고 있다. 본 연구에서 생략현상에 대한 빅데이터를 활용한 다양한 현상들을 연구 대상으로 삼았다. 연구를 통해 빅데이터를 활용한 언어학적 연구의 저변 확대 및 국내 인문학 연구의 국제화에 기여하고 싶었다.


국제 공동연구를 위한 글로벌 네트워크의 중요성이 강조되는 분위기가 있다. 글로벌 네트워크를 강화하려면 평소 학문적 교류를 쌓아야 한다. 해외 학술대회에서 친분을 쌓고 연구 주제에 관한 공감대도 형성해야 한다. 인문학 분야의 국제화는 제가 선정됐던 글로벌 과제가 좋은 윤활유다. 과제를 통해서도 활성화해야 한다.


글로벌 과제를 그동안 꾸준히 수행했다. 국내 인문학의 문제는 연구 자체가 국내에 한정된 것이다. 국제화를 위해서는 연구자 개인의 노력이 분명히 필요하다. 이번에 선정된 연구를 함께한 연구자들도 예전부터 알고 지낸 분들이 아니다. 학술대회에서 처음 만나, 대화를 통해 주제를 설정했다. 이 그룹들과 국제 세미나를 지속해서 진행하고 있다.


언어학 분야를 연구하는 김종복 교수는 언어학을 융합적 분야라 설명한다. 그는 “과학적 접근을 위해 수학적·과학적 사고는 필수다”라며 “언어의 현상을 빅데이터를 통해 규명하고, AI나 전산학적으로 응용·적용할 수 있도록 이론적 연구를 수행한다”라고 설명했다.


융합적 분야인 언어학, 과학적 접근 위해 수학적·과학적 사고 필수


Q. 평소 관심 있는 연구 분야는 무엇인가?


언어학을 주된 분야로 삼았다가 이후에는 이론을, 최근 10년 정도는 말뭉치와 빅데이터를 활용한 경험적 연구를 주로 하고 있다. 말뭉치는 공동 연구를 하기로 했던 브리검영대학교 마크데이비스(Mark Davis) 교수가 만든 데이터 베이스이다. 10여 년 전에는 말뭉치의 크기가 작았는데, 지금은 빅데이터가 됐다. 지금 많이 이야기하는 거대언어모델(Large Language Model, LLM)은 언어학적 빅데이터를 쉽게 이르는 말이다. 언어학적 빅데이터도 크기가 많이 변했다. 기존에는 밀리언(백만) 단위였다가 지금은 100밀리언(10억), 빌리언(1조), 트릴리언(1000조) 정도의 크기이다. 생성형 언어 모델들이 다루는 단위가 점점 커지는 추세다.


언어는 간략하게는 ‘기호(sign)의 집합체’라고 말할 수 있다. 기호는 형태와 의미의 연결고리 또는 투사(mapping) 관계로 구성돼 있다. 이런 연결고리들은 다양한 형태로 나타나는데, 이를 규명하는 연구가 주요 관심 분야다. 특히 이번 과제처럼 발화되지 않는 언어표현들의 재구성(reconstruction)이나 인지처리(resolution) 방식은 언어표현에서 형태와 의미 관계 규명을 위해 주요한 연구 분야이다. 이런 표현은 우리가 인지하는 것보다 훨씬 더 다양하고 더 빈번히 사용된다. 예를 들면 “What do you like?”라는 질문에 “Apples”라고 답하면, 질문자는 답변을 “I like apples”라고 이해한다. 완전하지 않는 문장을 완전한 형태로 이해하는 것이다.


이런 현상을 언어 빅데이터를 통해 규명하고, AI나 전산학적으로 응용 또는 적용할 수 있게 이론적으로 연구하고 있다. 언어학은 기본적으로 융합적인 분야이다. 과학적으로 접근해야 한다. 언어학 연구를 한다는 것은 수학적, 과학적 사고를 할 수밖에 없다. 빅데이터는 가장 큰 화두다. 모든 학문 분야에서 그렇다. 언어학적 연구들도 순수한 인문학보다 자연과학이 융합되는 방향으로 전개되고 있다.


교육 분야로 관심을 돌려보면, 처음에는 낯설게 느낄 수 있다. 인문학에서 정량적 방식이 왜 필요한지 이해하기 어렵다. 하지만 무언가의 실체를 파악하기 위해서는 정량적 방식이 필요하다. 시대적 흐름이 그렇다. 인문학적 사고와 과학적 사고, 지식과 분석력을 모두 가져야 한다. 이런 성향을 모두 드러내는 분야가 언어학이라고 할 수 있다.


Q. 향후 연구의 목표를 밝혀달라.


이번 과제와 연결해서 현재 스페인, 프랑스, 루마니아, 필리핀 학자들과 응답 체계(response system)에 관한 글로벌 연구를 진행하고 있다. 응답 체계는 모든 자연언어의 담화 수행에 있어서 필수적으로 나타나는 언어적 속성이다. 의사소통이 기본 목적인 언어의 본질을 이해하는 데 필수적인 연구 주제다. 응답 체계 분야의 기존 연구는 이론 측면에 편향됐었다. 이 분야의 연구에서는 영어, 한국어, 프랑스어, 타갈로그어를 포함해 유형론적 차이를 보이는 언어들에서 사용되는 다양한 응답 체계를 연구한다.


빅데이터 말뭉치 자료를 이용한 경험적 연구와 기술적 타당성을 가진 이론적 연구, 개발된 이론을 검증하는 실험적 연구를 진행하고 있다. 이러한 경험적, 실험적 연구를 수행하며 실제 언어 사용에서 필수적인 응답 체계에 대한 올바른 이해와 자연언어 본질 규명에 기여하고 싶다. 여러 좋은 결과들도 도출되고 있다.


좀 더 연구하고 싶은 분야도 있다. 단순하게 영어만이 아니라 인간이 사용하는 언어에서 나타나는 공통점과 차이점을 연구하고 싶다. 학문은 할수록 모르는 것이 더 많아진다. 연구를 지속하며 좋은 결과가 나오면 책으로도 출간하고 싶다. 생성형 언어 모델의 단점은 창의적이지 않다는 점이다. 기존의 자료를 수학적, 전산학적으로 재구성한다. 이것이 과연 인간만큼 창의적일까? 그 한계와 언어의 개별현상, 생각하는 인지 측면 등을 규명하고 싶다.



글 정민재 ddubi17@khu.ac.kr
사진 이춘한 choons@khu.ac.kr

ⓒ 경희대학교 커뮤니케이션센터 communication@khu.ac.kr