문학 텍스트를 어떻게 계량하고 분석할 것인가?
상태바
문학 텍스트를 어떻게 계량하고 분석할 것인가?
  • 황혜란 명지대·한국어교육
  • 승인 2023.06.11 13:48
  • 댓글 0
이 기사를 공유합니다

■ 저자에게 듣는다_ 『문학 텍스트의 계량적 분석과 활용』 (황혜란 지음, 커뮤니케이션북스, 132쪽, 2023.05)

 

한국어 학습과 문학 텍스트

전 세계적으로 한국어를 공부하는 사람이 폭발적으로 증가하면서 한국어가 한류의 대세가 된 시대가 도래하였다. 유창한 한국어 실력자도 쉽게 마주할 수 있게 되었지만 한국어교육 현장에서 시나 소설과 같은 문학 작품들은 여전히 잘 다루어지지 않는다. 작문이나 발표, 토론과 같은 학습자들에게 가장 시급한 과목들을 수강해야 하는 것이 현실이기 때문이다. 하지만 설명문이나 논설문 같은 논리적인 글과 함께 학습자의 배경지식을 활성화하고 창의성을 키울 수 있는 문학 작품 읽기에 대한 필요성과 요구는 꾸준히 있어 왔다.

문학 작품의 중요성에도 불구하고 문학 작품이 현장에서 잘 다루어지지 않는 것은 어려운 어휘와 문법이 많고 통사적으로 복잡하며, 작품 속의 문화 요소들을 이해하기 위한 배경지식이 부족하기 때문이다. 또한 텍스트의 길이가 길어 수업 시간에 활용하기에는 시간적 제약이 있는 것도 원인이다. 수업과 함께 확장적 읽기를 통해서도 학습자들이 문학 작품을 접하게 하는 것이 중요하다. 실제로 학습자들이 확장적 읽기를 통해 읽고 싶어 하는 것은 문학 작품의 비율이 가장 높으며, 그중에서도 소설을 가장 선호한다. 그러나 언어적 한계가 있는 한국어 학습자들은 어떤 작품을 선택해야 할지 막막해 한다. 따라서 학습자의 수준에 맞는 텍스트를 선정하고 제공해야 한다. 학습자들의 읽기 수준에 맞는 텍스트를 제공하는 것은 언어와 읽기 능력의 향상뿐만 아니라 배경지식을 활성화하여 다른 과목을 학습하는 데도 중요한 토대가 되기 때문이다. 


문학 텍스트의 이독성과 난이도

문학 작품의 수준을 판단하기 위해 이독성(易讀性, readability)을 분석할 수 있다. 이독성은 텍스트의 쉽고 어려운 정도를 판단하는 것으로 수치화하여 계량할 수 있는 양적 이독성 요인과 수치화하여 계량하기 힘든 질적 이독성 요인이 있다. 그중에서 이 책에서 다루는 것은 양적 이독성 요인이다. 양적 이독성 요인들은 공식으로 계산하여 난이도를 측정할 수 있어 많은 양의 텍스트를 빠르고 효율적으로 평가할 수 있으며, 기준이 객관적이고 명확하여 주관적이고 임의적인 판단을 배제할 수 있다. 어휘와 문법, 문장의 길이 등은 텍스트를 어렵게 하는 주요한 요인이다. 외국인 학습자의 경우 언어적 요인과 함께 문화적 요소도 중요한 이독성 요인이다. 외국인 학습자들은 문학 작품 읽기에서 고급 수준으로 갈수록 문화에 대한 배경지식 여부가 학습자들의 읽기 이해 성패를 좌우하기도 한다. 

텍스트의 이독성을 양적으로 분석하고 난이도를 측정하기 위해서 텍스트를 어떻게 계량할 것인가의 문제는 가장 기초적이고 핵심적이다. 설명문·논설문 같은 제한된 형식으로 쓰인 일반 텍스트와 달리 문학 텍스트는 구어, 사투리, 비유적 표현 등 생생하게 살아있는 언어를 보여주고 있어 수치화하여 계량하기가 어렵고 까다롭기 때문에 더 정교한 방법을 찾아야 하며, 텍스트의 난이도를 판단하는 등급의 문제도 확장하여 반영해야 한다. 


문학 텍스트의 계량적 분석

이 책은 한국어 학습자의 언어 수준에 맞춰 문학 작품을 선택하고 언어 난이도를 측정하는 방법을 제시하고 있다. 언어 난이도를 측정하는 방법으로 문학 텍스트의 어휘, 문형, 문장을 계량하고 분석하여 학습자들에게 이해 가능한 읽기 자료를 제공하는 방법을 소개하고 있으며, 문학 텍스트의 문화를 계량하는 방법, 텍스트를 수정하는 방법 등을 다루고 있다.  

1~2장에서는  언어 교육과 문학 교육의 상호관계 속에서  문학 텍스트가 언어 학습에 어떻게 기여하는지 한국문학교육의 필요성과 문학교육 모형에 대해 간략히 살피고, 학습자의 언어 수준에 맞는 문학 작품 선택의 중요성에 대해 다룬다. 텍스트의 이독성이란 무엇인지를 이해하고, 문학 텍스트를 선택할 때 고려해야 할 이독성 요인과 국내외의 이독성 공식에 대해 간략히 정리하였다. 

3~6장에서는 문학 텍스트의 어휘, 문형, 문장을 계량하고 난이도를 분석하는 방법과 어휘와 문형, 문장의 난이도를 통합적으로 반영하여 문학 텍스트의 난이도를 판단하는 방법과 절차를 제시하였다. 텍스트의 난이도를 측정하기 위해 가장 중요하고 핵심적인 일은 텍스트의 언어를 어떻게 계량할 것인가의 문제이다. 문학 텍스트는 일반 텍스트와는 달리 구어나 사투리, 비속어 등 사전에 등재되지 않은 어휘, 조사, 어미가 많고 부사나 관형사 등의 수식어도 많으며, 대화문과 서술문으로 구성되어 있어 일반 텍스트와는 달리 문장의 성분이 생략되거나 어순의 변화가 많다. 이러한 문학 텍스트의 특징을 반영할 수 있게 텍스트의 어휘와 문형, 문장의 이독성 요인을 계량하여 난이도를 부여하고, 텍스트의 이독성 요인을 통합적으로 반영하여 난이도를 분석하는 과정을 정리하였다.

7~10장에서는 소설 텍스트의 어휘를 계량적으로 분석하고 의미를 범주화하여 살펴보고, 소설과 시 텍스트의 문화 항목을 계량하는 방법과 절차를 제시하였다. 그리고 문학 텍스트를 수정하는 방법과 텍스트의 등급별 어휘의 점유율 조정을 통해 텍스트의 난이도를 조정하는 방안을 제시하였다. 문학 작품에 나타나는 문화 요소들은 작품의 수만큼이나 방대하다. 또한 하나의 작품 안에는 한국문화만 있는 것이 아니라 다양한 이문화가 등장한다. 이러한 문화 요소들을 수치화하여 계량해 내려면 각각의 어휘를 의미의 범주에 따라 묶고 의미 범주를 코드화해야 한다. 소설과 시는 같은 문학 장르지만 그 속성이 확연히 다르다. 소설은 대화체와 산문체로 구성된 서사 텍스트이고, 시는 리듬이 살아 있는 운문 텍스트이다. 동일한 문화 코드를 적용한다고 하더라도 시는 주제와 제목, 그리고 각각의 시어에 대해 별도의 문화 코드를 부여하는 방식을 적용해야 시가 지닌 비유적, 함축적 의미의 문화 요소들을 추출할 수 있다. 
 
4차 산업혁명, 기술혁명 시대를 맞이하여 텍스트를 자동적으로 분석할 수 있는 방법론들이 개발되고 있으며, 이독성 공식들도 점차 정교화 되고 있다. 앞으로 교수자는 인공지능을 대상으로 교수·학습을 설계하는 일이 주요한 일이 될지도 모르겠다. 그러나 인공지능을 학습시키는 일 역시 인간의 영역이다. 텍스트를 어떠한 방식으로 수치화하여 계량하고 분석할 수 있는지 방법을 찾는 것은 가장 핵심적이고 기초적인 작업이자 중요한 토대가 된다. 이 책에서 제시하는 것은 텍스트의 자동분석을 위한 준비 과정의 하나라고 할 수 있다. 이러한 작은 시도가 새로운 기술혁명 시대를 맞이하여 기초적 자료로 활용되기를 기대한다. 


황혜란 명지대·한국어교육

명지대학교 방목기초교육대학 객원교수. 한국학중앙연구원에서 현대문학 박사학위를 받았다. 캄보디아 왕립 프놈펜 대학교 한국학과 AKS 파견교수, 한국연구재단 인문사회학술연구교수(B)를 역임했다. 주요 논문으로  “알고 있는 표현항목의 텍스트 점유율이 한국어 읽기 이해에 미치는 영향”(2023), “텍스트 점유율 조정을 통한 소설 텍스트 수정 연구: 박태원의 「소설가 구보 씨의 일일」을 중심으로” (2022), “한국 현대시 텍스트의 문화 어휘 분석 연구-김소월 시 코퍼스를 중심으로”(2022) 등 다수가 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사