챗GPT를 둘러싼 오해와 진실들, 그리고 올바른 이해에 대하여

■ 책을 말하다_ 『챗GPT, 이미 온 미래』 (이재성 지음, 마이북하우스, 324쪽, 2023.08)

대형언어모델을 채팅에 맞게 특화시킨 챗GPT는 출시 이후 큰 주목을 받고 있으며, 관련 저술 활동도 활발히 이뤄지고 있다. 그렇지만 기존 챗GPT 관련 서적들은 챗GPT의 활용방법을 소개하거나 기술적 이슈에 집중하는 경우가 대부분이었다. 이 책은 챗GPT에 대한 단순 활용방법과 이슈 집중을 넘어 챗GPT의 작동 원리에 대한 심층적인 분석을 비전공자의 눈높이에 맞춰 소개하는 책이다.

1장에서는 챗GPT가 네이버와 같은 정보검색 시스템과 무엇이 다른지를 설명하는 것으로 시작한다. 챗GPT는 기본적으로 채팅을 하기 위해 고안된 인공지능이다. 다른 무엇보다도 질의응답이나 대화에 특화되어 있다. ‘고작 질의응답이 뭐길래?’라고 생각할 수도 있지만, 우리의 일상 활동 대부분이 언어를 통해서 이루어진다는 것을 생각해보면 챗GPT의 가능성이 무궁무진함을 알 수 있다. 의료나 교육, 금융 등 분야를 가리지 않고 막힘없이 대답해줄 수 있는 인공지능 비서가 항상 곁에 있다면 어떨까? 생각만 해도 든든하지 않을까?

지금까지 정보 검색 서비스를 이용하며 원하는 검색 결과를 얻을 수 있는 키워드가 무엇인지 몰라서 몇 날 며칠 골머리를 앓았던 경험이 있으신 분들이 적지 않을 것 같다. 결국 시스템을 잘 쓰려면 원하는 정보를 얻기 위해 어떤 키워드를 넣어야 하는지 충분한 경험이 있어야 한다. 늘 보고서를 작성해야 하는 전문가들은 정보 검색에 대한 경험이 많으니 큰 문제가 아닐 수 있지만 일반인들은 정보 검색 시스템을 활용해본 경험이 상대적으로 적을 수 밖에 없다. 결국 현존하는 정보 검색 시스템은 비전문가에게 꽤 박한 시스템이라고 볼 수 있다.

그런데 챗GPT를 사용하면 이런 문제를 쉽게 풀어나갈 수 있다. 우선 사용자가 찾고 싶은 정보가 있을 때 키워드를 몰라도 괜찮다. 내가 쓰는 일상 언어로 찾고 싶은 정보를 설명하면 챗GPT가 빠르게 답변을 주는 것이다, 운이 좋다면 원하는 정보가 바로 포함되어 있을지도 모른다. 한 번에 찾지 못해도 괜찮다. 챗GPT는 사용자와 나눈 대화를 기억하고 있다가 그 문맥을 유지하면서 답변을 해나가는 특징을 가지고 있기 때문이다. 즉, 대화를 하면서 점점 더 사용자가 원하는 정보에 다가갈 수 있다. 다시 말해서 정보 검색 과정에서 대화가 가지는 이점을 그대로 살릴 수 있는 것이다.

챗GPT는 ‘질문과 답변’의 개념을 이해하거나 구분하지 않는다. 계속해서 단어조합을 통해 문장들을 만들어나가는 것에 불과하다. 사용자가 어떤 문장을 입력하면, 입력된 문장 뒤에 어떤 단어조합이 들어가는 것이 어색하지 않을지 계속 가늠하는 것이다. 설명 중에 비약과 누락이 많긴 하지만 이것이 챗GPT의 핵심 동작 원리 중 하나다. 결론적으로 챗GPT는 사용자와 실시간으로 이어 말하기를 한다고 봐도 무방하다. 이러한 내용을 통해 저자는 챗GPT를 둘러싼 잘못된 이해를 해소하고자 노력한다.

2장에서는 챗GPT에 대한 깊은 이해를 원하는 독자들을 위해 챗GPT가 만들어지게 된 절차를 간략히 소개한다. 우선 챗GPT는 답변을 만들기 위해 제작자가 미리 만들어둔 일종의 매뉴얼이 있는데, 그 과정을 최대한 쉽게 풀어 설명하는 것이다. 먼저 사용자가 질문을 입력하면 챗GPT는 자기가 가진 단어장에서 사용자의 질문에 포함된 단어들과 자주 같이 사용되었던 단어들의 우선순위를 높인다. 이 단어장에 있는 단어들을 이용해서 답변을 생성하는데, 대개 우선순위가 높은 단어들을 이어붙이는 방식이다. 이 매뉴얼은 사용자가 어떤 질문을 하였건 예외 없이 동일하게 적용되는데, 사용자의 질문에 따라 달라진 단어장을 이용하여 이어 붙이기를 하니 질문에 맞는 답변이 그때그때 생성되는 것이다.

이 설명은 비약을 감수하고 챗GPT의 동작원리를 일반인들에게 친숙한 형태로 설명을 한 것이다. 이 설명은 정확한 설명이 아니기 때문에 전공자를 위해 챗GPT를 개발하기 위한 3단계를 2장에서 자세히 설명하고 있다. 챗GPT를 개발하기 위한 첫 단계는 비지도학습을 통해 만든 거대언어모형인 GPT를 채팅에 맞게 미세조정을 하는 것이다. 이를 통해 챗GPT가 어느 정도 사람이 수행하는 질의응답과 유사한 형태로 말을 이어나갈 수 있게 된다. 그렇지만 이 질의응답이 조금 어색할 수 있는데 이를 보완해주기 위해 보상 모형을 만든다. 마지막으로 이렇게 만들어진 보상 모형을 바탕으로 강화학습을 하여 GPT가 만들어낼 수 있는 여러 가지 가능한 응답 중에서 가장 대화에 적합한 것이 무엇인지 선택할 수 있도록 한다.

4장에서는 챗GPT가 가져올 미래와 현재 기업들의 대응 방법에 대해 소개한다. 챗GPT를 일반적인 기업이 도입한다면 어떤 형태가 될까? 우선 기업이 보유하고 있는 자산을 외부에 공개하는 건 대단히 어렵다는 것을 고려해야 한다. 오히려 산업 스파이로부터 적극적으로 보호해도 부족한데, 외부 공개는 어불성설일 것이다. 여기서 말하는 자산에는 건물이나 가구 같은 유형물뿐만 아니라 기업 내부에서 만들어낸 문서나 기술들과 같은 무형물도 모두 포함된다. 혹시라도 산업 스파이들도 접근할 수 있는 공개된 챗GPT에서 자산이 유출되기라도 하면 큰일이 아닐 수 없다. 이런 조건에서 기업이 챗GPT를 도입한다면 아마 외부로 노출되어 있지 않은 폐쇄적인 형태가 될 가능성이 크다. 기업마다 자신들의 자산을 활용하여 학습을 시킨 고유한 챗GPT를 기업 내부에서 폐쇄된 형태로 활용하리라 예상된다.

에필로그에서는 챗GPT에 대한 저자와 인공지능과는 거리가 먼 부모님과의 대화를 통해 책을 마무리하고 있다. 보통 인공지능이라고 하면 많은 사람이 아주 완벽하고 절대 틀리지 않으리라 생각하고 있는데, 뉴스를 볼 때마다 챗GPT가 틀린 말을 한다는 내용이 나오는 이유가 뭐냐는 어머니의 질문을 받고 깜짝 놀라는 일화를 소개한다. 저자가 깜짝 놀란 이유는 대부분의 인공지능 전문가들은 인공지능이 ‘절대 틀리지 않는 답’을 준다고 생각하지는 않기 때문이다. 오히려 ‘조금 틀려도 괜찮으니 현실에서 그럭저럭 써먹을 수 있는 답’을 만드는 것이 인공지능의 주요 목표라고 보통 생각한다.

그런 관점에서 챗GPT가 힘을 발휘할 수 있는 영역도 대충 가늠할 수 있다. 반드시 정답일 필요가 없는 소설이나 주어진 문서를 요약하는 작업이 그럴 것이다. 우리가 어떤 글을 요약할 때 요약문을 반드시 어떤 형태로 작성하라는 지침은 없다. 음악 같은 경우에도 어떤 특정한 형태로 만들어져야 한다는 법이 없으니 이런 분야에서 챗GPT를 활용한다면 생산성을 높이는 훌륭한 도구가 될 수 있을 것이다.

인공지능은 ‘적당히 쓸만한’ 결과물을 만들 때 아주 능숙하다. 그런데 그것들 모두가 쓸 만한 결과물은 아니라는 것이다. 그렇다면 인간의 역할은 인공지능이 만들어 낸 수없이 많은 결과물 중에서 어떤 것이 좋을지 최종적으로 선택할 수 있어야 할 것 같다. 즉, 진흙 속에서 진주를 골라내는 능력을 키워야 할 것이다. 그렇게 함으로써 챗GPT에게 부려지는 사람이 아니라 챗GPT를 부리는 사람이 되길 소망한다. 아무쪼록 이 책을 통해 챗GPT를 바로 알고 바로 쓰는데 도움이 되길 희망한다.

이재성 중앙대·인공지능

중앙대학교 AI학과 교수. 중앙대 대학원 컴퓨터공학과에서 인공지능 전공으로 석·박사 학위를 받았으며, 동 대학 AI학과 학과장, 다빈치AI공동연구소 소장으로 재직 중이다. 국내 AI 분야를 이끌어가는 다양한 기업과 기술 교류를 하면서, 국제 저명 학술지에 현재까지 약 50여 편의 논문을 게재했다. 중앙대학교 AI대학원지원사업에 참여하여 AI 관련 교육과 연구를 활발히 수행 중이다. 최근 〈챗GPT, 이미 온 미래〉를 저술하는 등 인공지능 기술에 대한 대중의 이해를 돕기 위해 여러 방면으로 노력하고 있다.

이재성 중앙대·인공지능 다른기사 보기