챗-GPT 자동 번역기

2023. 3. 18. 12:58챗-GPT 사용하기

반응형

챗-GPT에서 자동번역기를 사용하는 이유

사용자가 인공지능(Artifical Intelligence: AI)인 챗봇인 GPT(Generative Pre-trained Transformer)에게 대화 방식으로 필요한 사항을 질문하고, 코드를 생성하고, 특정 주제에 대한 설명을 요청하고, 원고를 작성하는 등의 상호작용을 할 수 있는 것은, 챗-GPT가  대규모 언어 모델(Large Language Model: LLM)에 기반한 애플리케이션이기 때문입니다.

대규모 언어 모델의 유형

- 텍스트 생성(Text generation)
- 감성 분석(Sentiment analysis)
- 비정형 데이터에서 가치 있는 인사이트 생성(Generating valuable insights from unstructured data)
- 콘텐츠 제작(Content creation)
- 독해, 요약, 분류(Reading comprehension, summarization, classification)
- 기계 번역(Machine translation)
- 질문 답변(Question answering)

 

즉, 사용자 요청 사항의 응답을 생성하기 위해서 GPT는, 대규모 언어 데이터를 딥러닝(Deep Learning)하여 텍스트나 이미지, 사운드 등의 데이터를 인식하고 분석하고 예측하여 가장 확률이 높은 단어의 연속적 배열생성하는 것입니다. 이러한 측면에서 챗-GPT는 인터넷에서 우리가 필요한 정보를 검색하여 결과를 얻는 기능보다는 "꿈, 생각, 아이디어를 눈앞의 텍스트로 구현"(OpenAI, 2023) 하기 위한 예측과 생성의 딥러닝 알고리즘이라는 점에 주목할 필요가 있습니다. 

대규모 언어 모델에 기반한 GPT의 경우, 소위 훈련된 언어 데이터 세트에서 출발하는데 다양한 데이터로 가득 차 있는 인터넷으로 훈련한 언어모델을 재인코딩하거나 재학습시키지 않을 경우, 무의미하거나 편향되거나 오류가 있는 응답을 할 수 있습니다. 이러한 측면에서 OpenAI는 GPT-4를 소개하면서 "인공지능은 완벽하지 않습니다. 실수를 할 수 있기 때문에 작업이 사용자의 기대 수준에 맞게 이루어지고 있는지 확인"(OpenAI, 2023) 해야 한다고 언급한 바 있습니다. 

챗-GPT에서 자동번역기, 즉 사용자가 한국어로 텍스트를 입력하지만 이를 영어로 GPT가 인식하게 하는 확장 프로그램을 설치하는 여러 이유 중 하나가 바로 챗-GPT가  대규모 언어 모델에 기반하고 있기 때문입니다. 즉, 현재까지는 영어로 입력된 프롬프트에 대한 챗-GPT의 생성 결과가 한국어로 입력했을 때보다 신속하고 정확하기 때문에 번역 확장 프로그램의 필요성이 있어 보입니다. 그러나, 추후 대규모 언어 모델에서 한국어에 대한 지도 학습이 강화되거나, 국내 기업에서 한국어 기반 언어 모델로 GPT와 유사한 생성형 AI를 개발할 경우에는, 이러한 문제는 점차 감소할 것으로 예상합니다. 


챗-GPT 자동번역기 종류 및 설치

챗-GPT를 지원하는 다양한 확장 프로그램 중에서 자동번역기능 애플리케이션 역시 여러 개가 있지만, 구글 Chrome 웹 스토에서 '프로프트 지니' 또는  'GPT FOR TRANSLATE'를 입력하여 검색하면 아래와 같은 그림의 확장 프로그램이 나타나고 설치하면 됩니다. 

 

쳇-GPT 자동 번역 확장 프로그램. 구글 웹 스토어

 

이후, 챗-GPT에 접속하면 아래의 그림에서 확인할 수 있는 것처럼, GPT 메일 화면 화단의 프롬프트 입력란에 '프롬프트 지니'가 설치됨을 알 수 있는 문구가 생성되어 있는 것을 볼 수 있습니다.  설치 이후, 챗-GPT에 한글로 한 번 그리고 영어로 한 번 질문하시면 GPT 자동번역기의 기능을 손쉽게 확인하실 수 있을 겁니다. 

자동번역 확장 프로그램 프롬프트 지니를 설치하였을 경우 ChatGPT의 초기 화면창

 


챗-GPT 자동번역기 사용 시 불편한 점

챗-GPT에 자동 번역 확장 프로그램을 설치할 경우, 한국어로 질문이나 요구사항을 입력하지만 챗-GPT가 영어로 인식하고 결과를 출력하고 다시 해당 경과를 한국어로 번역되어 나타난다는 점에서, 현시점에서는 편리한 점이 분명 있습니다. 특히, 대규모 언어 모델은 미세 조정 또는 프롬프트 조정과 같은 기술을 통해 특정 사용 사례에 맞게 사용자 지정하여 최적의 결과를 도출할 때, 영어 구사 능력에 따른 챗-GPT 생성 결과 수준의 한계를 극복하는데 유용한 측면이 있습니다. 

그러나, 실제 자동번역 확장 프로그램(예, 지니 프롬프트)을 설치하여 사용할 경우, 다음과 같은 불편함이 있습니다.  

  1.  챗-GPT에 질문을 할 경우, 해당 질문이 화면 오르쪽에 순서대로 기록되는데 자동 번역 확장 프로그램을 사용할 경우 'New chat'으로 반복적으로 기록되어, 사용자 스스로가 질문 내용을 파악하는 것이 쉽지 않은 문제가 있습니다. 이러한 불편함 역시 개선될 것으로 보이지만, 챗-GPT에서 순차적, 연속적 질문을 통해 최적화된 결과를 가져오기 위해 선행 질문이 무엇인지 쉽게 확인할 수 없는 것은 챗-GPT 사용 수준에 따라 불편함의 체감 수준이 다를 것으로 생각합니다. 
  2. 자동 번역 확장 프로그램을 사용할 경우, ①한글 질문 입력, ②질문 영어 번역, ③영어 답변, ④답변 한글 번역의 4개의 결과물이 산출됩니다. 이러한 점은 질문의 유형이나 내용에 따라 차이가 있겠지만, 하나의 질문에 대한 답변 결과가 화면상에 차지하는 비중이 그만큼 높다는 점에서 시각적 불편함과 함께 <1>에서 언급한 것처럼 사용자의 이전 질문 내용과 답변을 쉽게 확인하는데 약간의 방해 요인이 되는 것 같습니다.  

물론, 영어 학습을 위한 목적으로 챗-GPT를 활용할 경우, 자동 번역 확장 프로그램은 더욱 그 유용성이 높아지지만 위에서 제시한 불편함과 함께, 챗-GPT와의 대화 결과물을 다운로드 받아 출력할 때도 출력물의 양이 2배가 되거나 별도의 편집을 해야 하는 불편함이 발생할 수도 있습니다.  

 


[참고 사항]

챗-GPT와 같은 대규모 언어 모델은 지도 학습(supervised learning)의 과정을 통해 AI를 학습시키는데, 그 요약적 과정은 다음과 같습니다. 

  1. 먼저, 새로운 입력(프롬프트)이 주어졌을 때, 출력 생성물을 예측하기 위해 언어 모델에 대규모 텍스트 입력 세트와 해당 출력이 언어 모델에 구축합니다. 
  2. 사용하는 언어 모델은 최적화 알고리즘을 적용하여 매개변수들을 조정하면서 언어 모델의 알고리즘과 기계학습을 통해 예측과 실제 출력 사이의 불일치를 최소화합니다. 
  3. 이후, 추가적으로 작은 단위의 훈련 데이터가 언어 모델에 제시됩니다. 
  4. 사용하는 언어 모델은 반복적으로 예측 결과들을 배열하고 결과 값에서 발견된 오류를 확인하고 학습하여 매개변수를 변경합니다. 
  5. <1>~<4>의 과정을 여러 번 반복하여 언어 모델이 데이터의 관계와 패턴을 지속적, 반복적 학습을 수행하도록 합니다.

대규모 언어 모델의 지도 학습의 요약적 과정의 보다 상세한 설명은 아래의 동영상에서 확인할 수 있습니다. 

Nvidia(2021). Developing State-Of-The-Art Conversational AI Models in Three Lines Of Code. Youtube: NVIDIA Develper Channel 

 

'챗-GPT 사용하기' 카테고리의 다른 글

Google과 Youtube에서 ChatGPT 함께 사용하기  (0) 2023.03.19