번역 도구의 정확도를 획기적으로 개선
“先週、山口と広島に行った。” 및 “先週、山際と広島に行った。”
얼마 전까지만 해도 번역 도구는 위의 두 문장을 잘 구분하여 번역하지 못했습니다. 첫 번째 문장은 “나는 지난주에 야마구치와 히로시마에 갔다.”입니다. 두 번째 문장은 “야마기와와 나는 지난주에 히로시마에 갔다.”로 번역되어야 합니다. 이제 번역 도구도 이렇게 번역합니다. 하지만 불과 3~4년 전만 해도 이전 번역 도구는 두 번째 문장을 “나는 지난주에 야마기와와 히로시마에 갔다”로 번역했습니다.
저는 구글 번역과 DeepL 이라는 다른 번역 도구를 사용합니다. 요즘은 주로 후자를 사용합니다. 예전에는 제가 직접 영어 문장을 일본어로 번역한 다음 완성된 문장을 확인하여 원래 영어 내용을 이해할 수 있는지 확인하곤 했습니다. 번역 도구의 일본어 독해 능력을 신뢰하지 않았기 때문에 일본어 문장을 영어로 번역하는 경우는 많지 않았습니다. 하지만 최근에는 일본어 문장을 영어로 번역해 본 적이 있는데, 혼자서는 생각하지 못했던 기발한 표현이 영어로 표현되어 인상적이었습니다. 초안으로서는 전혀 불만이 없습니다. 번역 도구의 정확도가 크게 향상되었습니다.
저는 “어휘, 숙어, 구문별로 번역 문장을 검색하여 최상의 번역 예문을 도출하는 알고리즘”과 “방대한 데이터 세트”로 인해 DeepL 도구를 오랫동안 사용해 왔습니다. 이러한 기반을 활용하면서 그 근간을 이루는 신경망에 많은 개선이 이루어져 현재 버전이 완성된 것으로 보입니다. AI 번역 도구로서 완성도가 매우 높다고 할 수 있습니다.
ChatGPT: 자연스러운 문장뿐만 아니라 오답도 가능합니다.
ChatGPT는 최근 가장 많이 언급되는 AI 기술 중 하나입니다. ‘채팅’은 아시다시피 인터넷에서 이루어지는 실시간 대화를 의미합니다. 예를 들어, 당사 웹사이트에 접속하면 챗봇이 화면에 나타나 당사 제품 및 서비스에 대한 질문에 대화식으로 답변합니다. “GPT”는 Generative Pre-Trained Transformer의 약자로, 미리 학습하여 스스로 새로운 문장을 생성하는 모델입니다. 흔히 제너레이티브 AI라고 불립니다. 지금까지는 위에서 언급한 챗봇과 같이 ‘이렇게 물어보면 이렇게 대답한다’는 식의 미리 정해진 패턴을 가진 AI 비서가 많았습니다. 반면 ChatGPT는 온라인에 존재하는 방대한 정보 중에서 답변에 적합한 콘텐츠를 골라 자연스러운 문장을 만들어냅니다.
예를 들어 ChatGPT가 사람이라면, 질문을 받으면 자신감 있게 모든 것을 아는 척하는 사람이 될 것입니다. 이 도구는 질문을 받으면 요청에 따라 자연스럽고 매끄러운 문장을 즉시 생성합니다. 문장을 번역하고 요약하고 컴퓨터 프로그램의 코드를 생성할 수도 있지만, 틀린 대답을 할 때도 침착하게 대답할 수 있습니다. 침착한 것은 당연하죠. 이 도구는 컴퓨터이기 때문에 마음속에서 흥분하지 않습니다. 제 지인 중 많은 사람들이 ChatGPT로 오답을 내고 그 내용을 공유하면서 놀고 있습니다. 또한 ChatGPT는 답변의 근거가 되는 자료를 제공하지 않기 때문에 저작권 침해의 위험이 있습니다.
ChatGPT는 어떻게 사용하나요?
어떤 과제가 주어지거나 질문을 받으면 짧은 시간 안에 최대한 많은 정보를 수집하여 자연스러운 문장으로 설명해 주는 채팅GPT. 최근 국회에서 질의응답의 근거로 활용할 수 있는지에 대한 논의가 있었던 것 같은데, 저는 조금 놀랐습니다. ChatGPT는 오답을 주저하지 않고 알려주기 때문입니다. 관료들의 업무를 줄이고 효과적인 토론을 위해서는 국회의원들이 스스로 조금 더 공부하는 것이 지름길이 될 것 같습니다.
대학생들이 과제를 위한 보고서를 작성할 때 매우 유용하게 사용할 수 있는 도구라고 생각합니다. 다만, 채팅GPT가 생성하는 문장에 거짓이 포함될 수 있다는 위험성을 학생들이 인지할 필요가 있습니다. 비판적인 시각으로 확인하고 그에 따라 수정하는 것이 중요합니다. 또한 입력한 문제와 지시사항이 저장되고 학습되기 때문에 개인 정보 등 공개하고 싶지 않은 정보가 유출될 위험이 있습니다. ChatGPT는 정말 매끄럽고 정확한 것처럼 보이는 문장이 만들어지고 좋은 성적으로 이어질 가능성이 높기 때문에 학생들이 사용을 중단 할 수 없습니다. 대학에서는 구술시험과 필기시험을 병행하지 않으면 학생을 평가하기 어렵습니다.
대학에 따라 ChatGPT 사용에 대한 다양한 아이디어가 아직 있습니다. 예를 들어, 케임브리지 대학교와 파리정치대학에서는 에세이 및 프레젠테이션 자료 작성에 ChatGPT를 사용하는 것을 금지하고 있습니다. 도쿄대학에서는 리포트는 학생이 직접 작성해야 하며, 생성형 AI만 사용해서는 작성할 수 없습니다.
제너레이티브 AI의 범위와 한계
이 블로그의 서두에서 번역 도구가 수년에 걸쳐 얼마나 크게 발전했는지 예를 들었습니다. 지금도 최종 번역된 텍스트는 여전히 작성자의 검수가 필요하지만, 상당 부분 그대로 사용할 수 있습니다. 제너레이티브 AI 역시 앞으로 더욱 빠른 속도로 발전할 것입니다. 그럼에도 불구하고 인간이 그 위에 서서 비판적 사고로 판단해야 하는 상황은 당분간 계속될 것이라고 생각합니다. 아무리 매끄럽고 그럴듯한 문장이 만들어져도 말이죠.
그렇다면 일본 스트라투스 테크놀로지는 제너레이티브 AI를 사용할 수 있을까요? 제안서를 작성할 수 있다고 가정하고 있습니다. 불특정 다수를 대상으로 이메일 문자를 작성할 수도 있겠죠. 하지만 기밀이나 개인 정보에 관련된 것은 사용하지 않아야 한다는 점을 고려하면 범위가 좁아 보입니다.
이 블로그는 제가 직접 작성한 것입니다. ChatGPT에서 작성했다면 톤이 좀 더 성숙하게 들렸을 수도 있습니다.