UPDATED. 2024-03-29 18:05 (금)
영어로 논문 쓰는 고충... 빅데이터와 AI로 해결한다
영어로 논문 쓰는 고충... 빅데이터와 AI로 해결한다
  • 정민기
  • 승인 2021.06.21 08:50
  • 댓글 0
이 기사를 공유합니다

영문 교정 10년 노하우 가진 ‘트링카’
사용자 특성에 맞게 끝없이 맞춤화 전략

빅데이터와 인공지능 기술을 활용한 영문 교정 서비스를 제공하는 프로그램이 늘고 있다. 이쪽 분야에서 가장 널리 알려진 회사는 미국의 벤처기업 그래멀리(Grammarly)다. 그래멀리는 맞춤법이나 문법을 고쳐주는 것은 물론이고 더 좋은 문장을 만들기 위해 명료한 표현이나 간략한 문장 구조 등을 제안하기도 한다. 모든 수정이 실시간으로 이루어지기 때문에 글을 쓰면서 수시로 확인이 가능하다.

하지만 논문과 같은 학술적 글쓰기에 그래멀리 프로그램은 적합하지 않다. 학술계에서 통상적으로 사용하는 용어나 문체를 그래멀리가 인식하지 못하기 때문이다.

지난 4월 한국에 런칭한 ‘트링카(Trinka)’는 바로 이러한 한계점을 보완한 영문 교정서비스다. 트링카는 학술·기술 분야에 특화된 AI 글쓰기 보조 프로그램으로 각 사용자의 어법이나 스타일 지침을 맞춤화할 수 있기 때문에 보다 적절한 교정을 제공한다. 또한, 어떤 저널에 논문을 투고할지 설정하면 해당 저널에 맞는 표현, 인용방식, 문체 등을 고려해 교정한다.

 

지난 15일 트링카 설립자 쉐라드 미딸(사진)를 서면으로 인터뷰했다. 설립자는 “작문 교정 서비스는 실시간이 생명”이라며 “6년 전에는 불가능했던 기술이 이제는 가능해졌다”고 했다. 오랜 시간 축적된 노하우와 전문화 전략으로 학술 글쓰기 교정 프로그램을 만든 트링카의 비결을 알아봤다.

트링카 CEO 쉐라드 미딸
트링카 CEO 쉐라드 미딸

 

△ 트링카만의 차별성은 무엇인가?
“트링카는 영어문법 교정 뿐만 아니라 학술 및 기술 작문에 특화돼 있다. 학술 작문은 일반적인 작문과 다르며 다른 유사한 프로그램은 학술 분야에 있어 잘 작동하지 않는다. 트링카는 학술분야에 특화된 AI 툴로서 학술 작문에 있어 최고의 보조 프로그램으로서의 역할을 할 수 있다. 
또한, 트링카는 저자분들의 출판 과정을 도와준다. 저널의 선택에서부터 기술 및 윤리적 적합성 등 저널의 요구사항에 부합되는지 확인해 줌으로써 저자분들의 논문이 바로 투고될 수 있도록 도와준다.”
 
사용자의 피드백으로 끊임없이 배운다

△ 그래멀리와 트링카의 차이점은 전문용어를 잘 파악한다는 것이라고 들었다. 그 비결은 무엇인가.
“트링카는 폭 넓은 학술 및 기술 분야의 전문가들이 작성한 기존 논문들을 재료 삼아 학습시킨 AI 프로그램이다. 방대한 자료를 학습한 끝에 문맥에 대한 차이점들을 이해하고 적절한 용어를 선택하는 기능을 갖추게 됐다. 이를 통해 트링카는 거대한 사전 시스템을 구축했다. 또한, 트링카는 사용자의 스타일에 지속적으로 적응하고 학습하는 맞춤형 서비스이다. 즉, 사용자는 트링카의 교정에 지속적으로 피드백을 주면서 트링카를 학습시킬 수 있다. 따라서 사용기간이 길어질수록 사용자에게 더 잘 맞는 프로그램으로 발전한다.”

△ 매끄러운 교정을 위해서는 빅데이터가 필수적이다. 트링카는 10년 간 데이터를 많이 쌓았을 것이라고 본다. 트링카의 인공지능은 얼마나 많은 양의 논문을 학습했나.
“좋은 AI 툴은 정말 많은 양의 데이터가 필요하다. 트링카는 몇 개의 주제에 걸쳐 수 백만 개의 논문을 통해 학습했다. 우리는 데이터의 양도 중요하지만 보다 좋은 툴로 학습시키는 방법적인 부분이 더 중요하다고 강하게 믿고 있다. 트링카는 편집과 출판 지원 서비스를 제공하는 글로벌 리더 회사인 이나고(Enago)의 도움을 받고 있다. 이나고(Enago)는 STEM 업계의 일류 대학, 출판사 및 연구자들에게 폭넓게 영문교정 서비스를 제공해 왔다. 우리는 이나고(Enago)의 전문 지식을 활용하고 툴을 훨씬 더 빠르고 더 잘 학습 시킬 수 있었고, 결과적으로 학술적 작문에 특화된 강력한 영문교정 AI 툴을 만들 수 있었다.”

논문 저널 마다 스타일 가이드라인을 지원한다

△ 저널마다 인용방식이나 부호 등이 다르다. 트링카는 이에 특화됐다고 들었다. 구체적인 예시를 들어 설명해줄 수 있나.
“학술지는 특정한 스타일 가이드라인을 따른다. 특정 스타일 가이드라인에서는 선호하는 특정 표현 스타일 및 기타 기술적 언어들을 설명한다.
예를 들어 “100 µL of a 25 mg/mL of MNPs were incubated with 1% buffer for 1 h at 25 °C”라는 문장을 보면, 트링카는 AMA 스타일 가이드가 측정 단위를 집단 단수 명사로 취급할 것을 권고하기 때문에 ‘were’를 ‘was’로 대체할 것을 제안한다. 이러한 기능들은 트링카에 학습되어 내장되어 있고 현재 AMA, APA, ACS, AGU 등과 같은 스타일 가이드라인을 지원하고 있다.”

△ 학술 저널은 일반적인 글보다 더 절제된 표현을 요구한다. 예를 들어 ‘I’ 를 되도록 적게 쓰는 경향이 있다. 트링카에서는 이런 경향도 반영되는가.
“학술적인 글쓰기는 간결하고, 사실적이며, 형식적인 어조를 사용하고, 능동적인 목소리를 채택하며, 복잡한 구성을 피하고, 쉽게 읽을 수 있어야 한다. 트링카는 그러한 모든 뉘앙스를 고려하고 그에 따라 제안을 제공한다. 비결은 수 년 동안 학술 및 기술 문서를 교정하면서 수집한 전문 지식과 AI 기술과의 결합에 있다고 볼 수 있다.”

△ 트링카를 처음 설립했을 때는 지금과 기술적 배경이 달랐을 것이다. 처음에 트링카는 어떻게 만들어졌고 지난 10년간 어떻게 성장했나.
“작문 교정 서비스는 ‘실시간’ 지원이 핵심이다. 실시간으로 제안을 제공하지 않으면 너무 산만하여 원활한 작문 향상에 도움을 줄 수 없기 때문이다. 6년 전에는 이러한 실시간 서비스를 구현하기에 기술적인 한계가 있었다. 지금은 기술 발전으로 실시간으로 결과를 제공할 수 있게 됐다.”

정민기 기자 bonsense@kyosu.net


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.