UPDATED. 2021-10-19 17:39 (화)
창원대 교원창업 벤처기업 ‘Data.ly(데이터리)’ 문체부 국립국어원 ‘개체명 분석’ 사업 최종 선정
창원대 교원창업 벤처기업 ‘Data.ly(데이터리)’ 문체부 국립국어원 ‘개체명 분석’ 사업 최종 선정
  • 하영 기자
  • 승인 2021.08.26 16:46
  • 댓글 0
이 기사를 공유합니다

 창원대학교(총장 이호영) 컴퓨터공학과는 교원창업 벤처기업인 ‘Data.ly(데이터리, 대표 차정원 창원대학교 컴퓨터공학과 교수)’가 문화체육관광부 국립국어원의 ‘2021년 국립국어원 개체명 분석 및 개체 연결 말뭉치 연구 분석 사업’에 최종 선정됐다고 26일 밝혔다. ‘개체명 사업’은 주관기관 데이터리와 참여기관인 한림대학교의 협업으로 진행되며, 올해 총 6억400만 원을 지원받아 수행하게 된다. 

‘2021년 국립국어원 개체명 분석 및 개체 연결 말뭉치 연구 분석 사업’에 최종 선정된 교원창업 벤처기업인 ‘Data.ly 

 해당 사업에 최종선정된 데이터리는 인공지능 분야의 딥러닝 학습에 필요한 데이터를 생성, 관리, 가공, 보급하는 전문기업으로 자연어 처리 분야에 강점을 두고 있는 기업이다. 2019년부터 3년간 국립국어원 개체명 구축 및 분석 사업에 주관기관으로 참여한 경험을 바탕으로 개발한 고성능의 도구와 프로세스를 이용해 과제의 진행 및 총괄 관리를 맡는다.

 이 사업은 빅데이터 활용 및 인공지능 학습에 필요한 국어 자원을 구축하고, 그 과정에서 국내 표준화 및 참조, 평가 기반이 될 수 있는 자료들을 생성해 배포함으로써 공공의 이익에 이바지하는 데 목적을 둔다. 개체명 분석 데이터는 자연어 처리 데이터 중 가장 활용도가 높은 데이터로, 구축된 대용량 개체명 말뭉치는 실제 기업이나 연구소에서 인공지능 산업 연구 및 개발을 위해 다용도로 사용될 예정이다. 특히 민간에서도 쉽게 활용이 가능한 고품질의 개체명 지침 및 사전 수립 작업으로까지 이어질 전망이다.

 개체명 데이터 구축 작업과 동시에 국립국어원과의 연계를 통해 개체명 분류체계를 세분화하고, 모호한 경계의 개체명 분석에 대한 문제점을 해결해 지침과 개체명 데이터에 대한 완성도 및 신뢰성을 확보했다. 또한 전년도 국립국어원 개체명 사업을 통해 지침 수정 및 평가 말뭉치 구축을 전담한 한림대학교 언어학 전문가들의 참여를 통해 언어학적 지식을 지닌 전문가들이 웹 언어의 특성을 분석하고, 구축 시 발생할 수 있는 실제적인 사항들을 고려해 관련 예제들을 지침에 추가하고 분류를 세분화했다. 이 같은 작업을 통해 지침의 정확성과 명확성을 높여 앞으로 개체명 관련 연구에 한 기준이 될 지침이 완성될 수 있도록 연구를 진행 중이다.

 데이터리 차정원 대표는 “이번 국립국어원 개체명 사업을 통해 4차 산업혁명을 대비하는 인공지능 기술 개발과 활용을 위한 대규모 말뭉치 분석과 활용으로 국어 자원 활용도와 가치 제고가 이뤄질 것”이라고 설명했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.