경북도, 옛한글 식별 AI 데이터 구축
경북도, 옛한글 식별 AI 데이터 구축
  • 김상만
  • 승인 2021.06.28 21:20
이 기사를 공유합니다

포스텍 등 5개 기관 컨소시엄 구성
연말까지 21억 투입해 연구 개발
도내 1천만 이상 옛한글 자료 학습
각각 다른 획·크기·형태 구분
경북도는 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 추진하는 2021년도 인공지능 학습용 데이터 구축 지원사업에서 ‘옛한글 문자인식(OCR) 데이터셋 구축사업’이 신규 대상사업으로 선정돼 국비 19억 원을 확보했다.

지난 3월~4월 공고 기간 중 한국지능정보사회진흥원(NIA)에 접수된 84개 분야 사업을 대상으로 사업계획서, 프레젠테이션 발표, 질의응답 등의 평가 과정을 거쳐 지난 24일 최종 확정 됐다.

‘옛한글 문자인식(OCR) 데이터셋 구축사업’은 2021년 연말까지 총 21억 원(국비 19, 도비 2)을 투입한다.

경북도 내 1천만 이상의 옛한글 자료를 학습시켜 획, 크기, 형태가 모두 다른 옛한글을 식별해낼 수 있는 AI(인공지능)학습용 데이터를 구축하는 사업으로 경북의 새로운 문화콘텐츠 산업을 선도하고 청년 일자리를 창출하게 된다.

이번 사업은 경북도와 안동대학교를 거점으로 포스텍, 한국국학진흥원, ㈜인플랫 5개 기관이 컨소시엄을 구성하여 옛한글 문자인식(OCR) 데이터셋을 구축한다.

기관별로 △경북도는 사업진행 전반을 관리하며 △안동대학교는 총괄 품질관리 및 검수, 다양한 옛 한글 이미지 분석을 △포스텍은 원천데이터 의미태깅 도구 개발과 딥러닝 기반 기술 개발을 담당하고 △국학진흥원은 옛한글 자료 수집과 제공을 △(주)인플랫은 옛한글 이미지와 텍스트 구축과 원시 데이터 정제도구를 개발하게 된다.

경북도는 ‘옛한글 문자인식(OCR) 데이터셋 구축사업’을 통해 계속해서 발굴되고 있는 전국최대 한글 고서적 자료를 체계적으로 재정리 하는 계기를 마련하고 한글 문화가치 연구와 활용 서비스를 전국으로 빠르게 확산시키는 구심적 역할을 할 것으로 기대된다.

김상철 경북도 문화관광체육국장은 “한글AI 사업은 지난 4월 6일 한글 문화·콘텐츠 산업 육성 전문가 토론회에서 제시된 디지털 뉴딜사업을 구체화한 하나의 사례”라며 “지속적으로 미래 4차 산업 선도와 일자리창출을 위한 한글산업 육성에 최선을 다하겠다”고 밝혔다.

김상만기자 ksm@idaegu.co.kr
  • 대구광역시 동구 동부로94(신천 3동 283-8)
  • 대표전화 : 053-424-0004
  • 팩스 : 053-426-6644
  • 제호 : 대구신문
  • 등록번호 : 대구 가 00003호 (일간)
  • 등록일 : 1996-09-06
  • 인터넷신문등록번호: 대구, 아00442
  • 발행·편집인 : 김상섭
  • 청소년보호책임자 : 배수경
  • 대구신문 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 대구신문. All rights reserved. mail to micbae@idaegu.co.kr
ND소프트
많이 본 기사
영상뉴스
SNS에서도 대구신문의
뉴스를 받아보세요
최신기사