2022.01.19 (수)

  • 구름많음동두천 -7.0℃
  • 구름조금강릉 1.1℃
  • 서울 -4.3℃
  • 맑음대전 -3.7℃
  • 맑음대구 -2.9℃
  • 맑음울산 -0.6℃
  • 맑음광주 -2.6℃
  • 맑음부산 1.6℃
  • 맑음고창 -3.6℃
  • 맑음제주 6.5℃
  • 흐림강화 -3.7℃
  • 구름조금보은 -8.0℃
  • 맑음금산 -6.8℃
  • 맑음강진군 -0.7℃
  • 구름조금경주시 -2.6℃
  • 맑음거제 1.1℃
기상청 제공

카카오브레인, 한국어 초거대 AI 언어모델 'KoGPT' 공개

긴 문장 한줄 요약, 문장 추론해 결론 예측, 질문 문맥 이해 등 모든 종류의 언어 과제 수행
오픈소스로 개방해 접근성 보장, 국내 IT 기술 발전과 연구 활성화에 기여 목표

 

【 청년일보 】 카카오브레인이 'GPT-3' 모델의 한국어 특화 AI 언어모델 'KoGPT'를 최대 오픈소스 커뮤니티 깃허브에 공개했다.

 

OpenAI의 언어 모델 GPT-3는 인간과 AI가 자연어 기반으로 소통할 수 있는 AI 모델로 딥러닝의 한계를 끌어올려 차세대 AI 시대를 열었다고 평가받는 기술이다

 

기존의 딥러닝 방식에서 감성 분석을 할 때 사람의 선호도를 파악하려면 엄청나게 많은 데이터를 확보하고 좋음 또는 나쁨을 판단해 레이블링을 했다.

 

GPT 모델을 적용하면 추가 학습 없이 스스로 판단해 감정 분석을 할 수 있다. 예를 들어 영화 리뷰 댓글을 보고 댓글이 영화에 대한 긍정적인지 부정적인지 판별할 수 있고, 글의 내용을 짧게 요약이 가능하다.

 

카카오브레인의 KoGPT는 이 같은 GPT-3 모델의 한국어 특화 버전이다. 60억 개의 매개변수와 2000억 개 토큰의 한국어 데이터를 바탕으로 구축했다.

 

KoGPT는 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여 준다. ▲주어진 문장의 긍정과 부정 판단 ▲긴 문장 한 줄 요약 ▲문장을 추론해 결론 예측 ▲질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다.

 

맥락에 따라 자동으로 글쓰기가 가능해 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등 높은 수준의 언어 과제를 해결하고 다양한 분야에서 활용할 수 있다.

 

카카오브레인은 추후 한국어뿐 아니라 영어, 일본어 모델도 준비해 오픈소스화한다. 베트남어, 말레이시아어 등 동남아시아 언어도 준비해 더 많은 곳에서 AI 기술의 혜택을 누리도록 할 예정이다.

 

김일두 카카오브레인 대표는 "앞으로 GPT 기술의 사이즈와 성능을 100배 규모로 키울 예정"이라며 "GPT는 대규모 데이터를 다루기 때문에 높은 수준의 리소스와 투자가 필요하다. GPT를 오픈소스로 개방해 일반 대학이나 스타트업 등의 기술 접근성을 높일 것"이라고 포부를 전했다. 

 

이어 "KoGPT에 이어 초거대 AI의 다양한 모델을 발표하는 등 지속적으로 혁신 기술을 공유하고 국내 IT 기술 발전과 연구 활성화에 기여해 다양한 사회 문제를 같이 해결하기 위해 노력할 것"이라고 밝혔다.

 

【 청년일보=박준영 기자 】

관련기사





Y-포토


배너

배너
배너
배너
배너
배너

기자수첩

더보기