2024.04.26 (금)

  • 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

"10초 내 5개 문장 생성"···LG AI연구원 '캡셔닝 AI' 첫 공개

LG, 현지시간 18일 캐나다 '세계 최대 컴퓨터 비전 학회' 참석
LG 주요 계열사 5곳 공동 학회 참가···글로벌 AI 우수 인재 확보

 

【청년일보】 LG AI연구원은은 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 'CVPR(컴퓨터 비전 및 패턴 인식) 2023'에서 이미지 검색 시장에 변화를 가져올 '캡셔닝 AI(Captioning AI)'를 처음 공개했다고 밝혔다.

 

LG그룹에 따르면 '캡셔닝 AI'는 ‘인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI'로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다.

 

LG AI연구원은 AI가 인간처럼 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있도록 '제로샷 이미지 캡셔닝(Zero-shot Image Captioning)' 기술을 적용했다.

 

'제로샷 이미지 캡셔닝'은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경, 인물, 행동 등 이미지 상의 다양한 요소와 특징을 인식하고, 그 관계를 이해하고 설명할 수 있게 하는 기술이다.

 

특히 '캡셔닝 AI'는 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다는 것이 업계 전언이다. 

 

문장이나 단어의 길이와 개수에 따라 다르지만 평균적으로 5개 문장과 10개의 키워드를 10초 내에 생성한다. 이미지 범위를 1만 장으로 확장하면 2일 이내에 작업을 끝낼 수 있어 빠른 시간 내에 맞춤형 이미지 검색·관리 시스템 구축이 가능하다.

 

LG AI연구원은 이날 '캡셔닝 AI'의 기반 기술인 '제로샷 이미지 캡셔닝'을 주제로 서울대 AI대학원, 세계 최대 플랫폼 기업인 셔터스톡과 함께 워크숍도 진행했다.

 

이경무 서울대 석좌교수의 개회사로 시작한 워크숍에는 LG AI연구원의 최고 AI 사이언티스트인 이홍락 미시간대 교수를 비롯해 이미지 캡셔닝 분야의 세계적인 전문가들이 참여해 최신 연구 동향과 미래 전망, AI 윤리 등 기술이 사회에 미치는 영향에 관해 심도 있는 논의를 진행했다.

 

이번 워크숍에선 상반기에 진행한 'LG 글로벌 AI 챌린지' 시상식도 열렸다.

 

자체 개발한 AI 모델의 이미지 이해 능력을 평가하는 대회인 'LG 글로벌 AI 챌린지'에는 총 142개 연구팀이 참여했다.

 

챌린지 1, 2위를 차지한 난징과기대, 카이스트(KAIST) 소속 참가자들은 워크숍에서 연구 성과를 발표하기도 했다.

 

김승환 LG AI연구원 비전랩장은 "이번 워크숍은 첫 번째 상용화 서비스인 ‘캡셔닝 AI’ 발표와 연계돼 있어 더욱 의미가 깊다"면서 "이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너들과 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획"이라고 말했다.

 

한편, LG AI연구원은 이달 22일까지 진행하는 학회 기간 중 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 LG의 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나선다.

 

이를 위해 19일에는 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 'LG AI Day'를 진행하며, 20일부터 사흘 간 LG 각 계열사의 AI 연구 인력과 채용 담당자들이 LG 통합 부스에서 각 사의 최신 AI 기술 시연과 채용 상담을 진행한다.

 


【청년일보=이창현 기자】

관련기사




청년발언대

더보기


기자수첩

더보기

배너
배너
배너