2024.04.26 (금)

  • 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

[청년발언대] 취향 저격, 유튜브 알고리즘

 

【 청년일보 】 유튜브는 세계에서 가장 큰 동영상 콘텐츠 공유 플랫폼이다. 모바일 마켓 인텔리전스 플랫폼 아이지에이웍스에서 발표한 유튜브앱 분석 리포트에 따르면 우리나라 사람들이 가장 많이 사용하는 앱은 카카오톡을 제치고 유튜브가 차지했다고 한다. 유튜브에 한번 들어가면 추천으로 뜨는 흥미로운 영상들을 보며 몇 시간이 훌쩍 지나가곤 하는데, 이는 바로 우리의 취향을 저격할 만한 영상들을 추천해주는 유튜브의 ‘알고리즘’, 즉 AI 때문이다.

 

추천 시스템이란 과거 사용자의 시청 기록과 영상에 대한 정보 등 여러 가지 데이터를 이용하여 특정 사용자가 좋아할 만한 영상을 추천해주는 것을 말한다. 우리가 매일 접하는 유튜브도 이러한 추천 시스템을 이용하여 영상을 화면에 노출시킨다. 그 자세한 알고리즘은 2010년, 2016년, 2019년에 유튜브에서 발표한 논문들에 설명되어 있고, 그 논문들에서 설명된 유튜브 알고리즘에 대해 간단히 설명해보도록 하겠다.

 

먼저, 2016년부터 추천에 딥러닝을 사용함으로써 추천의 성능을 큰 폭으로 높였다고 한다. 딥러닝은 기존의 머신러닝에 인공 신경망(artificial neural network)을 사용하여 학습하는 방식으로 데이터를 따로 가공할 필요 없이 학습이 가능하다는 장점이 있다. 그래서 더 많은 데이터를 추천에 반영할 수 있게 되고, 이는 추천의 성능이 높아지게 된 이유 중 하나이다.

 

셀 수 없이 많은 영상이 업로드되는 유튜브에서 모든 영상을 비교해보며 사용자가 좋아할 만한 영상을 고르기에는 아주 많은 시간이 걸린다. 따라서 학습을 두 단계로 나누어 진행하게 되는데, 수백만 개의 영상들 중에서 단순한 개인화를 통하여 수백 개의 후보군을 생성(candidate generation)하고 그 사이에서 순위를 매겨(ranking) 순위가 높은 몇십 개의 영상들을 추천하는 방식이다.

 

보통의 사용자들은 갓 올라온 영상을 더 선호하는 경항을 갖는다. 그러나 추천은 사용자의 과거 시청기록을 기반으로 하다 보니 추천이 과거의 영상 위주로 편향되게 되는데, 따라서 이를 보정하기 위해 새로운 “Example Age”라는 특징을 인풋 데이터에 추가하였고, 이는 그 영상이 얼마나 최근에 업로드되었냐를 나타내는 값이다. 이를 통해 새로 업로드된 영상이 더 잘 추천될 수 있도록 하였다고 한다.

 

 유튜브의 추천이 100% 사용자의 취향을 저격하는 것은 아니다. 그럼에도 불구하고 우리는 단순히 어떤 영상이 유튜브 상단에 떠 있다고 해서 클릭을 하여 시청하는 경우가 종종 있는데, 이를 feedback loop라고 한다. 이를 해결하기 위해 학습을 할 때, 상단에 노출되어있던 영상의 가중치를 낮춤으로써 이로 인해 발생하는 편향을 줄였다고 한다.

 

이처럼 유튜브에서는 모델을 계속 수정하고 유의미한 데이터를 추가하며 추천의 성능을 높이기 위한 연구를 진행 중에 있다. 그 결과 우리가 유튜브에서 우리의 취향을 저격하는 흥미로운 영상들을 더 잘 볼 수 있게 되는 것이다. 더 자세한 추천 알고리즘이 궁금한 분들은 논문들을 직접 찾아 읽어보길 바란다.

 

 

【 청년서포터즈 5기 이수연 】 

관련기사




청년발언대

더보기


기자수첩

더보기

배너
배너
배너