SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
DeepNeuralNetworks
forYouTubeRecommendations
(2016) Paul Covington et al.
발표: 곽근봉
© NBT All Rights Reserved.
이논문을선정한이유
출처 : http://www.dailysecu.com/?mod=news&act=articleView&idxno=28265
© NBT All Rights Reserved.
이논문을선정한이유
출처 : http://biz.chosun.com/site/data/html_dir/2017/05/10/2017051001161.html
© NBT All Rights Reserved.
이논문을선정한이유
출처 : http://m.post.naver.com/viewer/postView.nhn?volumeNo=10452898
© NBT All Rights Reserved.
참고 자료
최근우님의 블로그
http://keunwoochoi.blogspot.kr/2016/09/deep-neural-networks-for-youtube.html
논문 저자의 강연
https://www.youtube.com/watch?v=WK_Nr4tUtl8&t=833s
© NBT All Rights Reserved.
개요
실제서비스에적용하여성능을개선시킨추천엔진
• Candidate Generation Model
• Ranking Model
• A/B 테스트를 통한 실제 환경 개선
© NBT All Rights Reserved.
실제상황에서겪게되는이슈들
• Scale : 엄청난 양의 데이터와 제한된 컴퓨팅 파워
• Freshness : 새로운 컨텐츠의 빠른 적용
• Noise : 낮은 meta data 퀄리티, Implicit Feedback 위주 데이터
© NBT All Rights Reserved.
모델설명
Candidate Generation Model : High-Recall이 목표
Ranking Model : 다양한 다른 소스들의 적용을 통한 성능 개선
© NBT All Rights Reserved.
Candidate Generation
© NBT All Rights Reserved.
Embeddings
• Video Embedding과 Search Token Embedding
• Dense Vector (CBOW에서 영감을 받음)
• Backpropagation을 통해서 embedding도 함께 학습
© NBT All Rights Reserved.
Combiner
• 고정된 사이즈의 Input으로 바꿈
• 다양한 방법을 사용해봤는데 average가 성능이 제일 좋음
© NBT All Rights Reserved.
Additional Features
• 단순하게 옆에 전부 concatenate 해버림
© NBT All Rights Reserved.
ReLU Stack
• Fully connected “Tower”
• Output으로 user embedding이 나온다
© NBT All Rights Reserved.
Softmax Prediction
• 각 video별 가중치가 output으로 나온다
• Negative Sampling
© NBT All Rights Reserved.
Serving
• 상위 N개의 비디오
• Dot-product space에서 가
장 가까운 아이템을 찾음
• Nearest Neighbor 알고리즘
간에 성능차이는 없음
© NBT All Rights Reserved.
“ExampleAge”Feature
영상의나이가엄청나게중요!
• Freshness is very important
• 히스토리 데이터를 기반으로 학습을
시키면 오래된 아이템들이 더 추천을
많이 받는 현상
• “영상의 나이”를 추가 feature로 넣
어보자!
© NBT All Rights Reserved.
그외실제환경을고려한요소들
• 모든 비디오 시청이력을 확인해야 bias가 없다
• 학습에 사용할 이용자별 영상 횟수를 fix해야 heavy user에 치우치치 않는다
• 새로운 검색 쿼리에 즉시 추천엔진을 반영하지 않는다
• 비대칭적인 감상 패턴을 적용해서 학습 시킨다
© NBT All Rights Reserved.
실험셋팅및결과
• Embedding size : 256
• Video : 100만개
• 검색어 : 100만개
• 인당최대 개수 : 50개
© NBT All Rights Reserved.
Ranking
Embeddings
• 앞의 모델과 같은 ID space, 같은 embedding을 사용한다
• continuous feature들은 normalize해서 사용한다
© NBT All Rights Reserved.
RankingModel
© NBT All Rights Reserved.
ModelingExpectedWatchTime
• 추천된 영상을 얼마나 오래동안 볼지 예측하는 것을 목표로 함
• 감상시간은 안봤으면 0, 봤으면 본 시간을 값으로 넣는다
• 감상 시간으로 가중치를 줌 (Weighted logistic regression)
© NBT All Rights Reserved.
FeatureEngineering
딥러닝이긴하지만..
• 각 feature들을 어느정도 가공해줘야 한다
• 특히나 시간 연속성을 가진 데이터들은 summarizing이 필요
• 사용자 이용패턴, 추천했는데 보지않았던 영상 등도 활용
• 가장 좋은 feature는 비슷한 비디오에 대한 유저의 반응
© NBT All Rights Reserved.
실험셋팅및결과
© NBT All Rights Reserved.
결론
• 이 모델로 기존의 방법보다 성능을 많이 향상 시켰다
• 모든 것을 딥러닝으로 하기는 쉽지 않다.
• “영상의 나이”가 성능을 크게 개선 시켰다
• 감상 시간별로 가중치를 주는 것도 개선점이 컸다
© NBT All Rights Reserved.
감사합니다.

Contenu connexe

Tendances

SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~Naoto Tamiya
 
アンサンブル学習を用いた競馬予測
アンサンブル学習を用いた競馬予測アンサンブル学習を用いた競馬予測
アンサンブル学習を用いた競馬予測yuta miyawaki
 
Elix_はじめてのAI創薬_2022-04-01.pdf
Elix_はじめてのAI創薬_2022-04-01.pdfElix_はじめてのAI創薬_2022-04-01.pdf
Elix_はじめてのAI創薬_2022-04-01.pdfssuser5ec200
 
[DL輪読会]Network Deconvolution
[DL輪読会]Network Deconvolution[DL輪読会]Network Deconvolution
[DL輪読会]Network DeconvolutionDeep Learning JP
 
機械学習で嘘をつく話
機械学習で嘘をつく話機械学習で嘘をつく話
機械学習で嘘をつく話Satoshi Hara
 
Swiftで、Webサーバにデータを送信・登録しよう!
Swiftで、Webサーバにデータを送信・登録しよう!Swiftで、Webサーバにデータを送信・登録しよう!
Swiftで、Webサーバにデータを送信・登録しよう!Kanako Kobayashi
 
개발을잘하고싶어요-네이버랩스 송기선님
개발을잘하고싶어요-네이버랩스 송기선님개발을잘하고싶어요-네이버랩스 송기선님
개발을잘하고싶어요-네이버랩스 송기선님NAVER D2
 
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 [데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 choi kyumin
 
実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだこと実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだことnishio
 
合成経路探索 -論文まとめ- (PFN中郷孝祐)
合成経路探索 -論文まとめ-  (PFN中郷孝祐)合成経路探索 -論文まとめ-  (PFN中郷孝祐)
合成経路探索 -論文まとめ- (PFN中郷孝祐)Preferred Networks
 
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれからcyberagent
 
Towards Performant Video Recognition
Towards Performant Video RecognitionTowards Performant Video Recognition
Towards Performant Video Recognitioncvpaper. challenge
 
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured PredictionDeep Learning JP
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析Mitsunori Sato
 
How To Become Better Engineer
How To Become Better EngineerHow To Become Better Engineer
How To Become Better EngineerDaeMyung Kang
 
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
성장을 좋아하는 사람이, 성장하고 싶은 사람에게성장을 좋아하는 사람이, 성장하고 싶은 사람에게
성장을 좋아하는 사람이, 성장하고 싶은 사람에게Seongyun Byeon
 
[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기
[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기
[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기Chanwoong Kim
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたいTakuji Tahara
 
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向SSII
 

Tendances (20)

SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
 
アンサンブル学習を用いた競馬予測
アンサンブル学習を用いた競馬予測アンサンブル学習を用いた競馬予測
アンサンブル学習を用いた競馬予測
 
Elix_はじめてのAI創薬_2022-04-01.pdf
Elix_はじめてのAI創薬_2022-04-01.pdfElix_はじめてのAI創薬_2022-04-01.pdf
Elix_はじめてのAI創薬_2022-04-01.pdf
 
[DL輪読会]Network Deconvolution
[DL輪読会]Network Deconvolution[DL輪読会]Network Deconvolution
[DL輪読会]Network Deconvolution
 
機械学習で嘘をつく話
機械学習で嘘をつく話機械学習で嘘をつく話
機械学習で嘘をつく話
 
Swiftで、Webサーバにデータを送信・登録しよう!
Swiftで、Webサーバにデータを送信・登録しよう!Swiftで、Webサーバにデータを送信・登録しよう!
Swiftで、Webサーバにデータを送信・登録しよう!
 
개발을잘하고싶어요-네이버랩스 송기선님
개발을잘하고싶어요-네이버랩스 송기선님개발을잘하고싶어요-네이버랩스 송기선님
개발을잘하고싶어요-네이버랩스 송기선님
 
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 [데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
 
実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだこと実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだこと
 
合成経路探索 -論文まとめ- (PFN中郷孝祐)
合成経路探索 -論文まとめ-  (PFN中郷孝祐)合成経路探索 -論文まとめ-  (PFN中郷孝祐)
合成経路探索 -論文まとめ- (PFN中郷孝祐)
 
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから
 
Towards Performant Video Recognition
Towards Performant Video RecognitionTowards Performant Video Recognition
Towards Performant Video Recognition
 
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
 
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
 
How To Become Better Engineer
How To Become Better EngineerHow To Become Better Engineer
How To Become Better Engineer
 
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
성장을 좋아하는 사람이, 성장하고 싶은 사람에게성장을 좋아하는 사람이, 성장하고 싶은 사람에게
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
 
[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기
[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기
[NDC18] 만들고 붓고 부수고 - 〈야생의 땅: 듀랑고〉 서버 관리 배포 이야기
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
 
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
 

Similaire à 논문리뷰: Deep Neural Networks for YouTube Recommendations

Wide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender SystemsWide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender Systemskeunbong kwak
 
2020년 10월 10일 개발자 이야기
2020년 10월 10일 개발자 이야기2020년 10월 10일 개발자 이야기
2020년 10월 10일 개발자 이야기Jay Park
 
PR-099: MRNet-Product2Vec
PR-099: MRNet-Product2VecPR-099: MRNet-Product2Vec
PR-099: MRNet-Product2Veckeunbong kwak
 
EMOCON 2015 - 품질과 테스트는 다르다
EMOCON 2015 - 품질과 테스트는 다르다EMOCON 2015 - 품질과 테스트는 다르다
EMOCON 2015 - 품질과 테스트는 다르다이상한모임
 
김찬웅_그룹웨어에 새 에너지를_NDC15
김찬웅_그룹웨어에 새 에너지를_NDC15김찬웅_그룹웨어에 새 에너지를_NDC15
김찬웅_그룹웨어에 새 에너지를_NDC15Chanwoong Kim
 
2021년 1월 30일 개발자 이야기
2021년 1월 30일 개발자 이야기2021년 1월 30일 개발자 이야기
2021년 1월 30일 개발자 이야기Jay Park
 
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and DocumentsPR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and Documentskeunbong kwak
 
Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...
Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...
Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...SodamKim14
 
Ask me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processingAsk me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processingkeunbong kwak
 
데이블 Dable news_홍보자료
데이블 Dable news_홍보자료데이블 Dable news_홍보자료
데이블 Dable news_홍보자료startupkorea
 
INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰
INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰
INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰Myeongseok Baek
 
NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표keunbong kwak
 
[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement Learning[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement LearningKiho Suh
 
그로스해킹 기초
그로스해킹 기초그로스해킹 기초
그로스해킹 기초keunbong kwak
 
2021년 3월 6일 개발자 이야기
2021년 3월 6일 개발자 이야기2021년 3월 6일 개발자 이야기
2021년 3월 6일 개발자 이야기Jay Park
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크BOAZ Bigdata
 
NDC17 장창완(최종)
NDC17 장창완(최종)NDC17 장창완(최종)
NDC17 장창완(최종)창완 장
 
Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나
Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나
Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나none
 
HB Smith - business plan - live hero - public
HB Smith - business plan - live hero - publicHB Smith - business plan - live hero - public
HB Smith - business plan - live hero - publicJongwon Han
 
원격테스트
 원격테스트 원격테스트
원격테스트Kim Taesook
 

Similaire à 논문리뷰: Deep Neural Networks for YouTube Recommendations (20)

Wide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender SystemsWide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender Systems
 
2020년 10월 10일 개발자 이야기
2020년 10월 10일 개발자 이야기2020년 10월 10일 개발자 이야기
2020년 10월 10일 개발자 이야기
 
PR-099: MRNet-Product2Vec
PR-099: MRNet-Product2VecPR-099: MRNet-Product2Vec
PR-099: MRNet-Product2Vec
 
EMOCON 2015 - 품질과 테스트는 다르다
EMOCON 2015 - 품질과 테스트는 다르다EMOCON 2015 - 품질과 테스트는 다르다
EMOCON 2015 - 품질과 테스트는 다르다
 
김찬웅_그룹웨어에 새 에너지를_NDC15
김찬웅_그룹웨어에 새 에너지를_NDC15김찬웅_그룹웨어에 새 에너지를_NDC15
김찬웅_그룹웨어에 새 에너지를_NDC15
 
2021년 1월 30일 개발자 이야기
2021년 1월 30일 개발자 이야기2021년 1월 30일 개발자 이야기
2021년 1월 30일 개발자 이야기
 
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and DocumentsPR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
 
Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...
Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...
Trick and Please : A Mixed-Method Study on User Assumptions about the TikTok ...
 
Ask me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processingAsk me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processing
 
데이블 Dable news_홍보자료
데이블 Dable news_홍보자료데이블 Dable news_홍보자료
데이블 Dable news_홍보자료
 
INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰
INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰
INFCON2023-지속 가능한 소프트웨어 개발을 위한 경험과 통찰
 
NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표
 
[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement Learning[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement Learning
 
그로스해킹 기초
그로스해킹 기초그로스해킹 기초
그로스해킹 기초
 
2021년 3월 6일 개발자 이야기
2021년 3월 6일 개발자 이야기2021년 3월 6일 개발자 이야기
2021년 3월 6일 개발자 이야기
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
 
NDC17 장창완(최종)
NDC17 장창완(최종)NDC17 장창완(최종)
NDC17 장창완(최종)
 
Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나
Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나
Pinpoint 도입기 - 2016 신림프로그래머 오픈 세미나
 
HB Smith - business plan - live hero - public
HB Smith - business plan - live hero - publicHB Smith - business plan - live hero - public
HB Smith - business plan - live hero - public
 
원격테스트
 원격테스트 원격테스트
원격테스트
 

Plus de keunbong kwak

NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료keunbong kwak
 
GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representationkeunbong kwak
 
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...keunbong kwak
 
에디터스랩 발표
에디터스랩 발표에디터스랩 발표
에디터스랩 발표keunbong kwak
 
Convolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationConvolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationkeunbong kwak
 
Window manager활용하기 곽근봉
Window manager활용하기 곽근봉Window manager활용하기 곽근봉
Window manager활용하기 곽근봉keunbong kwak
 

Plus de keunbong kwak (7)

NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료
 
Ad Tech 개요
Ad Tech 개요Ad Tech 개요
Ad Tech 개요
 
GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representation
 
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
 
에디터스랩 발표
에디터스랩 발표에디터스랩 발표
에디터스랩 발표
 
Convolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationConvolutional neural networks for sentence classification
Convolutional neural networks for sentence classification
 
Window manager활용하기 곽근봉
Window manager활용하기 곽근봉Window manager활용하기 곽근봉
Window manager활용하기 곽근봉
 

논문리뷰: Deep Neural Networks for YouTube Recommendations

  • 2. © NBT All Rights Reserved. 이논문을선정한이유 출처 : http://www.dailysecu.com/?mod=news&act=articleView&idxno=28265
  • 3. © NBT All Rights Reserved. 이논문을선정한이유 출처 : http://biz.chosun.com/site/data/html_dir/2017/05/10/2017051001161.html
  • 4. © NBT All Rights Reserved. 이논문을선정한이유 출처 : http://m.post.naver.com/viewer/postView.nhn?volumeNo=10452898
  • 5. © NBT All Rights Reserved. 참고 자료 최근우님의 블로그 http://keunwoochoi.blogspot.kr/2016/09/deep-neural-networks-for-youtube.html 논문 저자의 강연 https://www.youtube.com/watch?v=WK_Nr4tUtl8&t=833s
  • 6. © NBT All Rights Reserved. 개요 실제서비스에적용하여성능을개선시킨추천엔진 • Candidate Generation Model • Ranking Model • A/B 테스트를 통한 실제 환경 개선
  • 7. © NBT All Rights Reserved. 실제상황에서겪게되는이슈들 • Scale : 엄청난 양의 데이터와 제한된 컴퓨팅 파워 • Freshness : 새로운 컨텐츠의 빠른 적용 • Noise : 낮은 meta data 퀄리티, Implicit Feedback 위주 데이터
  • 8. © NBT All Rights Reserved. 모델설명 Candidate Generation Model : High-Recall이 목표 Ranking Model : 다양한 다른 소스들의 적용을 통한 성능 개선
  • 9. © NBT All Rights Reserved. Candidate Generation
  • 10. © NBT All Rights Reserved. Embeddings • Video Embedding과 Search Token Embedding • Dense Vector (CBOW에서 영감을 받음) • Backpropagation을 통해서 embedding도 함께 학습
  • 11. © NBT All Rights Reserved. Combiner • 고정된 사이즈의 Input으로 바꿈 • 다양한 방법을 사용해봤는데 average가 성능이 제일 좋음
  • 12. © NBT All Rights Reserved. Additional Features • 단순하게 옆에 전부 concatenate 해버림
  • 13. © NBT All Rights Reserved. ReLU Stack • Fully connected “Tower” • Output으로 user embedding이 나온다
  • 14. © NBT All Rights Reserved. Softmax Prediction • 각 video별 가중치가 output으로 나온다 • Negative Sampling
  • 15. © NBT All Rights Reserved. Serving • 상위 N개의 비디오 • Dot-product space에서 가 장 가까운 아이템을 찾음 • Nearest Neighbor 알고리즘 간에 성능차이는 없음
  • 16. © NBT All Rights Reserved. “ExampleAge”Feature 영상의나이가엄청나게중요! • Freshness is very important • 히스토리 데이터를 기반으로 학습을 시키면 오래된 아이템들이 더 추천을 많이 받는 현상 • “영상의 나이”를 추가 feature로 넣 어보자!
  • 17. © NBT All Rights Reserved. 그외실제환경을고려한요소들 • 모든 비디오 시청이력을 확인해야 bias가 없다 • 학습에 사용할 이용자별 영상 횟수를 fix해야 heavy user에 치우치치 않는다 • 새로운 검색 쿼리에 즉시 추천엔진을 반영하지 않는다 • 비대칭적인 감상 패턴을 적용해서 학습 시킨다
  • 18. © NBT All Rights Reserved. 실험셋팅및결과 • Embedding size : 256 • Video : 100만개 • 검색어 : 100만개 • 인당최대 개수 : 50개
  • 19. © NBT All Rights Reserved. Ranking
  • 20. Embeddings • 앞의 모델과 같은 ID space, 같은 embedding을 사용한다 • continuous feature들은 normalize해서 사용한다
  • 21. © NBT All Rights Reserved. RankingModel
  • 22. © NBT All Rights Reserved. ModelingExpectedWatchTime • 추천된 영상을 얼마나 오래동안 볼지 예측하는 것을 목표로 함 • 감상시간은 안봤으면 0, 봤으면 본 시간을 값으로 넣는다 • 감상 시간으로 가중치를 줌 (Weighted logistic regression)
  • 23. © NBT All Rights Reserved. FeatureEngineering 딥러닝이긴하지만.. • 각 feature들을 어느정도 가공해줘야 한다 • 특히나 시간 연속성을 가진 데이터들은 summarizing이 필요 • 사용자 이용패턴, 추천했는데 보지않았던 영상 등도 활용 • 가장 좋은 feature는 비슷한 비디오에 대한 유저의 반응
  • 24. © NBT All Rights Reserved. 실험셋팅및결과
  • 25. © NBT All Rights Reserved. 결론 • 이 모델로 기존의 방법보다 성능을 많이 향상 시켰다 • 모든 것을 딥러닝으로 하기는 쉽지 않다. • “영상의 나이”가 성능을 크게 개선 시켰다 • 감상 시간별로 가중치를 주는 것도 개선점이 컸다
  • 26. © NBT All Rights Reserved. 감사합니다.