SlideShare une entreprise Scribd logo
1  sur  49
Télécharger pour lire hors ligne
A I R B N B
Aspect In Review 비교 & 분석
http://www.airbnb.co.kr
NAME
김강민 백찬규 임소현
Department
BOAZ 분석 10기
A I R B N B : Aspect In Review 비교 & 분석
주제 선정
D A T A
M O D E L
결 론
I N D E X
1. 주제선정배경
뭐 먹지?
뭐 사지?
뭐 하지?
1. 주제선정배경
리뷰 = 별점 + 텍스트
• 별점
• 가치: 파악이 쉽고 상품끼리 비교하기 용이함
• 한계: 이용자 개개인의 평점 도출 배경 알 수 없음. 구체적이지 못함
• 텍스트
• 가치: 별점만으로 파악하기 힘든 여러 측면의 정보 도출
• 한계: 한눈에 파악하기 힘듦
1. 주제선정배경
리뷰 텍스트를 분석하여
여러 측면에서 별점을 매기자
1. 주제선정배경
숙박 공유 서비스
방을 빌려준 사람을 호스트
들어가는 사람을 게스트
배낭여행자들 사이에서 인기
공유 민박업은 기존에 없던 새로운 서비스
호스트의 부재, 셀프 체크인 등 예기치 못한 문제 발생
구체적인 정보 필요(위치, 시설, 호스트 등)
1. 주제선정배경
답하고자 하는 질문들
리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ?
(비슷한 것들 많은데) 굳이 리뷰를 모두 읽어야 하나?
좀 더 효과적으로 방을 비교할 수 있는 방법은 없을까?
또다른 정보를 알아낼 수는 없을까?
D A T A
데이터 수집 및 전처리
A I R B N B : Aspect In Review 비교 & 분석
2. 데이터 설명
- 대한민국의 도시 9곳 선정 : 서울,부산,제주,서귀포,강릉,전주,대전,대구,광주,여수
- 방의 고유번호인 Listing ID 수집 -> 방에 해당하는 리뷰 크롤링
2.1 데이터 수집 : 에어비앤비 리뷰
총 32,958개
지역별 방 갯수
총 628,095개
지역별 리뷰 수
2. 데이터 설명
2.2 데이터 전처리 : 번역
언어별 리뷰 수
약 40여개 언어가 혼재, 파파고 번역기를 이용하여
전처리가 상대적으로 쉬운 영어로 번역
2. 데이터 설명
2.2 데이터 전처리
리뷰 안에는 문장
문장 안에는 단어
품사로 구분되는 단어
전 처 리 목 표
리뷰를 요약하는 단어 추출
2. 데이터 설명
1. 정규표현식 이용하여 알파벳과 숫자를 제외한 불필요한 기호들 제거
. ! ? 같이 문장이 끝나는 정보를 포함하는 기호는 남김
2. 정확한 문장 tokenizing 을 위해 정규표현식으로 띄어쓰기 보정
3. 문장 tokenizing (NLTK)
"It's very convenient.” “Many coffee shops nearby are nice."
2.2 데이터 전처리
2. 데이터 설명
4. 너무 짧은 문장은 제거
예 > ‘ha.’, ‘ Oh!’
5. 리뷰가 없는 방 제거
6. 단어 tokenizing (NLTK) 후 품사 tagging
'Many’, 'coffee’, 'shops’, 'nearby’, 'are’, 'nice’, '.'
('Many', 'JJ'), ('coffee', 'NN'), ('shops', 'NNS’),
('nearby', 'RB'), ('are', 'VBP'), ('nice', 'JJ'), ('.', '.')
2.2 데이터 전처리
2. 데이터 설명
7. ‘ 명사 형용사 동사 부사 ‘ 만 뽑고 고유명사(‘NNP’)는 선택적으로 제거
예 > 제거: ‘Henry’, ‘Kyungsoon’
제거 X: ‘Nice’, ‘Wifi’(단어의 시작이 대문자)
8. 품사별 Lemmatization(표제어 추출) 진행
예 > 동사 ‘ is ’ , ’ are ’ -> ‘ be ’
명사 ‘rooms’ -> ‘ room ’
9. 모든 단어를 소문자으로 변환
2.2 데이터 전처리
2. 데이터 설명
10. 불용어(Stop words) 제거 : 분석에 큰 의미를 가지지 못하지만 빈출하는 단어
Python NLTK에서 제공하는 stopwords 사용해 제거
Ex) I, am, a, the…
분석을 진행하며 불필요한 단어는 불용어 리스트에 지속적으로 업데이트
2.2 데이터 전처리
2. 데이터 설명
"It's very convenient.Many coffee shops nearby are nice.
Also coffee is good ☺”
[ [very, convenient]
, [coffee, shop, nearby, nice]
,[coffee, good ] ]
2.2 데이터 전처리
M O D E L
LDA / Elastic Net / LARA
A I R B N B : Aspect In Review 비교 & 분석
3. 모델
3.1 LDA : Topic modeling
리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ?
리뷰가 ‘어떤 주제(topic)’에 관한 정보인지
‘어떠한 측면(aspect)’ 을 언급하는지 알아보자
Ex) 위치, 가격, 청결도
3. 모델
3.1 LDA : Topic modeling
LDA 가정
1. 한 리뷰에는 여러 가지 주제가
포함될 수 있다.
2. 주제에는 여러 개의 단어가
포함될 수 있다.
3. 리뷰에 사용된 단어 하나하나는
어떤 주제에 포함된다.
3. 모델
3.1 LDA : Topic modeling
𝜽 = 문서의 주제 분포
Z = 단어의 주제 분포
𝝋 = 주제의 단어 분포
K = 주제의 수
D = 리뷰 문장 수
N = 문장에 속한 단어의 수
3. 모델
3.1 LDA : 지역별
내륙해안
서귀포
제주
부산
여수
대구
서울
대전
광주
전주
해안 내륙
3.1 LDA : 지역별
3. 모델
host
kind
neat
help
friendly
location
close
convenient
walk
beach
clean
comfortable
bed
everything
bathroom
stay
place
time
want
next
view
see
beautiful
floor
morning
Host
Kind
Helpful
home
Location
Station
close
Subway
bus
airport
Clean
Comfortable
Accommodation
Cozy
Spacious
Restaurant
Store
Convenience
nearby
Use
Bed
Small
Bathroom
kitchen
LDA로 도출한 지역별 주제 분포의 차이
호스트
위치
쾌적도
접근성
시설
호스트
위치
쾌적도
재방문
의사
경치
LDA로 도출한 지역별 주제 분포의 차이
해안 내륙
3.1 LDA : 지역별
3. 모델
3. 모델
3.1 LDA : Topic modeling
topic1 topic2 topic3 topic4 topic5
단어 위치 청결도 경치 재방문의사 호스트
location 0.0305 0 0 4.4-e08 0
clean 0 0.0948 0 4.6-e08 0
room 0 0 0.0674 4.5e-08 0
stay 0 0 0 0.0863 0
host 0 0 0 4.5-e08 0.0764
… …
LDA 모델의 output 예시
-> 각 단어가 토픽에서 차지하는 비중
3. 모델
3.2
각 주제에 대한 사람들의 생각, 감정을 알 수 있을까?
3. 모델
3.2 LARA: Latent Aspect Rating Analysis
▪ 별점( 𝑟𝑑 ) : 리뷰에 대한 별점
▪ Aspect : 말하고자 하는 바 (topic)
▪ Aspect 별점 ( 𝜶 𝒅 ) : 리뷰에 대한 aspect별 별점
▪ Aspect 가중치 ( 𝒔 𝒅 ) : 리뷰에 대한 aspect별 가중치
▪ LARA
‘ 별점과 리뷰 텍스트만 가지고도
aspect별 별점과 가중치를 알 수 있는’ 모델
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
별점 ( 𝑟𝑑 ) 4점
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
별점( 𝑟𝑑 ) 4점
= 청결도 × 4점 + 위치 × 5점 + 가격 × 2점
Aspect 별점 ( 𝒔 𝒅 )
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
별점( 𝑟𝑑 ) 4점
= 청결도 × 4점 + 위치 × 5점 + 가격 × 2점
= 0.5 × 4점 + 0.35 × 5점 + 0.125 × 2점
Aspect 가중치 ( 𝜶 𝒅 )
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
단어별 감성 극성
DTM(N*K*D)
aspect 가중치
Variance
aspect 별점
aspect 가중치의 평균
aspect 가중치 의
Variance
Aspect Segmentation
(LDA + Bootstrapping)
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
3.2 Elastic Net - 감정사전 구축
다른 방법으로는
각 주제에 대한 사람들의 생각, 감정을 알 수 없을까?
3. 모델
3.2 Elastic Net - 감정사전 구축
리뷰는 텍스트,
텍스트에는 사람들의 감정이 담겨있다.
그럼 텍스트에 담긴 감정을 어떻게 정량화할 수 있을까?
텍스트에 이용된 단어들의 감정을 수치화 시킨 것이 감정사전이다.
3. 모델
3.2 Elastic Net - 감성사전 구축
감정사전은 이미 존재
But,
Domain(숙소)에 따른 감성사전 구축의 필요성
-> Elastic Net을 이용하여 에어비앤비의 감성사전을 직접 구축
3. 모델
3.2 Elastic Net - 감성사전 구축
+ = = 1 이라는 제약조건 하에서 각 값을 0과 1사이로 조절
중요한 변수를 선택할 수 있고 다중공선성 문제를 해결 가능
데이터의 관측치 수에 비해 변수의 수가 많아지면
변수들 사이의 강한 상관관계로 과적합이 발생 -> 모델 해석이 어렵고 예측력이 떨어짐
3. 모델
3.2 Elastic Net - 감성사전 구축
별점 (rating) 단어 빈도수
DTM very convenient coffee … shop nearby … nice good
review1 1 1 2 0 1 1 0 1 1
Rating
4
3. 모델
3.2 Elastic Net - 감성사전 구축
Elastic Net을 적용하여 산출한 각 회귀계수를 개별 단어의 감정 점수로 사용
별점 (rating) 단어 빈도수
3.3 감성사전 구축 - 결과
Negative Words
vocab Coefficent
challenge -2.095048
burner -0.689223
freshener -0.635682
inaccurate -0.543925
commercial -0.543383
confuse -0.521895
pyeong -0.506351
line -0.503193
furniture -0.466405
advance -0.402517
Positive Words
vocab Coefficent
hostess 0.203116
decorate 0.174437
reply 0.138483
focus 0.136315
tend 0.126949
news 0.115064
human 0.103802
perfectly 0.098851
provide 0.097512
flood 0.095992
- Elastic Net 결과 빈도수 기반으로 추려낸 2920개의 단어 중 412개 단어가 유의
3. 모델
M O D E L I N G
Scoring
A I R B N B : Aspect In Review 비교 & 분석
4. 모델링
4.1 모델 Framework
데이터
LDA
주제의
단어분포
▪ LDA output
Distribution topic1 topic2
word1 0.7 0.2
word2 0.3 0.8
4. 모델링
데이터
DTM 생성
감정사전
구축
▪ Elastic Net▪ 문서 단어 행렬
Sentiment
dictionary
Sentiment
score
word1 0.5
word2 0.3
4.1 모델 Framework
4. 모델링
데이터
LDA
DTM 생성
문서의
주제별 평점
주제의
단어분포
▪ LDA output
감정사전
구축
▪ Elastic Net▪ 문서 단어 행렬
4.1 모델 Framework
4. 모델링
각각의 topic로 Sentiment Score 도출
Sentiment
score
topic1 topic2
room1 3*0.5*0.7 + 1*0.3*0.3 = 11.4 3*0.5*0.2 + 1*0.3*0.8 = 5.4
room2 1*0.5*0.7 + 5*0.3*0.3 = 8 1*0.5*0.2 + 5*0.3*0.8 = 13
=
DTM word1 word2
room1 3 1
room2 1 5
Sentiment
dictionary
Sentiment
score
word1 0.5
word2 0.3
Distribution topic1 topic2
word1 0.7 0.2
word2 0.3 0.8
∙ ×
Elastic Net 결과
4.2 Aspect별 Scoring
LDA 결과DTM
평균 점수
해당 방의 점수
4.3 Aspect별 Scoring
4. 모델링
평균 점수
해당 방의 점수
4.3 Aspect별 Scoring - Good Case
4. 모델링
room id :1367880
평균 점수
해당 방의 점수
4.3 Aspect별 Scoring - Bad Case
4. 모델링
room id :14068358
4.4 Aspect별 Scoring - 의의
4. 모델링
- 별점과 텍스트만으로 세부 별점 도출 가능
- 본인의 선호하는 aspect를 기준으로 중요도 부여 가능
- 방 별로 상대적인 aspect별 별점 부여
4.4 Aspect별 Scoring - 한계
4. 모델링
- 긍정적인 리뷰가 대다수인 데이터 불균형
- 감정사전 직접 구축의 어려움
- 평가기준 없어 성능 평가 어려움
감 사 합 니 다

Contenu connexe

Tendances

UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트RightBrain inc.
 
5th.Lecture.What.is.Information.Architecture.pdf
5th.Lecture.What.is.Information.Architecture.pdf5th.Lecture.What.is.Information.Architecture.pdf
5th.Lecture.What.is.Information.Architecture.pdfJeongeun Kwon
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스BOAZ Bigdata
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이BOAZ Bigdata
 
[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기
[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기
[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기Haesol Youn
 
ส่วนประกอบวิชวลเบสิก
ส่วนประกอบวิชวลเบสิกส่วนประกอบวิชวลเบสิก
ส่วนประกอบวิชวลเบสิกNuunamnoy Singkham
 
8th.Lecture.Step3.Analysis.pdf
8th.Lecture.Step3.Analysis.pdf8th.Lecture.Step3.Analysis.pdf
8th.Lecture.Step3.Analysis.pdfJeongeun Kwon
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템BOAZ Bigdata
 
4th.Lecture.Service.Design.Process.pdf
4th.Lecture.Service.Design.Process.pdf4th.Lecture.Service.Design.Process.pdf
4th.Lecture.Service.Design.Process.pdfJeongeun Kwon
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스BOAZ Bigdata
 
7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf
7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf
7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdfJeongeun Kwon
 
11th.Lecture.Step3.AnalysisUX.Modeling.pdf
11th.Lecture.Step3.AnalysisUX.Modeling.pdf11th.Lecture.Step3.AnalysisUX.Modeling.pdf
11th.Lecture.Step3.AnalysisUX.Modeling.pdfJeongeun Kwon
 
13th.Lecture.Step4.Ideation2.pdf
13th.Lecture.Step4.Ideation2.pdf13th.Lecture.Step4.Ideation2.pdf
13th.Lecture.Step4.Ideation2.pdfJeongeun Kwon
 
12th.Lecture.Step4.Ideation.pdf
12th.Lecture.Step4.Ideation.pdf12th.Lecture.Step4.Ideation.pdf
12th.Lecture.Step4.Ideation.pdfJeongeun Kwon
 
[Rightbrain UX Academy] Megabox UX/UI개선
[Rightbrain UX Academy] Megabox UX/UI개선 [Rightbrain UX Academy] Megabox UX/UI개선
[Rightbrain UX Academy] Megabox UX/UI개선 RightBrain inc.
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇BOAZ Bigdata
 
14th.Lecture.Final.PT.Guideline.pdf
14th.Lecture.Final.PT.Guideline.pdf14th.Lecture.Final.PT.Guideline.pdf
14th.Lecture.Final.PT.Guideline.pdfJeongeun Kwon
 
[분석] 프리미어리그 축구팀 승자예측
[분석] 프리미어리그 축구팀 승자예측[분석] 프리미어리그 축구팀 승자예측
[분석] 프리미어리그 축구팀 승자예측BOAZ Bigdata
 

Tendances (20)

UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
 
5th.Lecture.What.is.Information.Architecture.pdf
5th.Lecture.What.is.Information.Architecture.pdf5th.Lecture.What.is.Information.Architecture.pdf
5th.Lecture.What.is.Information.Architecture.pdf
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
 
[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기
[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기
[패스트캠퍼스]맛집 리뷰로 속성별 감성 분석하기
 
ส่วนประกอบวิชวลเบสิก
ส่วนประกอบวิชวลเบสิกส่วนประกอบวิชวลเบสิก
ส่วนประกอบวิชวลเบสิก
 
8th.Lecture.Step3.Analysis.pdf
8th.Lecture.Step3.Analysis.pdf8th.Lecture.Step3.Analysis.pdf
8th.Lecture.Step3.Analysis.pdf
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
 
4th.Lecture.Service.Design.Process.pdf
4th.Lecture.Service.Design.Process.pdf4th.Lecture.Service.Design.Process.pdf
4th.Lecture.Service.Design.Process.pdf
 
Perceptrons (D1L2 2017 UPC Deep Learning for Computer Vision)
Perceptrons (D1L2 2017 UPC Deep Learning for Computer Vision)Perceptrons (D1L2 2017 UPC Deep Learning for Computer Vision)
Perceptrons (D1L2 2017 UPC Deep Learning for Computer Vision)
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
 
7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf
7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf
7th.Lecture.UI.Design.and.Middle.Team.Assignment.Guideline.pdf
 
11th.Lecture.Step3.AnalysisUX.Modeling.pdf
11th.Lecture.Step3.AnalysisUX.Modeling.pdf11th.Lecture.Step3.AnalysisUX.Modeling.pdf
11th.Lecture.Step3.AnalysisUX.Modeling.pdf
 
13th.Lecture.Step4.Ideation2.pdf
13th.Lecture.Step4.Ideation2.pdf13th.Lecture.Step4.Ideation2.pdf
13th.Lecture.Step4.Ideation2.pdf
 
12th.Lecture.Step4.Ideation.pdf
12th.Lecture.Step4.Ideation.pdf12th.Lecture.Step4.Ideation.pdf
12th.Lecture.Step4.Ideation.pdf
 
[Rightbrain UX Academy] Megabox UX/UI개선
[Rightbrain UX Academy] Megabox UX/UI개선 [Rightbrain UX Academy] Megabox UX/UI개선
[Rightbrain UX Academy] Megabox UX/UI개선
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
 
14th.Lecture.Final.PT.Guideline.pdf
14th.Lecture.Final.PT.Guideline.pdf14th.Lecture.Final.PT.Guideline.pdf
14th.Lecture.Final.PT.Guideline.pdf
 
[분석] 프리미어리그 축구팀 승자예측
[분석] 프리미어리그 축구팀 승자예측[분석] 프리미어리그 축구팀 승자예측
[분석] 프리미어리그 축구팀 승자예측
 

Similaire à 제 9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - AiRBnB : Aspect in Review 비교 & 분석

제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링BOAZ Bigdata
 
[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우NAVER D2
 
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호NAVER D2
 
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)Jeongho Shin
 
댓글 감성 분석 상용화 개발기(Ver. 2)
댓글 감성 분석 상용화 개발기(Ver. 2)댓글 감성 분석 상용화 개발기(Ver. 2)
댓글 감성 분석 상용화 개발기(Ver. 2)Jeffrey Kim
 
딥뉴럴넷 클러스터링 실패기
딥뉴럴넷 클러스터링 실패기딥뉴럴넷 클러스터링 실패기
딥뉴럴넷 클러스터링 실패기Myeongju Kim
 

Similaire à 제 9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - AiRBnB : Aspect in Review 비교 & 분석 (6)

제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
 
[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우
 
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
 
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
더 나은 S/W를 만드는 것에 관하여 (OKKY 세미나)
 
댓글 감성 분석 상용화 개발기(Ver. 2)
댓글 감성 분석 상용화 개발기(Ver. 2)댓글 감성 분석 상용화 개발기(Ver. 2)
댓글 감성 분석 상용화 개발기(Ver. 2)
 
딥뉴럴넷 클러스터링 실패기
딥뉴럴넷 클러스터링 실패기딥뉴럴넷 클러스터링 실패기
딥뉴럴넷 클러스터링 실패기
 

Plus de BOAZ Bigdata

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack BotBOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작BOAZ Bigdata
 

Plus de BOAZ Bigdata (20)

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
 

제 9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - AiRBnB : Aspect in Review 비교 & 분석

  • 1. A I R B N B Aspect In Review 비교 & 분석 http://www.airbnb.co.kr NAME 김강민 백찬규 임소현 Department BOAZ 분석 10기
  • 2. A I R B N B : Aspect In Review 비교 & 분석 주제 선정 D A T A M O D E L 결 론 I N D E X
  • 4. 1. 주제선정배경 리뷰 = 별점 + 텍스트 • 별점 • 가치: 파악이 쉽고 상품끼리 비교하기 용이함 • 한계: 이용자 개개인의 평점 도출 배경 알 수 없음. 구체적이지 못함 • 텍스트 • 가치: 별점만으로 파악하기 힘든 여러 측면의 정보 도출 • 한계: 한눈에 파악하기 힘듦
  • 5. 1. 주제선정배경 리뷰 텍스트를 분석하여 여러 측면에서 별점을 매기자
  • 6. 1. 주제선정배경 숙박 공유 서비스 방을 빌려준 사람을 호스트 들어가는 사람을 게스트 배낭여행자들 사이에서 인기 공유 민박업은 기존에 없던 새로운 서비스 호스트의 부재, 셀프 체크인 등 예기치 못한 문제 발생 구체적인 정보 필요(위치, 시설, 호스트 등)
  • 7. 1. 주제선정배경 답하고자 하는 질문들 리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ? (비슷한 것들 많은데) 굳이 리뷰를 모두 읽어야 하나? 좀 더 효과적으로 방을 비교할 수 있는 방법은 없을까? 또다른 정보를 알아낼 수는 없을까?
  • 8. D A T A 데이터 수집 및 전처리 A I R B N B : Aspect In Review 비교 & 분석
  • 9. 2. 데이터 설명 - 대한민국의 도시 9곳 선정 : 서울,부산,제주,서귀포,강릉,전주,대전,대구,광주,여수 - 방의 고유번호인 Listing ID 수집 -> 방에 해당하는 리뷰 크롤링 2.1 데이터 수집 : 에어비앤비 리뷰 총 32,958개 지역별 방 갯수 총 628,095개 지역별 리뷰 수
  • 10. 2. 데이터 설명 2.2 데이터 전처리 : 번역 언어별 리뷰 수 약 40여개 언어가 혼재, 파파고 번역기를 이용하여 전처리가 상대적으로 쉬운 영어로 번역
  • 11. 2. 데이터 설명 2.2 데이터 전처리 리뷰 안에는 문장 문장 안에는 단어 품사로 구분되는 단어 전 처 리 목 표 리뷰를 요약하는 단어 추출
  • 12. 2. 데이터 설명 1. 정규표현식 이용하여 알파벳과 숫자를 제외한 불필요한 기호들 제거 . ! ? 같이 문장이 끝나는 정보를 포함하는 기호는 남김 2. 정확한 문장 tokenizing 을 위해 정규표현식으로 띄어쓰기 보정 3. 문장 tokenizing (NLTK) "It's very convenient.” “Many coffee shops nearby are nice." 2.2 데이터 전처리
  • 13. 2. 데이터 설명 4. 너무 짧은 문장은 제거 예 > ‘ha.’, ‘ Oh!’ 5. 리뷰가 없는 방 제거 6. 단어 tokenizing (NLTK) 후 품사 tagging 'Many’, 'coffee’, 'shops’, 'nearby’, 'are’, 'nice’, '.' ('Many', 'JJ'), ('coffee', 'NN'), ('shops', 'NNS’), ('nearby', 'RB'), ('are', 'VBP'), ('nice', 'JJ'), ('.', '.') 2.2 데이터 전처리
  • 14. 2. 데이터 설명 7. ‘ 명사 형용사 동사 부사 ‘ 만 뽑고 고유명사(‘NNP’)는 선택적으로 제거 예 > 제거: ‘Henry’, ‘Kyungsoon’ 제거 X: ‘Nice’, ‘Wifi’(단어의 시작이 대문자) 8. 품사별 Lemmatization(표제어 추출) 진행 예 > 동사 ‘ is ’ , ’ are ’ -> ‘ be ’ 명사 ‘rooms’ -> ‘ room ’ 9. 모든 단어를 소문자으로 변환 2.2 데이터 전처리
  • 15. 2. 데이터 설명 10. 불용어(Stop words) 제거 : 분석에 큰 의미를 가지지 못하지만 빈출하는 단어 Python NLTK에서 제공하는 stopwords 사용해 제거 Ex) I, am, a, the… 분석을 진행하며 불필요한 단어는 불용어 리스트에 지속적으로 업데이트 2.2 데이터 전처리
  • 16. 2. 데이터 설명 "It's very convenient.Many coffee shops nearby are nice. Also coffee is good ☺” [ [very, convenient] , [coffee, shop, nearby, nice] ,[coffee, good ] ] 2.2 데이터 전처리
  • 17. M O D E L LDA / Elastic Net / LARA A I R B N B : Aspect In Review 비교 & 분석
  • 18. 3. 모델 3.1 LDA : Topic modeling 리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ? 리뷰가 ‘어떤 주제(topic)’에 관한 정보인지 ‘어떠한 측면(aspect)’ 을 언급하는지 알아보자 Ex) 위치, 가격, 청결도
  • 19. 3. 모델 3.1 LDA : Topic modeling LDA 가정 1. 한 리뷰에는 여러 가지 주제가 포함될 수 있다. 2. 주제에는 여러 개의 단어가 포함될 수 있다. 3. 리뷰에 사용된 단어 하나하나는 어떤 주제에 포함된다.
  • 20. 3. 모델 3.1 LDA : Topic modeling 𝜽 = 문서의 주제 분포 Z = 단어의 주제 분포 𝝋 = 주제의 단어 분포 K = 주제의 수 D = 리뷰 문장 수 N = 문장에 속한 단어의 수
  • 21. 3. 모델 3.1 LDA : 지역별 내륙해안 서귀포 제주 부산 여수 대구 서울 대전 광주 전주
  • 22. 해안 내륙 3.1 LDA : 지역별 3. 모델 host kind neat help friendly location close convenient walk beach clean comfortable bed everything bathroom stay place time want next view see beautiful floor morning Host Kind Helpful home Location Station close Subway bus airport Clean Comfortable Accommodation Cozy Spacious Restaurant Store Convenience nearby Use Bed Small Bathroom kitchen LDA로 도출한 지역별 주제 분포의 차이
  • 24. 3. 모델 3.1 LDA : Topic modeling topic1 topic2 topic3 topic4 topic5 단어 위치 청결도 경치 재방문의사 호스트 location 0.0305 0 0 4.4-e08 0 clean 0 0.0948 0 4.6-e08 0 room 0 0 0.0674 4.5e-08 0 stay 0 0 0 0.0863 0 host 0 0 0 4.5-e08 0.0764 … … LDA 모델의 output 예시 -> 각 단어가 토픽에서 차지하는 비중
  • 25. 3. 모델 3.2 각 주제에 대한 사람들의 생각, 감정을 알 수 있을까?
  • 26. 3. 모델 3.2 LARA: Latent Aspect Rating Analysis ▪ 별점( 𝑟𝑑 ) : 리뷰에 대한 별점 ▪ Aspect : 말하고자 하는 바 (topic) ▪ Aspect 별점 ( 𝜶 𝒅 ) : 리뷰에 대한 aspect별 별점 ▪ Aspect 가중치 ( 𝒔 𝒅 ) : 리뷰에 대한 aspect별 가중치 ▪ LARA ‘ 별점과 리뷰 텍스트만 가지고도 aspect별 별점과 가중치를 알 수 있는’ 모델
  • 27. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 3.2 LARA: Latent Aspect Rating Analysis
  • 28. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 별점 ( 𝑟𝑑 ) 4점 3.2 LARA: Latent Aspect Rating Analysis
  • 29. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 별점( 𝑟𝑑 ) 4점 = 청결도 × 4점 + 위치 × 5점 + 가격 × 2점 Aspect 별점 ( 𝒔 𝒅 ) 3.2 LARA: Latent Aspect Rating Analysis
  • 30. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 별점( 𝑟𝑑 ) 4점 = 청결도 × 4점 + 위치 × 5점 + 가격 × 2점 = 0.5 × 4점 + 0.35 × 5점 + 0.125 × 2점 Aspect 가중치 ( 𝜶 𝒅 ) 3.2 LARA: Latent Aspect Rating Analysis
  • 31. 3. 모델 단어별 감성 극성 DTM(N*K*D) aspect 가중치 Variance aspect 별점 aspect 가중치의 평균 aspect 가중치 의 Variance Aspect Segmentation (LDA + Bootstrapping) 3.2 LARA: Latent Aspect Rating Analysis
  • 32. 3. 모델 3.2 Elastic Net - 감정사전 구축 다른 방법으로는 각 주제에 대한 사람들의 생각, 감정을 알 수 없을까?
  • 33. 3. 모델 3.2 Elastic Net - 감정사전 구축 리뷰는 텍스트, 텍스트에는 사람들의 감정이 담겨있다. 그럼 텍스트에 담긴 감정을 어떻게 정량화할 수 있을까? 텍스트에 이용된 단어들의 감정을 수치화 시킨 것이 감정사전이다.
  • 34. 3. 모델 3.2 Elastic Net - 감성사전 구축 감정사전은 이미 존재 But, Domain(숙소)에 따른 감성사전 구축의 필요성 -> Elastic Net을 이용하여 에어비앤비의 감성사전을 직접 구축
  • 35. 3. 모델 3.2 Elastic Net - 감성사전 구축 + = = 1 이라는 제약조건 하에서 각 값을 0과 1사이로 조절 중요한 변수를 선택할 수 있고 다중공선성 문제를 해결 가능 데이터의 관측치 수에 비해 변수의 수가 많아지면 변수들 사이의 강한 상관관계로 과적합이 발생 -> 모델 해석이 어렵고 예측력이 떨어짐
  • 36. 3. 모델 3.2 Elastic Net - 감성사전 구축 별점 (rating) 단어 빈도수 DTM very convenient coffee … shop nearby … nice good review1 1 1 2 0 1 1 0 1 1 Rating 4
  • 37. 3. 모델 3.2 Elastic Net - 감성사전 구축 Elastic Net을 적용하여 산출한 각 회귀계수를 개별 단어의 감정 점수로 사용 별점 (rating) 단어 빈도수
  • 38. 3.3 감성사전 구축 - 결과 Negative Words vocab Coefficent challenge -2.095048 burner -0.689223 freshener -0.635682 inaccurate -0.543925 commercial -0.543383 confuse -0.521895 pyeong -0.506351 line -0.503193 furniture -0.466405 advance -0.402517 Positive Words vocab Coefficent hostess 0.203116 decorate 0.174437 reply 0.138483 focus 0.136315 tend 0.126949 news 0.115064 human 0.103802 perfectly 0.098851 provide 0.097512 flood 0.095992 - Elastic Net 결과 빈도수 기반으로 추려낸 2920개의 단어 중 412개 단어가 유의 3. 모델
  • 39. M O D E L I N G Scoring A I R B N B : Aspect In Review 비교 & 분석
  • 40. 4. 모델링 4.1 모델 Framework 데이터 LDA 주제의 단어분포 ▪ LDA output Distribution topic1 topic2 word1 0.7 0.2 word2 0.3 0.8
  • 41. 4. 모델링 데이터 DTM 생성 감정사전 구축 ▪ Elastic Net▪ 문서 단어 행렬 Sentiment dictionary Sentiment score word1 0.5 word2 0.3 4.1 모델 Framework
  • 42. 4. 모델링 데이터 LDA DTM 생성 문서의 주제별 평점 주제의 단어분포 ▪ LDA output 감정사전 구축 ▪ Elastic Net▪ 문서 단어 행렬 4.1 모델 Framework
  • 43. 4. 모델링 각각의 topic로 Sentiment Score 도출 Sentiment score topic1 topic2 room1 3*0.5*0.7 + 1*0.3*0.3 = 11.4 3*0.5*0.2 + 1*0.3*0.8 = 5.4 room2 1*0.5*0.7 + 5*0.3*0.3 = 8 1*0.5*0.2 + 5*0.3*0.8 = 13 = DTM word1 word2 room1 3 1 room2 1 5 Sentiment dictionary Sentiment score word1 0.5 word2 0.3 Distribution topic1 topic2 word1 0.7 0.2 word2 0.3 0.8 ∙ × Elastic Net 결과 4.2 Aspect별 Scoring LDA 결과DTM
  • 44. 평균 점수 해당 방의 점수 4.3 Aspect별 Scoring 4. 모델링
  • 45. 평균 점수 해당 방의 점수 4.3 Aspect별 Scoring - Good Case 4. 모델링 room id :1367880
  • 46. 평균 점수 해당 방의 점수 4.3 Aspect별 Scoring - Bad Case 4. 모델링 room id :14068358
  • 47. 4.4 Aspect별 Scoring - 의의 4. 모델링 - 별점과 텍스트만으로 세부 별점 도출 가능 - 본인의 선호하는 aspect를 기준으로 중요도 부여 가능 - 방 별로 상대적인 aspect별 별점 부여
  • 48. 4.4 Aspect별 Scoring - 한계 4. 모델링 - 긍정적인 리뷰가 대다수인 데이터 불균형 - 감정사전 직접 구축의 어려움 - 평가기준 없어 성능 평가 어려움
  • 49. 감 사 합 니 다