SlideShare une entreprise Scribd logo
1  sur  36
Télécharger pour lire hors ligne
데이터 분석가는
어떤 SKILLSET을
가져야 하는가?
서희
Hee.seo@gmail.com
서희
LG전자 데이터분석가, 챗봇 PM
hui.seo@gmail.com
대방어와 바꾼 초상권
(Special thanks to : 전희원, 정우준,어수행)
데이터 분석가란?
https://twitter.com/josh_wills/status/198093512149958656
데이터 분석가란?
https://twitter.com/josh_wills/status/198093512149958656
인지적 편안함
원인은 통계를 이긴다
휴리스틱과 편향
데이터 분석이란 무엇인가?
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
데이터 분석이란 무엇인가?
데이터로 돈을 버는 일
“생각보다 어렵습니다”
어려운 이유를 이야기 해보겠습니다.
데이터 분석가의 SKILLSET 무엇인가?
도메인 전문가
데이터 핸들링
문제 정의 & 모델링
가설검증 & 최적화
의사결정 & 서비스
데이터 분석가의 SKILLSET - 도메인전문가
CS
Finance
E-Commerce
Manufacture
Game
Telecomm
Medical
HR
모든 영역을
잘하는 분석가
어디에도
없습니다
데이터 분석가의 SKILLSET - 도메인전문가
데이터 분석가
“분석을 해보니 A방식으로 하시
는 것이 매출에 도움이 됩니다”
도메인 전문가
“알고있는데 규제 때문에 못해요”
데이터 분석가의 SKILLSET - 도메인전문가
특정 분야의 도메인 전문성을
가진 분석가가 되어야 합니다.
Domain
Data
Scientist
It’s yours!
데이터 분석가의 SKILLSET – 문제 정의
센서 데이터 “분석”을 해주세요
CRM 데이터 “분석”을 해주세요
퇴사를 “예측”해주세요
“현업의 요구사항을 구체화하는 것은..
분석가의 일이기도 합니다.“
데이터 분석가의 SKILLSET – 문제 정의
분석가가 생각하는 것보다
현업의 문제는 어려울 수 있습니다.
숨어있는 이해관계
나의 KPI와 다른 목표
상관없는 데이터
데이터 분석가의 SKILLSET – 데이터 핸들링
“로그인 한 고객중에 접속한 첫
페이지 중에 특정한 메뉴에서
12분 이하로 머물렀던 고객 중
35세에서 42세 사이의 남자
고객들의 생필품 구매 평균은?
데이터 분석가의 SKILLSET – 데이터 핸들링
- https://blog.appliedai.com/data-science-tools/
자신의 도구를 가지세요
“제가 사용하는 R package는 12개 이내입니다”
데이터 분석가의 SKILLSET – 문제 모델링
“기기의 센서 데이터를 활용하여
냉장고 고장진단을 하고 싶어요.”
Deep learning? Regression?
Tree? Clustering? Optimization?
“무슨 모델을 써야 하는가?”
데이터 분석가의 SKILLSET – 문제 모델링
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
“냉장고 안 시원해요”
분석가: 학습 데이터는 있나요?
현업: 없어요
분석가: 네?
현업: 냉장고가 안 시원한 조건은
대충 알아요
데이터 분석가의 SKILLSET – 문제 모델링
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
Bayesian Network
(Expert system)
“냉장고 안 시원해요”
1.느끼는 냉기 차이는 사람마다 다르다
2.온도 센터의 위치에 따라 냉장고
측정 온도가 달라 질 수 있다.
3. 냉기 약함에 대한 조건에 확신이 없다
“불확실성”
“도메인지식”
확률 추론이
필요해
데이터 분석가의 SKILLSET – 문제 모델링
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
“기기의 센서 데이터를 활용하여
냉장고 고장진단을 하고 싶어요.”
“문제에 맞는 모델을 선택 하
실 수 있는 능력이 필요합니다.”
데이터 분석가의 SKILLSET – 가설 검증 & 최적화
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
분석가: “여성이 남성보다 퀵보드를
30% 더 구매하니 핑크색 퀵보드를
100억대 생산을 더 해야 합니다.”
“당신의 분석 리포트는
중요한 의사결정의 정보입니다”
그런데…..
데이터 분석가의 SKILLSET – 가설 검증 & 최적화
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
알고 보니 이런 데이터
데이터 분석가의 SKILLSET – 의사결정
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
현업
미국인들은 하루에 얼마나 얼음
을 뽑아 먹고 있나요?
분석가
관련 리포트 제공해 드립니다.
데이터 분석가의 SKILLSET – 의사결정
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
“기초 통계량만 뽑는 사람이 될 것인가?”
“분석 리포트만 쓰는 글짓기 선수가 될 것인가?
“왜 당신의 리포트는 항상 유첨(Appendix)?”
“당신의 업의 형태를 이해하세요.
분석이 주류(Mainstream)인지?”
데이터 분석의 SKILLSET – 서비스
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
데이터  서비스
인공지능
분석가가 분석만 한다고 생각하시나요?
데이터만 있으면 무엇이든 할 수 있습니다.
여기까지 SKILLSET….
“이제 능력있는 데이터 분석가가 되는 건지요?“
아닙니다.
데이터 분석이 어려운 또 하나의 이유가 있습니다.
인지적 편안함
원인은 통계를 이긴다
휴리스틱과 편향
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
데이터 분석의 SKILLSET – Good Storyteller
"철수는 수줍음이 많고 소심한 편이다. 착하고 성실하며 꼼꼼하고
특히, 정리정돈을 잘한다. 다른 사람에게 거의 관심이 없으며 주변
일에 거의 관심을 보이지 않는다."
철수의 직업은 다음 보기중 어떤 것일 확률이 높을까?
1) 도서관 사서 2) 대형마트 판매직
질문을 읽고 정답을 맞춰 보세요.
- http://blog.yes24.com/blog/blogMain.aspx?blogid=sapiens99&artSeqNo=8823284
전국에 있는 도서관 사서수와 대형마트 판매직원 수를 비교해보자.
대형마트 판매직원 수가 압도적으로 많다. 대형마트 판매직원 숫자
가 99고 도서관 사서가 1 이라면, 확율은 99%, 1% 일 것이다. 성
격적인 부분을 고려하더라도 철수는 '소심하고 꼼꼼한 대형마트 판
매직원'일 확률이 훨씬 높다.
정답은 여기에
“원인이 통계를 이기는 일은 흔하다”
- http://blog.yes24.com/blog/blogMain.aspx?blogid=sapiens99&artSeqNo=8823284
경험을 통한 믿음은 견고합니다.
데이터 분석가의 SKILLSET – Good Storyteller
데이터 분석가:
“데이터 분석 결과 TV의 광고 효과는 미비
합니다.”
현업 담당자:
“무슨 말씀 이세요? 9시 뉴스 시청자가 얼
마 인줄 아세요? TV광고는 필수입니다.
“원인이 통계를 이긴다”
보고 시 회사에서 와서
P-value를
거의 이야기 한적이 없다.
데이터 분석가의 SKILLSET – Good Storyteller
당신의 분석결과를 어떻게 전달 할 것인가?
Context is King
=
Good Communication
데이터 분석의 SKILLSET – Good Storyteller
회사 경영자(CEO)의 KPI는….
- https://finance.naver.com/item/main.nhn?code=066570
데이터 분석가의 SKILLSET – Good Storyteller
당신의 분석결과를 어떻게 전달 할 것인가?
“업의 이해”
“조직이해관계 파악”
“효과적인 전달능력”
데이터 분석가에게 필요한 SKILLSET 이란…
도메인 전문가
데이터 핸들링
문제 정의 & 모델링
가설검증 & 최적화
의사결정 & 서비스
Good
Storyteller
데이터 분석가는 슈퍼맨인가?
- https://m.insight.co.kr/news/128610
- https://www.slideshare.net/ryanorban/how-to-become-a-data-scientist
아닙니다! 사실은…
분석조직이 가져야 하는 SKILLSET 이여야 합니다.
데이터 분석가에게 필요한 SKILLSET 이란…
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
본인의 개성과 성향에 맞는 역할을
선택하세요.
행운을 빕니다!
감사합니다.
서희 드림.

Contenu connexe

Tendances

스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)Yongho Ha
 
로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법Jeongsang Baek
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...Jungmin Lee
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
 
서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석YOO SE KYUN
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
스타트업 데이터분석 - 퍼널분석과 코호트분석
스타트업 데이터분석 - 퍼널분석과 코호트분석스타트업 데이터분석 - 퍼널분석과 코호트분석
스타트업 데이터분석 - 퍼널분석과 코호트분석Seonggwan Lee
 
코로나19로 인해 변화된 우리 시대의 데이터 트랜드
코로나19로 인해 변화된 우리 시대의 데이터 트랜드코로나19로 인해 변화된 우리 시대의 데이터 트랜드
코로나19로 인해 변화된 우리 시대의 데이터 트랜드Yongho Ha
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화Minho Lee
 
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 [데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 choi kyumin
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)Dylan Ko
 
코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)
코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)
코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)Suhyun Park
 
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Seongyun Byeon
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )정혁 권
 
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편Seongyun Byeon
 
MOBILITY X DATA : 모빌리티 산업의 도전 과제
MOBILITY X DATA : 모빌리티 산업의 도전 과제MOBILITY X DATA : 모빌리티 산업의 도전 과제
MOBILITY X DATA : 모빌리티 산업의 도전 과제Seongyun Byeon
 
2023년 인공지능 서비스 트렌드
2023년 인공지능 서비스 트렌드2023년 인공지능 서비스 트렌드
2023년 인공지능 서비스 트렌드SK(주) C&C - 강병호
 
나의 이직 이야기
나의 이직 이야기나의 이직 이야기
나의 이직 이야기종립 이
 
화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자Yongho Ha
 

Tendances (20)

스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
 
로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
 
서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
스타트업 데이터분석 - 퍼널분석과 코호트분석
스타트업 데이터분석 - 퍼널분석과 코호트분석스타트업 데이터분석 - 퍼널분석과 코호트분석
스타트업 데이터분석 - 퍼널분석과 코호트분석
 
코로나19로 인해 변화된 우리 시대의 데이터 트랜드
코로나19로 인해 변화된 우리 시대의 데이터 트랜드코로나19로 인해 변화된 우리 시대의 데이터 트랜드
코로나19로 인해 변화된 우리 시대의 데이터 트랜드
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
 
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 [데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
 
코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)
코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)
코딩 테스트 및 알고리즘 문제해결 공부 방법 (고려대학교 KUCC, 2022년 4월)
 
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
 
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
 
MOBILITY X DATA : 모빌리티 산업의 도전 과제
MOBILITY X DATA : 모빌리티 산업의 도전 과제MOBILITY X DATA : 모빌리티 산업의 도전 과제
MOBILITY X DATA : 모빌리티 산업의 도전 과제
 
2023년 인공지능 서비스 트렌드
2023년 인공지능 서비스 트렌드2023년 인공지능 서비스 트렌드
2023년 인공지능 서비스 트렌드
 
Data Science. Intro
Data Science. IntroData Science. Intro
Data Science. Intro
 
나의 이직 이야기
나의 이직 이야기나의 이직 이야기
나의 이직 이야기
 
화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자
 

Similaire à 데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기

[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입Hoon Park
 
데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?Glen Park
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiIsabel Myeongju Han
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyDataya Nolja
 
T ka kr_4th
T ka kr_4thT ka kr_4th
T ka kr_4thSubin An
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayYoungchan Jo
 
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자neuroassociates
 
탐사분석을통한작업장탐지
탐사분석을통한작업장탐지탐사분석을통한작업장탐지
탐사분석을통한작업장탐지Eun-Jo Lee
 
이중 데이터 전략 (Two-track data strategy)
이중 데이터 전략 (Two-track data strategy)이중 데이터 전략 (Two-track data strategy)
이중 데이터 전략 (Two-track data strategy)Hosung Lee
 
데이터 과학자는 무슨 일을 하는가? [KAIST 2018]
데이터 과학자는 무슨 일을 하는가? [KAIST 2018]데이터 과학자는 무슨 일을 하는가? [KAIST 2018]
데이터 과학자는 무슨 일을 하는가? [KAIST 2018]Alberto Yeo
 
[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료NAVER D2
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117Han Woo PARK
 
Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략YongGeun Song
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력Youngjae Kim
 
웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책
웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책
웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책HyeonSeok Choi
 
데이터를 보는 안목 (Data Literacy)
데이터를 보는 안목 (Data Literacy)데이터를 보는 안목 (Data Literacy)
데이터를 보는 안목 (Data Literacy)sidney yang
 
빅데이터의 다음 단계는 예측 분석이다
빅데이터의 다음 단계는 예측 분석이다빅데이터의 다음 단계는 예측 분석이다
빅데이터의 다음 단계는 예측 분석이다Kyunghoon Kim
 
알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기Kwangsik Lee
 
From Data Literacy to Data Fluency
From Data Literacy to Data FluencyFrom Data Literacy to Data Fluency
From Data Literacy to Data Fluencysidney yang
 
안전한 사이버 세상을 위한 데이터 애널리틱스
안전한 사이버 세상을 위한 데이터 애널리틱스안전한 사이버 세상을 위한 데이터 애널리틱스
안전한 사이버 세상을 위한 데이터 애널리틱스인욱 황
 

Similaire à 데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기 (20)

[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
 
데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonsei
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
 
T ka kr_4th
T ka kr_4thT ka kr_4th
T ka kr_4th
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start today
 
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자
 
탐사분석을통한작업장탐지
탐사분석을통한작업장탐지탐사분석을통한작업장탐지
탐사분석을통한작업장탐지
 
이중 데이터 전략 (Two-track data strategy)
이중 데이터 전략 (Two-track data strategy)이중 데이터 전략 (Two-track data strategy)
이중 데이터 전략 (Two-track data strategy)
 
데이터 과학자는 무슨 일을 하는가? [KAIST 2018]
데이터 과학자는 무슨 일을 하는가? [KAIST 2018]데이터 과학자는 무슨 일을 하는가? [KAIST 2018]
데이터 과학자는 무슨 일을 하는가? [KAIST 2018]
 
[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료
 
빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117
 
Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력
 
웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책
웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책
웹데이터분석학 Ch10. 숨겨진 웹데이터 분석 함정을 위한 최상의 해결책
 
데이터를 보는 안목 (Data Literacy)
데이터를 보는 안목 (Data Literacy)데이터를 보는 안목 (Data Literacy)
데이터를 보는 안목 (Data Literacy)
 
빅데이터의 다음 단계는 예측 분석이다
빅데이터의 다음 단계는 예측 분석이다빅데이터의 다음 단계는 예측 분석이다
빅데이터의 다음 단계는 예측 분석이다
 
알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기
 
From Data Literacy to Data Fluency
From Data Literacy to Data FluencyFrom Data Literacy to Data Fluency
From Data Literacy to Data Fluency
 
안전한 사이버 세상을 위한 데이터 애널리틱스
안전한 사이버 세상을 위한 데이터 애널리틱스안전한 사이버 세상을 위한 데이터 애널리틱스
안전한 사이버 세상을 위한 데이터 애널리틱스
 

데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기

  • 1. 데이터 분석가는 어떤 SKILLSET을 가져야 하는가? 서희 Hee.seo@gmail.com
  • 2. 서희 LG전자 데이터분석가, 챗봇 PM hui.seo@gmail.com 대방어와 바꾼 초상권 (Special thanks to : 전희원, 정우준,어수행)
  • 5. 인지적 편안함 원인은 통계를 이긴다 휴리스틱과 편향 데이터 분석이란 무엇인가? - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
  • 6. 데이터 분석이란 무엇인가? 데이터로 돈을 버는 일 “생각보다 어렵습니다” 어려운 이유를 이야기 해보겠습니다.
  • 7. 데이터 분석가의 SKILLSET 무엇인가? 도메인 전문가 데이터 핸들링 문제 정의 & 모델링 가설검증 & 최적화 의사결정 & 서비스
  • 8. 데이터 분석가의 SKILLSET - 도메인전문가 CS Finance E-Commerce Manufacture Game Telecomm Medical HR 모든 영역을 잘하는 분석가 어디에도 없습니다
  • 9. 데이터 분석가의 SKILLSET - 도메인전문가 데이터 분석가 “분석을 해보니 A방식으로 하시 는 것이 매출에 도움이 됩니다” 도메인 전문가 “알고있는데 규제 때문에 못해요”
  • 10. 데이터 분석가의 SKILLSET - 도메인전문가 특정 분야의 도메인 전문성을 가진 분석가가 되어야 합니다. Domain Data Scientist It’s yours!
  • 11. 데이터 분석가의 SKILLSET – 문제 정의 센서 데이터 “분석”을 해주세요 CRM 데이터 “분석”을 해주세요 퇴사를 “예측”해주세요 “현업의 요구사항을 구체화하는 것은.. 분석가의 일이기도 합니다.“
  • 12. 데이터 분석가의 SKILLSET – 문제 정의 분석가가 생각하는 것보다 현업의 문제는 어려울 수 있습니다. 숨어있는 이해관계 나의 KPI와 다른 목표 상관없는 데이터
  • 13. 데이터 분석가의 SKILLSET – 데이터 핸들링 “로그인 한 고객중에 접속한 첫 페이지 중에 특정한 메뉴에서 12분 이하로 머물렀던 고객 중 35세에서 42세 사이의 남자 고객들의 생필품 구매 평균은?
  • 14. 데이터 분석가의 SKILLSET – 데이터 핸들링 - https://blog.appliedai.com/data-science-tools/ 자신의 도구를 가지세요 “제가 사용하는 R package는 12개 이내입니다”
  • 15. 데이터 분석가의 SKILLSET – 문제 모델링 “기기의 센서 데이터를 활용하여 냉장고 고장진단을 하고 싶어요.” Deep learning? Regression? Tree? Clustering? Optimization? “무슨 모델을 써야 하는가?”
  • 16. 데이터 분석가의 SKILLSET – 문제 모델링 - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/ “냉장고 안 시원해요” 분석가: 학습 데이터는 있나요? 현업: 없어요 분석가: 네? 현업: 냉장고가 안 시원한 조건은 대충 알아요
  • 17. 데이터 분석가의 SKILLSET – 문제 모델링 - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/ Bayesian Network (Expert system) “냉장고 안 시원해요” 1.느끼는 냉기 차이는 사람마다 다르다 2.온도 센터의 위치에 따라 냉장고 측정 온도가 달라 질 수 있다. 3. 냉기 약함에 대한 조건에 확신이 없다 “불확실성” “도메인지식” 확률 추론이 필요해
  • 18. 데이터 분석가의 SKILLSET – 문제 모델링 - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/ “기기의 센서 데이터를 활용하여 냉장고 고장진단을 하고 싶어요.” “문제에 맞는 모델을 선택 하 실 수 있는 능력이 필요합니다.”
  • 19. 데이터 분석가의 SKILLSET – 가설 검증 & 최적화 - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/ 분석가: “여성이 남성보다 퀵보드를 30% 더 구매하니 핑크색 퀵보드를 100억대 생산을 더 해야 합니다.” “당신의 분석 리포트는 중요한 의사결정의 정보입니다” 그런데…..
  • 20. 데이터 분석가의 SKILLSET – 가설 검증 & 최적화 - https://en.wikipedia.org/wiki/Anscombe%27s_quartet 알고 보니 이런 데이터
  • 21. 데이터 분석가의 SKILLSET – 의사결정 - https://en.wikipedia.org/wiki/Anscombe%27s_quartet 현업 미국인들은 하루에 얼마나 얼음 을 뽑아 먹고 있나요? 분석가 관련 리포트 제공해 드립니다.
  • 22. 데이터 분석가의 SKILLSET – 의사결정 - https://en.wikipedia.org/wiki/Anscombe%27s_quartet “기초 통계량만 뽑는 사람이 될 것인가?” “분석 리포트만 쓰는 글짓기 선수가 될 것인가? “왜 당신의 리포트는 항상 유첨(Appendix)?” “당신의 업의 형태를 이해하세요. 분석이 주류(Mainstream)인지?”
  • 23. 데이터 분석의 SKILLSET – 서비스 - https://en.wikipedia.org/wiki/Anscombe%27s_quartet 데이터  서비스 인공지능 분석가가 분석만 한다고 생각하시나요? 데이터만 있으면 무엇이든 할 수 있습니다.
  • 24. 여기까지 SKILLSET…. “이제 능력있는 데이터 분석가가 되는 건지요?“ 아닙니다. 데이터 분석이 어려운 또 하나의 이유가 있습니다.
  • 25. 인지적 편안함 원인은 통계를 이긴다 휴리스틱과 편향 - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/ 데이터 분석의 SKILLSET – Good Storyteller
  • 26. "철수는 수줍음이 많고 소심한 편이다. 착하고 성실하며 꼼꼼하고 특히, 정리정돈을 잘한다. 다른 사람에게 거의 관심이 없으며 주변 일에 거의 관심을 보이지 않는다." 철수의 직업은 다음 보기중 어떤 것일 확률이 높을까? 1) 도서관 사서 2) 대형마트 판매직 질문을 읽고 정답을 맞춰 보세요. - http://blog.yes24.com/blog/blogMain.aspx?blogid=sapiens99&artSeqNo=8823284
  • 27. 전국에 있는 도서관 사서수와 대형마트 판매직원 수를 비교해보자. 대형마트 판매직원 수가 압도적으로 많다. 대형마트 판매직원 숫자 가 99고 도서관 사서가 1 이라면, 확율은 99%, 1% 일 것이다. 성 격적인 부분을 고려하더라도 철수는 '소심하고 꼼꼼한 대형마트 판 매직원'일 확률이 훨씬 높다. 정답은 여기에 “원인이 통계를 이기는 일은 흔하다” - http://blog.yes24.com/blog/blogMain.aspx?blogid=sapiens99&artSeqNo=8823284
  • 28. 경험을 통한 믿음은 견고합니다. 데이터 분석가의 SKILLSET – Good Storyteller 데이터 분석가: “데이터 분석 결과 TV의 광고 효과는 미비 합니다.” 현업 담당자: “무슨 말씀 이세요? 9시 뉴스 시청자가 얼 마 인줄 아세요? TV광고는 필수입니다. “원인이 통계를 이긴다”
  • 29. 보고 시 회사에서 와서 P-value를 거의 이야기 한적이 없다. 데이터 분석가의 SKILLSET – Good Storyteller 당신의 분석결과를 어떻게 전달 할 것인가?
  • 30. Context is King = Good Communication 데이터 분석의 SKILLSET – Good Storyteller 회사 경영자(CEO)의 KPI는…. - https://finance.naver.com/item/main.nhn?code=066570
  • 31. 데이터 분석가의 SKILLSET – Good Storyteller 당신의 분석결과를 어떻게 전달 할 것인가? “업의 이해” “조직이해관계 파악” “효과적인 전달능력”
  • 32. 데이터 분석가에게 필요한 SKILLSET 이란… 도메인 전문가 데이터 핸들링 문제 정의 & 모델링 가설검증 & 최적화 의사결정 & 서비스 Good Storyteller
  • 33. 데이터 분석가는 슈퍼맨인가? - https://m.insight.co.kr/news/128610
  • 35. 데이터 분석가에게 필요한 SKILLSET 이란… - berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/ 본인의 개성과 성향에 맞는 역할을 선택하세요.