SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
딥러닝 모델을
솔루션화 하기
Produced by Tae Young Lee
솔루션의 정의
솔루션이란 어떤 특정한 상황에 대한 해결책으로 사용자의 요구에 따라 프로그램과
관련된 문제들을 처리해주는 하드웨어, 소프트웨어, 기술 등을 가리킨다.
( 잊지 말아야 할 부분 )
모델은 모델일 뿐이다.
모델은 솔루션이 아니다. 해결책을 찾아가는 과정이다.
이 점을 이해하지 못한다면 딥러닝 모델 솔루션은 허상일 뿐이다.
딥러닝 모델을 고객사에 납품하기 위해서는 고객사의 환경을
체크해야 한다
1> 사내 Private 환경 구성 여부 확인
2> 모델 Training 시간을 고려하여 고객사 Infra Resource 확인
3> Service를 위한 Serving구성 제약 요건 확인
4> 거버넌스 확인
지적 재산권 보호
소스 암호화
Docker Image내의 소스 위치를 해 놓고 Path를 알 수 없게 aliasing과 소스 난독화
학습 시 base image로 반입된 IDE 환경 내에서 entrypoint를 잡고 Training할 수 있도록
학습 환경 구성
모델 암호화
PyTorch로 구현된 모델의 경우 .pt → .enc로 Encryption
PyTorch에서는 모델을 저장할 때 .pt 또는 .pth 확장자를 사용하는 것이 일반적인 규칙
.enc 파일 확장자는 암호화 된 파일있는 UUenconded 형식의 파일에 의해 사용됨
이것은 이러한 ENC 파일이 보호 된 데이터를 포함하고,이 형식으로 저장 수단의 데이터이므로 무단 보거나 복사를
방지
딥러닝 프로세스 별 검토 내역
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING
BASE IMAGE COMPONENT (SERVING)
APPLICATION
DATA 연동
DATA 연동 확인
기존 DATA PROCESS 확인
DATA를 보유하고 있는 Legacy System 과의 INTERFACE 방안 확인
1> 일 단위 데이터 건수 확인
2> Legacy System 부하 점검
3> Network Latency 확인
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING
BASE IMAGE COMPONENT (SERVING)
APPLICATION
학습 DATA
생성 방안
학습 데이터의 상태를 확인 필요
대부분의 학습 데이터는 Legacy System에 모델을 태우기 적합하지 않은 형태로
저장되어 있다.
그래서 POC를 통해 Data의 형태를 이해하고 어떤 모델링 기법을 적용해야 할지
서로 논의하고 확정해야 하는 작업이 필요하다.
학습 DATA 생성 방안 검토
모델에 적합한 데이터 생성 방안 검토
모델의 파이프 라인 구축에 필요한 적절한 학습 데이터 분배 및 할당 필요
학습 DATA형태 (이미지, 텍스트)에 따라 사전 작업 필요
- 텍스트의 경우 corpus 구성 및 tagging방안에 대한 검토 → 카테고리 정립
- 이미지의 경우 Annotation 범위 확정 후 추출해야 할 키 값에 대한 사전 정의
필요
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING
BASE IMAGE COMPONENT (SERVING)
APPLICATION
TRAINING 방법 확인
학습을 할 수 있는 환경을 보유하고 있는 지 여부
모델 운영에 대한 정책에 대한 확인
대략적인 학습 소요 시간 추정 및 학습에 바탕이 되는 INFRA SPEC 검토
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING
BASE IMAGE COMPONENT (SERVING)
APPLICATION
모델 평가
방법
Model Evaluation 방법 합의
초기 모델에 대한 평가 수행을 통한 평가 가이드 라인 정립
BASE IMAGE COMPONENT (SERVING)
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING APPLICATION
MODEL 서비스 할 형태에 대한 정의 필요
Model을 서비스 할 형태에 대한 정의 필요
구축된 INFRA 환경 점검 및 향후 서비스 프로세스 확인
이를 토대로 MODEL을 SERVING할 수 있는 BASE IMAGE COMPONENT 구성
확정
다수의 모델을 서비스 시 Docker Image내의 세부 컴포넌트 구성 고려
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING
BASE IMAGE COMPONENT (SERVING)
APPLICATION
REST API
Embedding
서비스 방안
검토
서비스 방안 검토
Serving 후 Inference 방법에 대한 밀도 있는 확인
Inference Time에 대한 보장을 위한 Infra Resource Check
추론 속도에 따라 Model을 System에 Embed할 것인지 아니면 Rest API형태로
제공할 것인지 Network Latency나 서비스 형태에 따라 검토 필요
MODEL
DATA
TRAIN
TEST
VALID
PREPROCESS
TRAINING
BASE IMAGE COMPONENT (SERVING)
APPLICATION
모델 평가
방법
서비스 방안
검토학습 DATA
생성 방안
DATA 연동
Thank You

Contenu connexe

Tendances

악플분류 모델링 프로젝트
악플분류 모델링 프로젝트악플분류 모델링 프로젝트
악플분류 모델링 프로젝트DataScienceLab
 
Bert3q KorQuAD Finetuning NLP Challenge
Bert3q KorQuAD Finetuning NLP ChallengeBert3q KorQuAD Finetuning NLP Challenge
Bert3q KorQuAD Finetuning NLP ChallengeOverDeep
 
Enliple BERT-Small을 이용한 KorQuAD 모델
Enliple BERT-Small을 이용한 KorQuAD 모델Enliple BERT-Small을 이용한 KorQuAD 모델
Enliple BERT-Small을 이용한 KorQuAD 모델KwangHyeonPark
 
(Nlp)fine tuning 대회_참여기
(Nlp)fine tuning 대회_참여기(Nlp)fine tuning 대회_참여기
(Nlp)fine tuning 대회_참여기OverDeep
 
Machine learning boosting 20180424
Machine learning boosting 20180424Machine learning boosting 20180424
Machine learning boosting 20180424Changwook Jun
 
boosting 기법 이해 (bagging vs boosting)
boosting 기법 이해 (bagging vs boosting)boosting 기법 이해 (bagging vs boosting)
boosting 기법 이해 (bagging vs boosting)SANG WON PARK
 
한눈에 보는 머신러닝
한눈에 보는 머신러닝한눈에 보는 머신러닝
한눈에 보는 머신러닝주경 이
 
Improving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-TrainingImproving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-Trainingpko89403
 
Chapter 6 Deep feedforward networks - 2
Chapter 6 Deep feedforward networks - 2Chapter 6 Deep feedforward networks - 2
Chapter 6 Deep feedforward networks - 2KyeongUkJang
 
Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]Hyunwoo Kim
 
Machine Learning Foundations (a case study approach) 강의 정리
Machine Learning Foundations (a case study approach) 강의 정리Machine Learning Foundations (a case study approach) 강의 정리
Machine Learning Foundations (a case study approach) 강의 정리SANG WON PARK
 
Chapter 7 Regularization for deep learning - 2
Chapter 7 Regularization for deep learning - 2Chapter 7 Regularization for deep learning - 2
Chapter 7 Regularization for deep learning - 2KyeongUkJang
 
Sw개발 hw제작설계서 임베부스러기
Sw개발 hw제작설계서 임베부스러기Sw개발 hw제작설계서 임베부스러기
Sw개발 hw제작설계서 임베부스러기21HG020
 
Ml for 정형데이터
Ml for 정형데이터Ml for 정형데이터
Ml for 정형데이터JEEHYUN PAIK
 
Metric learning 세미나
Metric learning 세미나Metric learning 세미나
Metric learning 세미나ssuser198c901
 
[아꿈사] The C++ Programming Language 13장 템플릿
[아꿈사] The C++ Programming Language 13장 템플릿[아꿈사] The C++ Programming Language 13장 템플릿
[아꿈사] The C++ Programming Language 13장 템플릿해강
 
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical MethodologyKyeongUkJang
 

Tendances (20)

악플분류 모델링 프로젝트
악플분류 모델링 프로젝트악플분류 모델링 프로젝트
악플분류 모델링 프로젝트
 
Bert3q KorQuAD Finetuning NLP Challenge
Bert3q KorQuAD Finetuning NLP ChallengeBert3q KorQuAD Finetuning NLP Challenge
Bert3q KorQuAD Finetuning NLP Challenge
 
Enliple BERT-Small을 이용한 KorQuAD 모델
Enliple BERT-Small을 이용한 KorQuAD 모델Enliple BERT-Small을 이용한 KorQuAD 모델
Enliple BERT-Small을 이용한 KorQuAD 모델
 
(Nlp)fine tuning 대회_참여기
(Nlp)fine tuning 대회_참여기(Nlp)fine tuning 대회_참여기
(Nlp)fine tuning 대회_참여기
 
Machine learning boosting 20180424
Machine learning boosting 20180424Machine learning boosting 20180424
Machine learning boosting 20180424
 
boosting 기법 이해 (bagging vs boosting)
boosting 기법 이해 (bagging vs boosting)boosting 기법 이해 (bagging vs boosting)
boosting 기법 이해 (bagging vs boosting)
 
한눈에 보는 머신러닝
한눈에 보는 머신러닝한눈에 보는 머신러닝
한눈에 보는 머신러닝
 
Ai nlp challenge
Ai nlp challengeAi nlp challenge
Ai nlp challenge
 
Improving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-TrainingImproving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-Training
 
Chapter 6 Deep feedforward networks - 2
Chapter 6 Deep feedforward networks - 2Chapter 6 Deep feedforward networks - 2
Chapter 6 Deep feedforward networks - 2
 
Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]
 
광고 CTR 예측
광고 CTR 예측광고 CTR 예측
광고 CTR 예측
 
Machine Learning Foundations (a case study approach) 강의 정리
Machine Learning Foundations (a case study approach) 강의 정리Machine Learning Foundations (a case study approach) 강의 정리
Machine Learning Foundations (a case study approach) 강의 정리
 
Chapter 7 Regularization for deep learning - 2
Chapter 7 Regularization for deep learning - 2Chapter 7 Regularization for deep learning - 2
Chapter 7 Regularization for deep learning - 2
 
Sw개발 hw제작설계서 임베부스러기
Sw개발 hw제작설계서 임베부스러기Sw개발 hw제작설계서 임베부스러기
Sw개발 hw제작설계서 임베부스러기
 
NN and PDF
NN and PDFNN and PDF
NN and PDF
 
Ml for 정형데이터
Ml for 정형데이터Ml for 정형데이터
Ml for 정형데이터
 
Metric learning 세미나
Metric learning 세미나Metric learning 세미나
Metric learning 세미나
 
[아꿈사] The C++ Programming Language 13장 템플릿
[아꿈사] The C++ Programming Language 13장 템플릿[아꿈사] The C++ Programming Language 13장 템플릿
[아꿈사] The C++ Programming Language 13장 템플릿
 
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
 

Similaire à Create a solution including deep learning models

디자인패턴
디자인패턴디자인패턴
디자인패턴진화 손
 
딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투Ubuntu Korea Community
 
Enhanced ai platform
Enhanced ai platformEnhanced ai platform
Enhanced ai platformTae Young Lee
 
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)Devgear
 
검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론Tae Young Lee
 
머신러닝과 사이킷런의 이해
머신러닝과 사이킷런의 이해머신러닝과 사이킷런의 이해
머신러닝과 사이킷런의 이해철민 권
 
Patterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworksPatterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworksSunuk Park
 
분석과 설계
분석과 설계분석과 설계
분석과 설계Haeil Yi
 
파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)SK(주) C&C - 강병호
 
Microsoft loves communities - Korea DevRel Team
Microsoft loves communities - Korea DevRel TeamMicrosoft loves communities - Korea DevRel Team
Microsoft loves communities - Korea DevRel TeamIan Choi
 
01.표준프레임워크개요
01.표준프레임워크개요01.표준프레임워크개요
01.표준프레임워크개요Hankyo
 
B6 문맥인식기술활용
B6 문맥인식기술활용B6 문맥인식기술활용
B6 문맥인식기술활용NAVER D2
 
개발이 테스트를 만났을 때(Shift left testing)
개발이 테스트를 만났을 때(Shift left testing)개발이 테스트를 만났을 때(Shift left testing)
개발이 테스트를 만났을 때(Shift left testing)SangIn Choung
 
데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지
데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지
데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지Devgear
 
우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?
우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?
우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?Kyoungsoo Jeon
 
소프트웨어설계론
소프트웨어설계론소프트웨어설계론
소프트웨어설계론JeongDong Kim
 
Recommendation System History
Recommendation System HistoryRecommendation System History
Recommendation System HistoryTae Young Lee
 
오픈소스 소프트웨어 성능 최적화 보고서 6장
오픈소스 소프트웨어 성능 최적화 보고서 6장오픈소스 소프트웨어 성능 최적화 보고서 6장
오픈소스 소프트웨어 성능 최적화 보고서 6장JamGun
 

Similaire à Create a solution including deep learning models (20)

디자인패턴
디자인패턴디자인패턴
디자인패턴
 
딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투
 
Enhanced ai platform
Enhanced ai platformEnhanced ai platform
Enhanced ai platform
 
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
 
검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론
 
Understanding MLOps
Understanding MLOpsUnderstanding MLOps
Understanding MLOps
 
머신러닝과 사이킷런의 이해
머신러닝과 사이킷런의 이해머신러닝과 사이킷런의 이해
머신러닝과 사이킷런의 이해
 
Patterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworksPatterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworks
 
분석과 설계
분석과 설계분석과 설계
분석과 설계
 
파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)
 
Microsoft loves communities - Korea DevRel Team
Microsoft loves communities - Korea DevRel TeamMicrosoft loves communities - Korea DevRel Team
Microsoft loves communities - Korea DevRel Team
 
01.표준프레임워크개요
01.표준프레임워크개요01.표준프레임워크개요
01.표준프레임워크개요
 
B6 문맥인식기술활용
B6 문맥인식기술활용B6 문맥인식기술활용
B6 문맥인식기술활용
 
Openface
OpenfaceOpenface
Openface
 
개발이 테스트를 만났을 때(Shift left testing)
개발이 테스트를 만났을 때(Shift left testing)개발이 테스트를 만났을 때(Shift left testing)
개발이 테스트를 만났을 때(Shift left testing)
 
데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지
데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지
데이터아키텍트가 비즈니스 업무 부서와 협업하기 위해 알아야 할 다섯가지
 
우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?
우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?
우리 회사가 Microsoft Teams를 잘 도입하려면 어떻게 해야 할까요?
 
소프트웨어설계론
소프트웨어설계론소프트웨어설계론
소프트웨어설계론
 
Recommendation System History
Recommendation System HistoryRecommendation System History
Recommendation System History
 
오픈소스 소프트웨어 성능 최적화 보고서 6장
오픈소스 소프트웨어 성능 최적화 보고서 6장오픈소스 소프트웨어 성능 최적화 보고서 6장
오픈소스 소프트웨어 성능 최적화 보고서 6장
 

Plus de Tae Young Lee

LLMs Service that provides what users want to know
LLMs Service that provides what users want to knowLLMs Service that provides what users want to know
LLMs Service that provides what users want to knowTae Young Lee
 
Exploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsExploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsTae Young Lee
 
LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드Tae Young Lee
 
검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPTTae Young Lee
 
The Deep Learning Compiler
The Deep Learning CompilerThe Deep Learning Compiler
The Deep Learning CompilerTae Young Lee
 
History of Vision AI
History of Vision AIHistory of Vision AI
History of Vision AITae Young Lee
 
Real estate trust solution
Real estate trust solutionReal estate trust solution
Real estate trust solutionTae Young Lee
 
Deep learning financial product recommendation model
Deep learning financial product recommendation modelDeep learning financial product recommendation model
Deep learning financial product recommendation modelTae Young Lee
 
Deep Learning Through Various Processes
Deep Learning Through Various ProcessesDeep Learning Through Various Processes
Deep Learning Through Various ProcessesTae Young Lee
 
금융분야 취업을 위한 커리어 설계
금융분야 취업을 위한 커리어 설계금융분야 취업을 위한 커리어 설계
금융분야 취업을 위한 커리어 설계Tae Young Lee
 
클라우드를 활용한 딥러닝 활용 사례
클라우드를 활용한 딥러닝 활용 사례클라우드를 활용한 딥러닝 활용 사례
클라우드를 활용한 딥러닝 활용 사례Tae Young Lee
 
금융의 역사를 통해 본 딥러닝의 함정
금융의 역사를 통해 본 딥러닝의 함정금융의 역사를 통해 본 딥러닝의 함정
금융의 역사를 통해 본 딥러닝의 함정Tae Young Lee
 
데이터의 관점으로 바라본 의료 딥러닝
데이터의 관점으로 바라본 의료 딥러닝데이터의 관점으로 바라본 의료 딥러닝
데이터의 관점으로 바라본 의료 딥러닝Tae Young Lee
 

Plus de Tae Young Lee (20)

LLMs Service that provides what users want to know
LLMs Service that provides what users want to knowLLMs Service that provides what users want to know
LLMs Service that provides what users want to know
 
Exploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsExploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMs
 
LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드
 
검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT
 
PaLM Paper Review
PaLM Paper ReviewPaLM Paper Review
PaLM Paper Review
 
The Deep Learning Compiler
The Deep Learning CompilerThe Deep Learning Compiler
The Deep Learning Compiler
 
History of Vision AI
History of Vision AIHistory of Vision AI
History of Vision AI
 
Aws architecture
Aws architectureAws architecture
Aws architecture
 
Nvidia architecture
Nvidia architectureNvidia architecture
Nvidia architecture
 
Ai based on gpu
Ai based on gpuAi based on gpu
Ai based on gpu
 
Real estate trust solution
Real estate trust solutionReal estate trust solution
Real estate trust solution
 
Bayesian learning
Bayesian learningBayesian learning
Bayesian learning
 
Deep learning financial product recommendation model
Deep learning financial product recommendation modelDeep learning financial product recommendation model
Deep learning financial product recommendation model
 
Deep Learning Through Various Processes
Deep Learning Through Various ProcessesDeep Learning Through Various Processes
Deep Learning Through Various Processes
 
Jenkins in finance
Jenkins in financeJenkins in finance
Jenkins in finance
 
HistoryOfCNN
HistoryOfCNNHistoryOfCNN
HistoryOfCNN
 
금융분야 취업을 위한 커리어 설계
금융분야 취업을 위한 커리어 설계금융분야 취업을 위한 커리어 설계
금융분야 취업을 위한 커리어 설계
 
클라우드를 활용한 딥러닝 활용 사례
클라우드를 활용한 딥러닝 활용 사례클라우드를 활용한 딥러닝 활용 사례
클라우드를 활용한 딥러닝 활용 사례
 
금융의 역사를 통해 본 딥러닝의 함정
금융의 역사를 통해 본 딥러닝의 함정금융의 역사를 통해 본 딥러닝의 함정
금융의 역사를 통해 본 딥러닝의 함정
 
데이터의 관점으로 바라본 의료 딥러닝
데이터의 관점으로 바라본 의료 딥러닝데이터의 관점으로 바라본 의료 딥러닝
데이터의 관점으로 바라본 의료 딥러닝
 

Create a solution including deep learning models

  • 2. 솔루션의 정의 솔루션이란 어떤 특정한 상황에 대한 해결책으로 사용자의 요구에 따라 프로그램과 관련된 문제들을 처리해주는 하드웨어, 소프트웨어, 기술 등을 가리킨다. ( 잊지 말아야 할 부분 ) 모델은 모델일 뿐이다. 모델은 솔루션이 아니다. 해결책을 찾아가는 과정이다. 이 점을 이해하지 못한다면 딥러닝 모델 솔루션은 허상일 뿐이다.
  • 3. 딥러닝 모델을 고객사에 납품하기 위해서는 고객사의 환경을 체크해야 한다 1> 사내 Private 환경 구성 여부 확인 2> 모델 Training 시간을 고려하여 고객사 Infra Resource 확인 3> Service를 위한 Serving구성 제약 요건 확인 4> 거버넌스 확인
  • 4. 지적 재산권 보호 소스 암호화 Docker Image내의 소스 위치를 해 놓고 Path를 알 수 없게 aliasing과 소스 난독화 학습 시 base image로 반입된 IDE 환경 내에서 entrypoint를 잡고 Training할 수 있도록 학습 환경 구성 모델 암호화 PyTorch로 구현된 모델의 경우 .pt → .enc로 Encryption PyTorch에서는 모델을 저장할 때 .pt 또는 .pth 확장자를 사용하는 것이 일반적인 규칙 .enc 파일 확장자는 암호화 된 파일있는 UUenconded 형식의 파일에 의해 사용됨 이것은 이러한 ENC 파일이 보호 된 데이터를 포함하고,이 형식으로 저장 수단의 데이터이므로 무단 보거나 복사를 방지
  • 7. DATA 연동 확인 기존 DATA PROCESS 확인 DATA를 보유하고 있는 Legacy System 과의 INTERFACE 방안 확인 1> 일 단위 데이터 건수 확인 2> Legacy System 부하 점검 3> Network Latency 확인
  • 8. MODEL DATA TRAIN TEST VALID PREPROCESS TRAINING BASE IMAGE COMPONENT (SERVING) APPLICATION 학습 DATA 생성 방안
  • 9. 학습 데이터의 상태를 확인 필요 대부분의 학습 데이터는 Legacy System에 모델을 태우기 적합하지 않은 형태로 저장되어 있다. 그래서 POC를 통해 Data의 형태를 이해하고 어떤 모델링 기법을 적용해야 할지 서로 논의하고 확정해야 하는 작업이 필요하다.
  • 10. 학습 DATA 생성 방안 검토 모델에 적합한 데이터 생성 방안 검토 모델의 파이프 라인 구축에 필요한 적절한 학습 데이터 분배 및 할당 필요 학습 DATA형태 (이미지, 텍스트)에 따라 사전 작업 필요 - 텍스트의 경우 corpus 구성 및 tagging방안에 대한 검토 → 카테고리 정립 - 이미지의 경우 Annotation 범위 확정 후 추출해야 할 키 값에 대한 사전 정의 필요
  • 12. TRAINING 방법 확인 학습을 할 수 있는 환경을 보유하고 있는 지 여부 모델 운영에 대한 정책에 대한 확인 대략적인 학습 소요 시간 추정 및 학습에 바탕이 되는 INFRA SPEC 검토
  • 13. MODEL DATA TRAIN TEST VALID PREPROCESS TRAINING BASE IMAGE COMPONENT (SERVING) APPLICATION 모델 평가 방법
  • 14. Model Evaluation 방법 합의 초기 모델에 대한 평가 수행을 통한 평가 가이드 라인 정립
  • 15. BASE IMAGE COMPONENT (SERVING) MODEL DATA TRAIN TEST VALID PREPROCESS TRAINING APPLICATION MODEL 서비스 할 형태에 대한 정의 필요
  • 16. Model을 서비스 할 형태에 대한 정의 필요 구축된 INFRA 환경 점검 및 향후 서비스 프로세스 확인 이를 토대로 MODEL을 SERVING할 수 있는 BASE IMAGE COMPONENT 구성 확정 다수의 모델을 서비스 시 Docker Image내의 세부 컴포넌트 구성 고려
  • 17. MODEL DATA TRAIN TEST VALID PREPROCESS TRAINING BASE IMAGE COMPONENT (SERVING) APPLICATION REST API Embedding 서비스 방안 검토
  • 18. 서비스 방안 검토 Serving 후 Inference 방법에 대한 밀도 있는 확인 Inference Time에 대한 보장을 위한 Infra Resource Check 추론 속도에 따라 Model을 System에 Embed할 것인지 아니면 Rest API형태로 제공할 것인지 Network Latency나 서비스 형태에 따라 검토 필요
  • 19. MODEL DATA TRAIN TEST VALID PREPROCESS TRAINING BASE IMAGE COMPONENT (SERVING) APPLICATION 모델 평가 방법 서비스 방안 검토학습 DATA 생성 방안 DATA 연동