Amazon SageMaker와 Athena를 활용한 대용량 자연어 처리 및 머신러닝 기법
머신러닝에 활용하고자 하는 빅데이터가 있을 때 실무에서 활용할 수 있는 S3와 Athena를 이용한 데이터 분류 및 전처리 기법과 SageMaker가 제공하는 다양한 1st-party 알고리즘들을 활용하여 데이터에 대한 통찰 및 가치를 창출하는 예를 소개합니다. 실제 적용 데모에서는 Amazon이 공개적으로 제공하는 1억 3천만건 이상의 상품 리뷰 데이터 셋에 대해 SageMaker의Notebook 상에서 AWS SDK를 이용한 Athena 서비스 연결 방법, 자연어 처리 및 머신 러닝 적용 방법 등을 살펴 봅니다.