SlideShare une entreprise Scribd logo
1  sur  12
Аппаратное ускорение аналитики в
больших данных
Анатолий Левенчук
BigData
15 сентября 2017г.
[Тут обычно делают нудный рассказ, почему
для аналитики больших данных нужна
большая скорость вычислений]
• Во-первых, …
• Во-вторых, …
• …
• Лучше быть здоровым и богатым, чем
бедным и больным.
С быстрыми (x1000) и
дешёвыми (x40)
вычислениями
невозможное становится
возможным.
2
Типичный график сравнения производительности
с участием аппаратного ускорения
https://www.mapd.com/
Платформенный стек аналитики больших данных
3
Платформа приложений
АНАЛИТИКА БОЛЬШИХ ДАННЫХ ТУТ
Аналитические фреймворки
СУБД
CPU Оптимизаторы (драйверы)
GPU/ FPGA
Устройства
GPU/FPGA
Подрывноеобепечение
Подрывнойспрос
Спасибо играющим в компьютерные игры за их подрывной
спрос, который дал нам такое подрывное обеспечение как GPU
COMMODITY
Кто работает с FPGA? Реляционщики!
Ryft
Netezza
Swarm64
4
Scalable Data Accelerator (SDA)
PCIe card: от x10 на
IBM PureData System for Analytics
Ryft One, Ryft Cloud --up to x200
IBM PureData System for Analytics
Технология Netezza (c 1999 года): The appliance integrates through
standard ODBC, JDBC and OLE DB interfaces. FPGAs are used for data
decompression, data filtering and early SQL projections and restrictions.
5https://www.ibm.com/us-en/marketplace/puredata-system-for-analytics/
Неожиданность: GPU  GPGPU
6
• 2009 – Fermi architecture у NVIDIA, CUDA-архитектура
• 2011 – придумали ускорять deep learning на CUDA
• 2012 – придумали ускорять базы данных на CUDA
• 2017 – Volta architecture: 5120 CUDA Cores, 16GB HBM2@900GB/s, 300GB/s NVLink
• Бонус: интеграция с IBM Power8 (OpenPOWER): brings x3 faster moving data
s
TESLA V100
Где данные?!
https://db-engines.com/en/ranking_categories 7
Интересны:
• реляционные (80% всего)
• графовые (700% роста за 5 лет)
GPU и реляционные базы данных
MapD
PG-Strom
Kinetica
SQReam
Brytlyt
BlazingDB 8
In-database analytics:
• Deep learning in-database: уже есть!
Очень быстрые:
• x300 по сравнению с «традиционными»
• x50 по сравнению с in-memory
• x5 по сравнению с кластерами
https://www.kinetica.com/blog/tensorflow-distributed-deep-learning/
Графовые базы: становятся уместны
9
Графовые базы:
• Лучше реляционных, но
• Плохо масштабируются на CPU
• Медленней реляционных x10
С GPU они:
• быстрее CPU решений x700-x1800
• x40 дешевле на 1G traverse
Edges/sec
https://www.blazegraph.com
Худшие продукты на рынке?
• We verified these technologies can provide faster
queries with cheaper infrastructures than usual CPU-
based alternatives. Specially for typical “Select …
where … group by…” clauses with variable filters and
aggregations. However funcionality is actually quite
limited and not enough robust for our requirements.
And we’ve got significant problems with complex
queries.
https://labs.beeva.com/gpus-and-analytical-databases-the-beginning-of-a-beautiful-friendship-8f5e590601c5
10
Дилемма инноватора: бойтесь худших продуктов!
(Clayton Christensen из Гарварда)
11
Х
а
р
а
к
т
е
р
и
с
т
и
к
и
Время
Характеристики
лучших продуктов
На рынке
Характеристики
худших продуктов
на рынке
http://web.mit.edu/6.933/www/Fall2000/teradyne/clay.html
Спасибо за внимание
Анатолий Левенчук,
http://ailev.ru
ailev@asmp.msk.su
12

Contenu connexe

En vedette

А.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийА.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийAnatoly Levenchuk
 
А.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейА.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейAnatoly Levenchuk
 
А.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесА.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесAnatoly Levenchuk
 
А.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образованияА.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образованияAnatoly Levenchuk
 
Организационная инженерия
Организационная инженерияОрганизационная инженерия
Организационная инженерияAnatoly Levenchuk
 
Безлюдные организации и их проблемы
Безлюдные организации и их проблемыБезлюдные организации и их проблемы
Безлюдные организации и их проблемыAnatoly Levenchuk
 
Системное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаСистемное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаAnatoly Levenchuk
 

En vedette (8)

А.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийА.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятий
 
А.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейА.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурацией
 
А.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесА.Левенчук -- системный фитнес
А.Левенчук -- системный фитнес
 
Future of Engineering
Future of EngineeringFuture of Engineering
Future of Engineering
 
А.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образованияА.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образования
 
Организационная инженерия
Организационная инженерияОрганизационная инженерия
Организационная инженерия
 
Безлюдные организации и их проблемы
Безлюдные организации и их проблемыБезлюдные организации и их проблемы
Безлюдные организации и их проблемы
 
Системное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаСистемное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курса
 

Similaire à А.Левенчук -- аппаратное ускорение аналитики в BigData

Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследованийMicrosoft
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)Ontico
 
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиАндрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиIBS
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningSkolkovo Robotics Center
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
DataCore case studies
DataCore case studies DataCore case studies
DataCore case studies korn_aaf
 
Гиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlexГиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlexCisco Russia
 
Платформа для бизнес-приложений SAP HANA на основе решений Cisco
 Платформа для бизнес-приложений SAP HANA на основе решений Cisco Платформа для бизнес-приложений SAP HANA на основе решений Cisco
Платформа для бизнес-приложений SAP HANA на основе решений CiscoCisco Russia
 
Etegro, Сучков Игорь
Etegro, Сучков ИгорьEtegro, Сучков Игорь
Etegro, Сучков ИгорьDiana Mokhina
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровVsevolod Shabad
 
Машины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеМашины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеAndrei Nikolaenko
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data MATLAB
 
навигатор новые решения в новых условиях
навигатор новые решения в новых условияхнавигатор новые решения в новых условиях
навигатор новые решения в новых условияхNick Turunov
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреDEPO Computers
 
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellCloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellClouds NN
 
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...DEPO Computers
 
С. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложенийС. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложенийExpolink
 
Гиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVityГиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVityКРОК
 

Similaire à А.Левенчук -- аппаратное ускорение аналитики в BigData (20)

Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследований
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
 
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиАндрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learning
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
 
DataCore case studies
DataCore case studies DataCore case studies
DataCore case studies
 
Обзор HP Vertica
Обзор HP VerticaОбзор HP Vertica
Обзор HP Vertica
 
Гиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlexГиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlex
 
Платформа для бизнес-приложений SAP HANA на основе решений Cisco
 Платформа для бизнес-приложений SAP HANA на основе решений Cisco Платформа для бизнес-приложений SAP HANA на основе решений Cisco
Платформа для бизнес-приложений SAP HANA на основе решений Cisco
 
Etegro, Сучков Игорь
Etegro, Сучков ИгорьEtegro, Сучков Игорь
Etegro, Сучков Игорь
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеров
 
Машины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеМашины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрение
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data
 
навигатор новые решения в новых условиях
навигатор новые решения в новых условияхнавигатор новые решения в новых условиях
навигатор новые решения в новых условиях
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
 
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellCloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
 
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
 
С. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложенийС. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложений
 
Гиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVityГиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVity
 

Plus de Anatoly Levenchuk

Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Anatoly Levenchuk
 
Open-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteOpen-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteAnatoly Levenchuk
 
Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышлениеAnatoly Levenchuk
 
А.Левенчук -- развитие личности
А.Левенчук -- развитие личностиА.Левенчук -- развитие личности
А.Левенчук -- развитие личностиAnatoly Levenchuk
 
А.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоА.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоAnatoly Levenchuk
 
А.Левенчук -- SysArchi
А.Левенчук -- SysArchiА.Левенчук -- SysArchi
А.Левенчук -- SysArchiAnatoly Levenchuk
 
А.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииА.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииAnatoly Levenchuk
 
А.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеА.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеAnatoly Levenchuk
 
А.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиА.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиAnatoly Levenchuk
 
А.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииА.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииAnatoly Levenchuk
 
Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)Anatoly Levenchuk
 
И.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAMИ.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAMAnatoly Levenchuk
 
М.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышлениеМ.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышлениеAnatoly Levenchuk
 
А.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышленияА.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышленияAnatoly Levenchuk
 
А.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронетА.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронетAnatoly Levenchuk
 
Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling Anatoly Levenchuk
 
А.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозговА.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозговAnatoly Levenchuk
 

Plus de Anatoly Levenchuk (17)

Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)
 
Open-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteOpen-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM Institute
 
Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышление
 
А.Левенчук -- развитие личности
А.Левенчук -- развитие личностиА.Левенчук -- развитие личности
А.Левенчук -- развитие личности
 
А.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоА.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерство
 
А.Левенчук -- SysArchi
А.Левенчук -- SysArchiА.Левенчук -- SysArchi
А.Левенчук -- SysArchi
 
А.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииА.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерии
 
А.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеА.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышление
 
А.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиА.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личности
 
А.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииА.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организации
 
Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)
 
И.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAMИ.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAM
 
М.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышлениеМ.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышление
 
А.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышленияА.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышления
 
А.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронетА.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронет
 
Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling
 
А.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозговА.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозгов
 

А.Левенчук -- аппаратное ускорение аналитики в BigData

  • 1. Аппаратное ускорение аналитики в больших данных Анатолий Левенчук BigData 15 сентября 2017г.
  • 2. [Тут обычно делают нудный рассказ, почему для аналитики больших данных нужна большая скорость вычислений] • Во-первых, … • Во-вторых, … • … • Лучше быть здоровым и богатым, чем бедным и больным. С быстрыми (x1000) и дешёвыми (x40) вычислениями невозможное становится возможным. 2 Типичный график сравнения производительности с участием аппаратного ускорения https://www.mapd.com/
  • 3. Платформенный стек аналитики больших данных 3 Платформа приложений АНАЛИТИКА БОЛЬШИХ ДАННЫХ ТУТ Аналитические фреймворки СУБД CPU Оптимизаторы (драйверы) GPU/ FPGA Устройства GPU/FPGA Подрывноеобепечение Подрывнойспрос Спасибо играющим в компьютерные игры за их подрывной спрос, который дал нам такое подрывное обеспечение как GPU COMMODITY
  • 4. Кто работает с FPGA? Реляционщики! Ryft Netezza Swarm64 4 Scalable Data Accelerator (SDA) PCIe card: от x10 на IBM PureData System for Analytics Ryft One, Ryft Cloud --up to x200
  • 5. IBM PureData System for Analytics Технология Netezza (c 1999 года): The appliance integrates through standard ODBC, JDBC and OLE DB interfaces. FPGAs are used for data decompression, data filtering and early SQL projections and restrictions. 5https://www.ibm.com/us-en/marketplace/puredata-system-for-analytics/
  • 6. Неожиданность: GPU  GPGPU 6 • 2009 – Fermi architecture у NVIDIA, CUDA-архитектура • 2011 – придумали ускорять deep learning на CUDA • 2012 – придумали ускорять базы данных на CUDA • 2017 – Volta architecture: 5120 CUDA Cores, 16GB HBM2@900GB/s, 300GB/s NVLink • Бонус: интеграция с IBM Power8 (OpenPOWER): brings x3 faster moving data s TESLA V100
  • 7. Где данные?! https://db-engines.com/en/ranking_categories 7 Интересны: • реляционные (80% всего) • графовые (700% роста за 5 лет)
  • 8. GPU и реляционные базы данных MapD PG-Strom Kinetica SQReam Brytlyt BlazingDB 8 In-database analytics: • Deep learning in-database: уже есть! Очень быстрые: • x300 по сравнению с «традиционными» • x50 по сравнению с in-memory • x5 по сравнению с кластерами https://www.kinetica.com/blog/tensorflow-distributed-deep-learning/
  • 9. Графовые базы: становятся уместны 9 Графовые базы: • Лучше реляционных, но • Плохо масштабируются на CPU • Медленней реляционных x10 С GPU они: • быстрее CPU решений x700-x1800 • x40 дешевле на 1G traverse Edges/sec https://www.blazegraph.com
  • 10. Худшие продукты на рынке? • We verified these technologies can provide faster queries with cheaper infrastructures than usual CPU- based alternatives. Specially for typical “Select … where … group by…” clauses with variable filters and aggregations. However funcionality is actually quite limited and not enough robust for our requirements. And we’ve got significant problems with complex queries. https://labs.beeva.com/gpus-and-analytical-databases-the-beginning-of-a-beautiful-friendship-8f5e590601c5 10
  • 11. Дилемма инноватора: бойтесь худших продуктов! (Clayton Christensen из Гарварда) 11 Х а р а к т е р и с т и к и Время Характеристики лучших продуктов На рынке Характеристики худших продуктов на рынке http://web.mit.edu/6.933/www/Fall2000/teradyne/clay.html
  • 12. Спасибо за внимание Анатолий Левенчук, http://ailev.ru ailev@asmp.msk.su 12