2. ЭКОСИСТЕМА?
«Экосистема» как архитектура конкретных решений, использующих Hadoop
Тиражируемые ИТ-решения, связанные с Hadoop
«Экосистема» программных продуктов, стыкующихсяс Hadoop(как проектов фонда Apache, так и сторонних)
Готовые сборки «экосистем» – дистриубитвы Hadoop
Готовые услуги по предоставлению «экосистем» – «Hadoopкак услуга»
Готовые аппаратно- программные «экосистемы»
9. ДРУГИЕ ДИСТРИБУТИВЫ И «ПРЕДДИСТРИБУТИВЫ»
IBM
выпускается
EMC (Pivotal)
выпускается
Intel
закрыт(в пользу Cloudera)
Yahoo
закрыт [в пользу Hortonworks]
Дистрибутивы Linux
Red Hat,Fedora, CentOS
SuSE
Debian, Ubuntu
Apache BigTop
.rpm
.deb
рецепты для Vagrant, docker…
11. ОСНОВНЫЕ ПРОВАЙДЕРЫ
•На базе MapR
•Интегрирован с S3
AmazonElastic MapReduce
•На базе Hortonworks
•Интегрирован с SwiftFS
Rackspace
•На базе Hortonworks
Microsoft Azure
•BigInsights
IBM Bluemix
19. Λ-АРХИТЕКТУРА
Все данные
Свежие данные
Предобработанныеданные
слой раздачи
…
пакетный слой
быстрый слой
Данные реального времени
Поток данных
Инкремент данных
Комплексный агрегат
Частичный агрегат
Частичный агрегат
Пакетные представления
Представление реального времени
MapReduce
Storm
HDFS
Flume
Flume
HBase
Свежие данные подпадают одновременно в слои пакетной и быстрой обработки и комбинируются в отдельном слое раздачи
23. Applicance
Программно- аппаратный комплекс
Комплекс
Bare-metal
«Голое железо»
Box
Узел
Chunk
Блок данных
Commodity hardware
Оборудование массового класса
Curring
Каррирование
A…J
Data node
Узел данных
Deployment
Развёртывание
Direct- attached storage
Устройство хранения прямого подключения
Engine
Механизм
Движок
Job
Задание
Job tracker
Трекерзаданий
24. Machine
Машина
Map
[?]
Mapper
[?]
Mapping
Соответствие
Master node
Главный узел
Multi- tennancy
Мульти- арендность
M…R
Name node
Узел имён
Namespace
Пространство имён
Node
Узел
Realtime
…реального времени
Reduce
Свёртка
Сведение
Reducer
Свёртка
25. S…W
Shard
Узел [распределённого хранения]
Shuffle
Тасовка
Slave node
Подчинённый узел
Slot
Слот
Stack
Стек
Task
Задача
Task tracker
Трекерзадач
Trail
След
Worker
Исполнитель
Worker node
Узел исполнения
Workflow
Поток операций
Workload
Нагрузка