Big data hadoop rdbms

Big Data MapReduce vs. RDBMS Arjen P. de Vries [email_address] Centrum Wiskunde & Informatica Delft University of Technology Spinque B.V.

Context ,[object Object],[object Object],[object Object]

Shared-nothing Architecture ,[object Object],[object Object]

Programming Model ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object]

Comparison (on 100-node cluster) http://database.cs.brown.edu/projects/mapreduce-vs-dbms/ Hadoop DBMS-X Vertica Hadoop/ DBMS-X Hadoop/ Vertica Grep 284s 194s 108s 1.5 2.6 Web Log >1Ks 740s 268s 1.6 4.3 Join >1Ks 32s 55s 36.3 21

Details Comparison Study ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Details Comparison Study ,[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ease-of-Use ,[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object],[object Object]

Hybrid Solution? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Desiderata ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HadoopDB ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HadoopDB ,[object Object],[object Object],[object Object],[object Object]

Data Loader ,[object Object],[object Object],[object Object],[object Object]

Planner (SMS) ,[object Object],[object Object],[object Object],[object Object]

SELECT YEAR(saleDate), SUM(revenue) FROM SALES GROUP BY YEAR(saleDate)

Planner (SMS) ,[object Object],[object Object],[object Object]

Comparison ,[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop / Hive ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Hadapt ,[object Object],[object Object],[object Object],[object Object],[object Object]

Two orders of magnitude ,[object Object],[object Object],[object Object],[object Object]

Dutch Database History!!! ,[object Object],[object Object],[object Object]

Vectorwise ,[object Object],[object Object],[object Object],[object Object]

Improved Query Plans ,[object Object],[object Object],[object Object]

Improved Query Plans ,[object Object],[object Object],[object Object],[object Object]

Join in Hadoop ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Improved Query Plans ,[object Object],[object Object],[object Object],[object Object],[object Object]

Broadcast & Directed Joins ,[object Object],[object Object],[object Object]

Broadcast Join ,[object Object],[object Object],[object Object],[object Object]

Directed Join ,[object Object]

Semi-join ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Results ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Results ,[object Object],[object Object],[object Object],[object Object],[object Object]

Conclusion ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Conclusion ,[object Object],[object Object],[object Object]

Information Science ,[object Object],[object Object]

References ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Big data hadoop rdbms

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Big data hadoop rdbms

Similaire à Big data hadoop rdbms (20)

Plus de Arjen de Vries

Plus de Arjen de Vries (20)

Dernier

Dernier (20)

Big data hadoop rdbms