SlideShare une entreprise Scribd logo
1  sur  16
Büyük Veri (Big data)
Hakkımda
 İstanbul Ünv . Bilgisayar Müh
 8+ Java , Java EE
 3+ Hadoop,Spark,Pig,Hive,Oozie
 Big Data Developer (Comodo)
İçerik
• Büyük Verilerin Özellikleri
• Büyük Verilerin saklanma yöntemleri
• Hadoop Nedir ve Temel Bileşenleri (HDFS , MapReduce)?
• Apache Spark , Apache Kafka , MongoDB
• Kullanım Senaryoları
• Uzmanlaşmak için tavsiyeler
Büyük Verilerin Özellikleri
Veri Miktarı (Volume)
◦ Boeing 737 uçağı tek bir uçuşta 240 terabyte veri üretmektedir
Veri hızı (Velocity)
◦ Bir dakika içerisinde 204 milyon e-mail , 1.8 milyon Facebook like , 278000 tweet işlemi yapılmaktadır
Veri çeşitliliği (Variety)
◦ Klasik veritabanı sistemleri küçük boyutta düzenli yapıdaki veriler için tasarlanmıştır . Oysa gerçek
hayatta resim , ses , konum , log , mekan verileri sıkça karşımıza çıkmaktadır
Verinin değerli olması (Value)
◦ Amazon firması tavsiye sistemi ile satış oranlarını %29 artırmıştır
Büyük verilerin saklanma yöntemleri
Verilerin karakteristiği ve işlenme yöntemine göre bir saklama sistemi kullanılır
Wide Column Stores/Column Family database
◦ HBase , Cassandra
◦ Buradaki yapı klasik veritabanına benzer bir şekilde tablo , kolon ve satır yapısı vardır.
Document Store
◦ ElasticSearch , MongoDB
◦ Veriler belirli bir şema yapısına sahip olmadan kaydedilir . JSON gibi
Key Value Store
◦ Redis , MemcacheDB
Hadoop Nedir ?
Hadoop , büyük veri kümeleri ile birden fazla makinada paralel olarak işlem yapmamızı sağlayan
Java ile yazılmış açık kaynak kodlu kütüphanedir
Hadoop Hdfs Nedir ?
Hadoop içerisinde büyük verileri sakladığımız bileşene HDFS (Hadoop Distributed File System)
denir
Hadoop MapReduce Nedir?
Hadoop içerisinde büyük verileri paralel olarak işleyebileceğimiz bileşene MapReduce denir .
Apache Spark
Spark büyük verileri işlemek için kullanılan bir kütüphanedir
Apache Kafka ile mesajlasma sistemleri
Apache Kafka büyük veri akışını düşük bir gecikme zamanı ile sağlayan açık kaynak kodlu bir
kütüphanedir
MongoDB
Mongo DB verileri JSON tabanlı kaydeden açık kaynak kodlu ilişkisel olmayan bir veritabanıdır
Kullanım Senaryoları
Örnek Analizler
 Son bir saat içerisinde 50 den fazla reklama tıklayan kullanıcılar
 Referer_url bilgisinden arama yapılan anahtar kelimelerin bulunması
 Tavsiye motoru (Müzik siteleri , sinema siteleri , alışveriş siteleri)
 Network üzerinde anormal durumlar ( fraud , anomaly detection )
 Reklam gösterimleri (Ad-network)
Big Data Job Trends
Uzmanlaşmak için tavsiyeler
•Büyük verilerin temel özellikleri
•Temel linux
•Temel programlama bilgisi (java , scala ..)
•Apache Hadoop
•Apache Spark
•Örnek bir mesajlaşma kütüphanesi (Apache Kafka)
•Örnek bir NoSQL kütüphanesi (MongoDB , ElasticSearch ..)
Teşekkürler
Güncel yazıları www.buyukveri.co
sitesinden takip edebilirsiniz

Contenu connexe

Tendances

BDA306 Building a Modern Data Warehouse: Deep Dive on Amazon Redshift
BDA306 Building a Modern Data Warehouse: Deep Dive on Amazon RedshiftBDA306 Building a Modern Data Warehouse: Deep Dive on Amazon Redshift
BDA306 Building a Modern Data Warehouse: Deep Dive on Amazon RedshiftAmazon Web Services
 
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...Simplilearn
 
Büyük Veri, Hadoop Ekosistemi ve Veri Bilimi
Büyük Veri, Hadoop Ekosistemi ve Veri BilimiBüyük Veri, Hadoop Ekosistemi ve Veri Bilimi
Büyük Veri, Hadoop Ekosistemi ve Veri BilimiAnkara Big Data Meetup
 
Lambda Architecture in the Cloud with Azure Databricks with Andrei Varanovich
Lambda Architecture in the Cloud with Azure Databricks with Andrei VaranovichLambda Architecture in the Cloud with Azure Databricks with Andrei Varanovich
Lambda Architecture in the Cloud with Azure Databricks with Andrei VaranovichDatabricks
 
Data lake benefits
Data lake benefitsData lake benefits
Data lake benefitsRicky Barron
 
Ankara Spark Meetup - Big Data & Apache Spark Mimarisi Sunumu
Ankara Spark Meetup - Big Data & Apache Spark Mimarisi SunumuAnkara Spark Meetup - Big Data & Apache Spark Mimarisi Sunumu
Ankara Spark Meetup - Big Data & Apache Spark Mimarisi SunumuSerkan Sakınmaz
 
Introduction to Microsoft’s Hadoop solution (HDInsight)
Introduction to Microsoft’s Hadoop solution (HDInsight)Introduction to Microsoft’s Hadoop solution (HDInsight)
Introduction to Microsoft’s Hadoop solution (HDInsight)James Serra
 
Introducing Azure SQL Data Warehouse
Introducing Azure SQL Data WarehouseIntroducing Azure SQL Data Warehouse
Introducing Azure SQL Data WarehouseJames Serra
 
Azure data platform overview
Azure data platform overviewAzure data platform overview
Azure data platform overviewJames Serra
 
Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...
Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...
Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...Cathrine Wilhelmsen
 
How to Take Advantage of an Enterprise Data Warehouse in the Cloud
How to Take Advantage of an Enterprise Data Warehouse in the CloudHow to Take Advantage of an Enterprise Data Warehouse in the Cloud
How to Take Advantage of an Enterprise Data Warehouse in the CloudDenodo
 
Building the Modern Data Hub
Building the Modern Data HubBuilding the Modern Data Hub
Building the Modern Data HubDatavail
 
Big data architectures and the data lake
Big data architectures and the data lakeBig data architectures and the data lake
Big data architectures and the data lakeJames Serra
 
[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...
[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...
[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...DataScienceConferenc1
 
Migrating your traditional Data Warehouse to a Modern Data Lake
Migrating your traditional Data Warehouse to a Modern Data LakeMigrating your traditional Data Warehouse to a Modern Data Lake
Migrating your traditional Data Warehouse to a Modern Data LakeAmazon Web Services
 
Big Data Architecture
Big Data ArchitectureBig Data Architecture
Big Data ArchitectureGuido Schmutz
 

Tendances (20)

BDA306 Building a Modern Data Warehouse: Deep Dive on Amazon Redshift
BDA306 Building a Modern Data Warehouse: Deep Dive on Amazon RedshiftBDA306 Building a Modern Data Warehouse: Deep Dive on Amazon Redshift
BDA306 Building a Modern Data Warehouse: Deep Dive on Amazon Redshift
 
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
 
Webinar Data Mesh - Part 3
Webinar Data Mesh - Part 3Webinar Data Mesh - Part 3
Webinar Data Mesh - Part 3
 
Büyük Veri, Hadoop Ekosistemi ve Veri Bilimi
Büyük Veri, Hadoop Ekosistemi ve Veri BilimiBüyük Veri, Hadoop Ekosistemi ve Veri Bilimi
Büyük Veri, Hadoop Ekosistemi ve Veri Bilimi
 
Lambda Architecture in the Cloud with Azure Databricks with Andrei Varanovich
Lambda Architecture in the Cloud with Azure Databricks with Andrei VaranovichLambda Architecture in the Cloud with Azure Databricks with Andrei Varanovich
Lambda Architecture in the Cloud with Azure Databricks with Andrei Varanovich
 
Snowflake Datawarehouse Architecturing
Snowflake Datawarehouse ArchitecturingSnowflake Datawarehouse Architecturing
Snowflake Datawarehouse Architecturing
 
Data lake benefits
Data lake benefitsData lake benefits
Data lake benefits
 
Ankara Spark Meetup - Big Data & Apache Spark Mimarisi Sunumu
Ankara Spark Meetup - Big Data & Apache Spark Mimarisi SunumuAnkara Spark Meetup - Big Data & Apache Spark Mimarisi Sunumu
Ankara Spark Meetup - Big Data & Apache Spark Mimarisi Sunumu
 
Introduction to Microsoft’s Hadoop solution (HDInsight)
Introduction to Microsoft’s Hadoop solution (HDInsight)Introduction to Microsoft’s Hadoop solution (HDInsight)
Introduction to Microsoft’s Hadoop solution (HDInsight)
 
Introducing Azure SQL Data Warehouse
Introducing Azure SQL Data WarehouseIntroducing Azure SQL Data Warehouse
Introducing Azure SQL Data Warehouse
 
Azure data platform overview
Azure data platform overviewAzure data platform overview
Azure data platform overview
 
Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...
Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...
Pipelines and Data Flows: Introduction to Data Integration in Azure Synapse A...
 
How to Take Advantage of an Enterprise Data Warehouse in the Cloud
How to Take Advantage of an Enterprise Data Warehouse in the CloudHow to Take Advantage of an Enterprise Data Warehouse in the Cloud
How to Take Advantage of an Enterprise Data Warehouse in the Cloud
 
Building the Modern Data Hub
Building the Modern Data HubBuilding the Modern Data Hub
Building the Modern Data Hub
 
Big data architectures and the data lake
Big data architectures and the data lakeBig data architectures and the data lake
Big data architectures and the data lake
 
[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...
[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...
[DSC Europe 22] Lakehouse architecture with Delta Lake and Databricks - Draga...
 
Migrating your traditional Data Warehouse to a Modern Data Lake
Migrating your traditional Data Warehouse to a Modern Data LakeMigrating your traditional Data Warehouse to a Modern Data Lake
Migrating your traditional Data Warehouse to a Modern Data Lake
 
Data mesh
Data meshData mesh
Data mesh
 
Data Lifecycle Management
Data Lifecycle ManagementData Lifecycle Management
Data Lifecycle Management
 
Big Data Architecture
Big Data ArchitectureBig Data Architecture
Big Data Architecture
 

Similaire à Big Data Sunum

Hadoop & Cloudera Workshop
Hadoop & Cloudera WorkshopHadoop & Cloudera Workshop
Hadoop & Cloudera WorkshopSerkan Sakınmaz
 
Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziHadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziSerkan Sakınmaz
 
Hadoop @ devveri.com
Hadoop @ devveri.comHadoop @ devveri.com
Hadoop @ devveri.comHakan Ilter
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data AnalyticsMudur Alkan
 
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinPHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinMuhittin Özer
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnıMustafa Tepe
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Veysel Taşcıoğlu
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel BakışBerkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakıştechbase
 
TBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri AnalitiğiTBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri Analitiğiisa ölmez
 
Veri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkVeri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkHakan Sarıbıyık
 
Büyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve HadoopBüyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve HadoopCenk Derinozlu
 
Hepsistream real time click-stream data analytics platform
Hepsistream real time click-stream  data analytics platformHepsistream real time click-stream  data analytics platform
Hepsistream real time click-stream data analytics platformHepsiburada
 
İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01Cihan Özhan
 
İlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrineİlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve DoctrineMuhittin Özer
 

Similaire à Big Data Sunum (20)

Hadoop & Cloudera Workshop
Hadoop & Cloudera WorkshopHadoop & Cloudera Workshop
Hadoop & Cloudera Workshop
 
Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziHadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
 
Hadoop @ devveri.com
Hadoop @ devveri.comHadoop @ devveri.com
Hadoop @ devveri.com
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinPHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel BakışBerkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
 
TBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri AnalitiğiTBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri Analitiği
 
MongoDB Overview
MongoDB OverviewMongoDB Overview
MongoDB Overview
 
Linkle mimari
Linkle mimariLinkle mimari
Linkle mimari
 
1 hafta_dersi
1  hafta_dersi1  hafta_dersi
1 hafta_dersi
 
Nosql & MongoDB
Nosql & MongoDBNosql & MongoDB
Nosql & MongoDB
 
Veri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkVeri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan Sarıbıyık
 
Büyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve HadoopBüyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve Hadoop
 
NoSQL Sunumu
NoSQL SunumuNoSQL Sunumu
NoSQL Sunumu
 
Hepsistream real time click-stream data analytics platform
Hepsistream real time click-stream  data analytics platformHepsistream real time click-stream  data analytics platform
Hepsistream real time click-stream data analytics platform
 
İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01
 
İlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrineİlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrine
 

Big Data Sunum

  • 2. Hakkımda  İstanbul Ünv . Bilgisayar Müh  8+ Java , Java EE  3+ Hadoop,Spark,Pig,Hive,Oozie  Big Data Developer (Comodo)
  • 3. İçerik • Büyük Verilerin Özellikleri • Büyük Verilerin saklanma yöntemleri • Hadoop Nedir ve Temel Bileşenleri (HDFS , MapReduce)? • Apache Spark , Apache Kafka , MongoDB • Kullanım Senaryoları • Uzmanlaşmak için tavsiyeler
  • 4. Büyük Verilerin Özellikleri Veri Miktarı (Volume) ◦ Boeing 737 uçağı tek bir uçuşta 240 terabyte veri üretmektedir Veri hızı (Velocity) ◦ Bir dakika içerisinde 204 milyon e-mail , 1.8 milyon Facebook like , 278000 tweet işlemi yapılmaktadır Veri çeşitliliği (Variety) ◦ Klasik veritabanı sistemleri küçük boyutta düzenli yapıdaki veriler için tasarlanmıştır . Oysa gerçek hayatta resim , ses , konum , log , mekan verileri sıkça karşımıza çıkmaktadır Verinin değerli olması (Value) ◦ Amazon firması tavsiye sistemi ile satış oranlarını %29 artırmıştır
  • 5. Büyük verilerin saklanma yöntemleri Verilerin karakteristiği ve işlenme yöntemine göre bir saklama sistemi kullanılır Wide Column Stores/Column Family database ◦ HBase , Cassandra ◦ Buradaki yapı klasik veritabanına benzer bir şekilde tablo , kolon ve satır yapısı vardır. Document Store ◦ ElasticSearch , MongoDB ◦ Veriler belirli bir şema yapısına sahip olmadan kaydedilir . JSON gibi Key Value Store ◦ Redis , MemcacheDB
  • 6. Hadoop Nedir ? Hadoop , büyük veri kümeleri ile birden fazla makinada paralel olarak işlem yapmamızı sağlayan Java ile yazılmış açık kaynak kodlu kütüphanedir
  • 7. Hadoop Hdfs Nedir ? Hadoop içerisinde büyük verileri sakladığımız bileşene HDFS (Hadoop Distributed File System) denir
  • 8. Hadoop MapReduce Nedir? Hadoop içerisinde büyük verileri paralel olarak işleyebileceğimiz bileşene MapReduce denir .
  • 9. Apache Spark Spark büyük verileri işlemek için kullanılan bir kütüphanedir
  • 10. Apache Kafka ile mesajlasma sistemleri Apache Kafka büyük veri akışını düşük bir gecikme zamanı ile sağlayan açık kaynak kodlu bir kütüphanedir
  • 11. MongoDB Mongo DB verileri JSON tabanlı kaydeden açık kaynak kodlu ilişkisel olmayan bir veritabanıdır
  • 13. Örnek Analizler  Son bir saat içerisinde 50 den fazla reklama tıklayan kullanıcılar  Referer_url bilgisinden arama yapılan anahtar kelimelerin bulunması  Tavsiye motoru (Müzik siteleri , sinema siteleri , alışveriş siteleri)  Network üzerinde anormal durumlar ( fraud , anomaly detection )  Reklam gösterimleri (Ad-network)
  • 14. Big Data Job Trends
  • 15. Uzmanlaşmak için tavsiyeler •Büyük verilerin temel özellikleri •Temel linux •Temel programlama bilgisi (java , scala ..) •Apache Hadoop •Apache Spark •Örnek bir mesajlaşma kütüphanesi (Apache Kafka) •Örnek bir NoSQL kütüphanesi (MongoDB , ElasticSearch ..)