SlideShare una empresa de Scribd logo
1 de 60
RA PRINCIPIANTES
Presentación
Carlos Toxtli Hernández
14 años de experiencia
Desarrollador multiplataforma
Empecemos desde cero … y uno ….
Para alcanzar a comprender lo que es big
data, empecemos por las bases, el bit es la
unidad mínima de almacenamiento
bit
1 bit = 0.0000000012 m = 12 atomos
posibles valores 0 1
En 1cm2 se pueden llegar a meter 1.5 Tb
1cm2 = 12,000,000,000,000 bits
nibble
1 nibble = 4 bits
16 combinaciones
Se usa para representar un
carácter hexadecimal
byte
1 byte = 8 bits
256 combinaciones
Es posible expresar cualquier carácter
alfabético en un byte.
Hagan la prueba guardando un archivo de
texto con una sola letra. Pesará 1 byte.
ASCII, UTF-8
WORD
Depende del procesador
En un procesador de 32 bits es de 32 bits …
en uno de 64 … es deeeee …….
¿Y eso para qué sirve?
El procesador solo procesa palabras enteras,
es decir por cada ciclo de reloj desplaza esa
información.
Más allá del kilo, mega, giga, tera ...
Claro que hay más allá del Tera, y es
importante que alguien que trabaje con Big
Data no se asuste de escuchar unidades
estratosféricas ...
kilo 1x103
mega 1x106
giga 1x109
tera 1x1012
¿Cuales siguen?
ok, si le atinaron
peta 1x1015
exa 1x1018
zetta 1x1021
yotta 1x1024
xona o hella ("hell of a lot [of],") 1x1027
weka 1x1030
vunda 1x1033
uda 1x1036
treda 1x1039
y siguen ...
sorta 1x1042
rinta 1x1045
quexa 1x1048
pepta 1x1051
ocha 1x1054
nena 1x1057
minga 1x1060
luma 1x1063
se acabaron los nombres pero ...
continúan los numerales
Undecillion 1x1066
Undecilliarde 1x1069
Googol 1x10100
Sexvigintillion 1x10156
Zentillion 1x10600
Googolplex 1x10Googol
Googolplexplex 1x10Googolplex
Googolplexplexplex 1x10Googolplexplex
Googolplexplexplexplex … ¿Cuánto es?
Y ahora ...
Googolplexplexplexplexplex … ???
malas noticias ...
Pero … ¿ Qué creen ?
En todo el universo sólo hay
El número de átomos de todo el universo es
de 1082 por lo que no es necesario que se
aprendan lo del Googol :)
y jugando un rato ...
Si 12 átomos pueden almacenar un bit,
entonces todo el universo tiene una
capacidad de …
8.3 x 1018 lumabits ó
8.3 x 10-19 googolbits
Aunque bueno ese dato no nos sirve de nada
:’(
Ahora una prueba ...
1 kilobyte es igual a …
a) 1024 bytes
b) 1000 bytes
c) 1234 bytes :)
¡ Acertaron !
1 kilobyte = 1000 bytes
No hay que confundir los ...bytes con los
...bibytes
Los términos ...byte son potencias de 10
Los términos ...bibyte son potencias de 2
Además de que su nombre es distinto.
1 kilobyte = 1 KB = 1 x 103 = 1000 bytes
1 kibibyte = 1 KiB = 1 x 210 = 1024 bytes
...bytes y ...bibytes
tablita
...bytes y ...bits
Es muy común confundir un GB con un Gb (ó
Gbit).
Si en su casa tienen conexión de 1Mbps
Quiere decir que fluyen
1,000,000 bits por segundo, es decir
1,000,000 / 8 = 125,000 bytes por segundo
Por lo que la velocidad máxima de descarga
será de:
125 KB/s
cifras, cifras y más cifras
Cada 5 minutos se genera 1 exabyte de datos
= 1,000,000,000,000,000,000 bytes
¡ El GRAN acelerador de Hadrones !
Por muchos considerado el mayor invento de
la humanidad, “el que podría ocasionar que
el universo se colapse” ….
Genera ya por todos sus sensores
500 exabytes diarios de información
= 500,000,000,000,000,000,000 bytes
¿Y los gobiernos ? ….
El gobierno de Estados Unidos almacena la
información de todos sus ciudadanos en el
NSA (National Security Agency) de Utah en
un data center con una capacidad de 5
Zettabytes
= 5,000,000,000,000,000,000,000 bytes
y.... ¿Qué hacemos con tanta
información?
Minarla ….
Así como los mineros encuentran piedras
preciosas entre taaanta tierra, en el caso de
los datos es lo mismo, intentar encontrar
patrones que ayuden a tomar decisiones es
un arte….
Precisamente esta charla es para iniciar a los
simples mortales en el Big Data, y que se
dieran cuenta del poder que tiene.
y…. ¿Qué hay para los simples
mortales?
y…. ¿Cómo empezamos?
Bueno primero es importante tener espacio de
almacenamiento. Recuerda que no todas las
computadoras soportan discos duros de más
de 2TB.
El MBR (Master Boot Record) tiene un límite
de 2TB y se necesita usar GPT (GUID
Partition Table) y debe soportar un tipo de
BIOS llamado UEFI (Unified Extensible
Firmware Interface).
y… ¿Cuánta información necesito?
No hay un mínimo de tamaño, bases de datos
de Megas, Gigas, Teras, etc pueden ser
evaluadas con herramientas de Big Data.
y… ¿Qué se usa?
Las bases de datos tradicionales tienen
algunos límites, por ejemplo:
MySQL soporta hasta 4GB en discos duros
FAT o hasta 2TB en discos duros Windows
NTFS, Linux ext3 y Mac HFS+
Por lo que se usan herramientas especiales.
y… ¿Cuáles sí soportan?
Los más grandes del mercado son estos, pero
existen alternativas Open Source como por
ejemplo Hadoop o Cassandra.
Bases de datos que usan las
grandes empresas
Facebook: RocksDB
Amazon: Dynamo
Google: BigTable
Foursquare: MongoDB
Twitter: Cassandra
Wikipedia: MariaDB
Ebay: BerkeleyDB
Yahoo: Oracle
Microsoft: SQL Server
Tecnologías de Big Data
Bases de datos relacionales
Permiten establecer interconexiones
(relaciones) entre los datos (que
están guardados en tablas), y a
través de dichas conexiones
relacionar los datos de ambas tablas
Tecnologías de Big Data
Bases de datos no relacionales
Los datos almacenados no requieren
estructuras fijas como tablas, no
garantizan completamente ACID
(atomicidad, coherencia, aislamiento
y durabilidad), y habitualmente
escalan bien horizontalmente.
Tecnologías de Big Data
NewSQL
Nace en el 2011 y trata de conseguir
el mismo rendimiento escalable de
sistemas no relacionales para el
procesamiento de transacciones en
línea y garantiza el ACID de un
sistema de base de datos tradicional
Tecnologías de Big Data
NoSQL
No usan SQL como el principal
lenguaje de consultas. Las
principales compañías de Internet se
dieron cuenta que el rendimiento era
más importantes que cuidar la
coherencia.
Tecnologías de Big Data
Key Value
Relacionan una llave con un valor, este es el
principio fundamental que logra que
consultas se ejecuten instantáneamente en
bases de datos de muy muy alta escala.
Buscar en bases de datos de quintillones de
registros es instantáneo gracias a esto.
Funcionan mediante arreglos
En la programación hay una estructura de
datos muy común que se llaman arreglos,
que consiste en guardar varios valores en
una variable y se mandan llamar por su
posición.
Ejemplo de un arreglo
var arreglo = [];
arreglo[0] = “Hola”;
arreglo[1] = “Amiga”;
arreglo[2] = “Sentada”;
arreglo[3] = “Atrás”;
Extraigamos información
Si requerimos en valor de la casilla 1
hacemos lo siguiente:
arreglo[1]
Y nos devuelve “Amiga”
Pasa lo mismo con textos
Pero se le suelen llamar mapas (éste es la
base de Big Data).
var mapa = {};
mapa[“que”] = “Adios”;
mapa[“mal”] = “Amigo”;
mapa[“ejem”] = “Dormido”;
mapa[“plo”] = “Adelante”;
Mandamos traer un registro
Si queremos traer el valor de la posición
“ejem” entonces sería así:
mapa[“ejem”]
Y nos devolverá:
“Dormido”
¿Qué es lo que hace?
Inmediatamente ubica la posición de memoria
ya sea dependiendo de la posición o trae el
registro directamente de una tabla de Hash
que genera internamente, lo que lo hace
instantaneo y no necesita “buscar”, solo lo
trae.
Podemos guardar una tabla
Ahora podemos hacer esto
var tabla = {}
tabla[“user1”] =
{nombre:”Anastasio”,edad:120};
tabla[“user2”] = {nombre:”Basaltar”,edad:135};
tabla[“user3”] =
{nombre:”Malechor”,edad:165};
tabla[“user4”] =
{nombre:”Matusalen”,edad:15};
Y mandarla traer
Si queremos traer la información de “user2” lo
llamamos así
tabla[“user2”]
y nos trae sus datos
{nombre:”Basaltar”,edad:135}
O pedir algunos datos
O podemos pedir solo algún dato
tabla[“user2”][“nombre”]
Y regresa:
Basaltar
Así de sencillo funciona Big Data
De esta manera es como funciona el “Map -
Reduce” que es la base de Big Data.
Cuando profundizen en el tema veran que
hablan mucho de ello, eso que explicamos es
lo que es.
BigTable
Como mencionamos, las grandes empresas
como Google necesitan velocidad en sus
búsquedas y no podían perder tiempo
buscando en miles de tablas, por lo que todo
lo pusieron en una sola, con miles y miles de
columnas, de ahí nació BigTable.
Esta tablota no tiene porque estar en una sola
computadora, puede estar distribuida en una
granja de servidores.
Uy ¿Todo en una tabla?
Muchos profesores de Bases de datos
tradicionales me bajarían del escenario
porque rompe con los conceptos de
normalización ya que la misma información
se repite muuuchas veces.
Pero recuerden que en BigData no importa
que tanto espacio ocupan las tablas, lo
importante es que sea instantáneo.
Ejemplo
user_id user_name bank_name bank_cash group_name school_name
dsf5ds6fds Fracasio Banarte 1 teacher ITASM
sdfsdf7678 Arnolfo Benemex 40 student UNEM
879s7dfsd Juanelo Banarte 20 student UNEM
hjgsdf653a Petronilo Banarte 100 student ITASM
6sdf58sd5f Proculo Scotte 250 staff ITASM
75dsfsdfs7 Agapito Benemex 80 student UNEM
sdfsd76sf5 Panfilo Scotte 133 student ITASM
dsf678sd6f Germayoni Benemex 244 teacher UNEM
usdf8sf6s8f Anivdelarev Scotte 412 staff UNEM
d6s6fs7df6 Delfino Benemex 44 student ITASM
sdf6s78f6s Ruperto Scotte 2 student UNEM
Hagamos una consulta
Las búsquedas son por llave valor, ejemplo
{user_id:”dsf678sd6f”}
Y nos regresa:
[
{user_id:”dsf678sd6f”,user_name:”Germayoni”,bank_name:”Benemex”,bank_cash:”244”,
group_name:”teacher”,school_name:”UNEM”}
]
Ahora por otro registro
Las búsquedas son por llave valor, ejemplo
{group_name:”teacher”}
Y nos regresa 2 registros:
[
{user_id:”dsf5ds6fds”,user_name:”Fracasio”,bank_name:”Banarte”,bank_cash:”1”,group_name:”tea
cher”,school_name:”ITASM”},
{user_id:”dsf678sd6f”,user_name:”Germayoni”,bank_name:”Benemex”,bank_cash:”244”,group_nam
e:”teacher”,school_name:”UNEM”}
]
MongoDB
Cuenta con una versión estable desde el
2011. Es una de las principales plataformas
usadas para Big Data debido a la
escalabilidad, el uso de NoSQL y el eficiente
uso de llave-valor. Es gratuita y de código
abierto.
Funciona exactamente como el
ejemplo
Hagamos el ejemplo en mongo
db.table.find({user_id:”dsf678sd6f”})
Y nos regresa exactamente lo mismo
[
{user_id:”dsf678sd6f”,user_name:”Germayoni”,bank_name:”Benemex”,bank_cash:”244”,
group_name:”teacher”,school_name:”UNEM”}
]
Tutorial de MongoDB
Este tutorial te guiará paso a paso en el
manejo de la herramienta
http://docs.mongodb.org/manual/tutorial/gettin
g-started/
Cómo probarlo
Puedes descargar bases de datos públicas
muy muy grandes desde aquí
http://www.valleyprogramming.com/blog/big-
data-datasets-large-examples-boulder-
colorado-hadoop-mongodb
Prueba BigQuery de Google
BigQuery es una herramienta relacional de
gran escala que la puedes probar fácilmente
con bases de datos ya cargadas
https://developers.google.com/bigquery/
Gracias
Les dejo mis datos
google.com/+CarlosToxtli
facebook.com/carlos.toxtli
La presentación la publicaré en ambas redes.

Más contenido relacionado

La actualidad más candente

Emerging Trends in Data Architecture – What’s the Next Big Thing
Emerging Trends in Data Architecture – What’s the Next Big ThingEmerging Trends in Data Architecture – What’s the Next Big Thing
Emerging Trends in Data Architecture – What’s the Next Big ThingDATAVERSITY
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Roman Herrera
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?Carla Buj
 
Turning big data into big value césar hernandez
Turning big data into big value   césar hernandezTurning big data into big value   césar hernandez
Turning big data into big value césar hernandezAMDIA-Integra
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSEnestor
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsMundo Contact
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesJuan José Domenech
 
¿Cómo implementar con éxito una solución de BI?
¿Cómo implementar con éxito una solución de BI?¿Cómo implementar con éxito una solución de BI?
¿Cómo implementar con éxito una solución de BI?Daniel Chavez Flores
 
Data Architecture Best Practices for Advanced Analytics
Data Architecture Best Practices for Advanced AnalyticsData Architecture Best Practices for Advanced Analytics
Data Architecture Best Practices for Advanced AnalyticsDATAVERSITY
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsDATAVERSITY
 
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)DQSconsulting
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para DummiesStratebi
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsDATAVERSITY
 

La actualidad más candente (20)

Emerging Trends in Data Architecture – What’s the Next Big Thing
Emerging Trends in Data Architecture – What’s the Next Big ThingEmerging Trends in Data Architecture – What’s the Next Big Thing
Emerging Trends in Data Architecture – What’s the Next Big Thing
 
Big data
Big dataBig data
Big data
 
BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?
 
Presentacion big data
Presentacion big dataPresentacion big data
Presentacion big data
 
Turning big data into big value césar hernandez
Turning big data into big value   césar hernandezTurning big data into big value   césar hernandez
Turning big data into big value césar hernandez
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big Results
 
Big data ppt
Big data pptBig data ppt
Big data ppt
 
Inteligencia de negocios - Business Intelligence
Inteligencia de negocios - Business IntelligenceInteligencia de negocios - Business Intelligence
Inteligencia de negocios - Business Intelligence
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
¿Cómo implementar con éxito una solución de BI?
¿Cómo implementar con éxito una solución de BI?¿Cómo implementar con éxito una solución de BI?
¿Cómo implementar con éxito una solución de BI?
 
Data Architecture Best Practices for Advanced Analytics
Data Architecture Best Practices for Advanced AnalyticsData Architecture Best Practices for Advanced Analytics
Data Architecture Best Practices for Advanced Analytics
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business Goals
 
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business Goals
 

Destacado

Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Fernando Santamaría
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivassgcuadrado
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptxnelsonsanchez86
 
Introducción a los Sistemas de Gestión de Contenidos (CMS)
Introducción a los Sistemas de Gestión de Contenidos (CMS)Introducción a los Sistemas de Gestión de Contenidos (CMS)
Introducción a los Sistemas de Gestión de Contenidos (CMS)Julio Santillán-Aldana
 
Inteligencia De Negocios para Dummies
Inteligencia De Negocios para DummiesInteligencia De Negocios para Dummies
Inteligencia De Negocios para DummiesSorey García
 
2.1 Data warehousing acceso, análisis y visualización
2.1 Data warehousing acceso, análisis y visualización2.1 Data warehousing acceso, análisis y visualización
2.1 Data warehousing acceso, análisis y visualizaciónEduardo S de Loera
 
La web 2.0 y las redes sociales
La web 2.0 y las redes socialesLa web 2.0 y las redes sociales
La web 2.0 y las redes socialesCarlos Caicedo
 
La innovación, una reacción en cadena
La innovación, una reacción en cadenaLa innovación, una reacción en cadena
La innovación, una reacción en cadena3M Innovación
 
Unidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de softwareUnidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de softwareROSA IMELDA GARCIA CHI
 
La evolución de los dispositivos móviles
La evolución de los dispositivos móvilesLa evolución de los dispositivos móviles
La evolución de los dispositivos móvilesIsaac Meneses
 
Metodologias modernas para el desarrollo de software
Metodologias modernas para el desarrollo de softwareMetodologias modernas para el desarrollo de software
Metodologias modernas para el desarrollo de softwareDeisy Sapaico
 
Investigación y comparativa cms
Investigación y comparativa cmsInvestigación y comparativa cms
Investigación y comparativa cmspsvasir
 
ISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSI
ISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSIISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSI
ISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSIUCC
 

Destacado (20)

Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptx
 
Introducción a los Sistemas de Gestión de Contenidos (CMS)
Introducción a los Sistemas de Gestión de Contenidos (CMS)Introducción a los Sistemas de Gestión de Contenidos (CMS)
Introducción a los Sistemas de Gestión de Contenidos (CMS)
 
Introduccion a las Redes de Computadoras
Introduccion a las Redes de ComputadorasIntroduccion a las Redes de Computadoras
Introduccion a las Redes de Computadoras
 
Realidad Aumentada
Realidad AumentadaRealidad Aumentada
Realidad Aumentada
 
Inteligencia De Negocios para Dummies
Inteligencia De Negocios para DummiesInteligencia De Negocios para Dummies
Inteligencia De Negocios para Dummies
 
2.1 Data warehousing acceso, análisis y visualización
2.1 Data warehousing acceso, análisis y visualización2.1 Data warehousing acceso, análisis y visualización
2.1 Data warehousing acceso, análisis y visualización
 
La web 2.0 y las redes sociales
La web 2.0 y las redes socialesLa web 2.0 y las redes sociales
La web 2.0 y las redes sociales
 
Downsizing
DownsizingDownsizing
Downsizing
 
La innovación, una reacción en cadena
La innovación, una reacción en cadenaLa innovación, una reacción en cadena
La innovación, una reacción en cadena
 
Unidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de softwareUnidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de software
 
Tics(web 4.0 y 5.0)
Tics(web 4.0 y 5.0)Tics(web 4.0 y 5.0)
Tics(web 4.0 y 5.0)
 
Cloud Computing
Cloud ComputingCloud Computing
Cloud Computing
 
La evolución de los dispositivos móviles
La evolución de los dispositivos móvilesLa evolución de los dispositivos móviles
La evolución de los dispositivos móviles
 
Balance score card
Balance score cardBalance score card
Balance score card
 
Metodologias modernas para el desarrollo de software
Metodologias modernas para el desarrollo de softwareMetodologias modernas para el desarrollo de software
Metodologias modernas para el desarrollo de software
 
Investigación y comparativa cms
Investigación y comparativa cmsInvestigación y comparativa cms
Investigación y comparativa cms
 
Hacia dónde va la web (web 3.0)
Hacia dónde va la web (web 3.0)Hacia dónde va la web (web 3.0)
Hacia dónde va la web (web 3.0)
 
ISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSI
ISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSIISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSI
ISO BASADOS EN SISTEMAS INFORMÁTICOS Y SGSI
 

Similar a Big data para principiantes

Que es el codigo binario
Que es el codigo binarioQue es el codigo binario
Que es el codigo binarioLuis Blancher
 
Preguntas y respuestas medidas de almacenamiento
Preguntas y respuestas medidas de almacenamientoPreguntas y respuestas medidas de almacenamiento
Preguntas y respuestas medidas de almacenamientoJeova93
 
Trabajo 2 - medidas de almacenamiento
Trabajo 2 - medidas de almacenamientoTrabajo 2 - medidas de almacenamiento
Trabajo 2 - medidas de almacenamientoAngelobel Dutan
 
La computadora y su clasificación.
La computadora y su clasificación.La computadora y su clasificación.
La computadora y su clasificación.Daniel Barrera
 
Unidades de almacenamiento de datos
Unidades de almacenamiento de datosUnidades de almacenamiento de datos
Unidades de almacenamiento de datosAlan Ramirez
 
Unidades De Almacenamiento
Unidades De AlmacenamientoUnidades De Almacenamiento
Unidades De Almacenamientodpalacio
 
Unidades de medida de informacion
Unidades de medida de informacionUnidades de medida de informacion
Unidades de medida de informacionalejandra1roque
 
Johan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,BrianJohan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,Brianbryan
 
Johan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,BrianJohan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,Brianleonardo
 
Johan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,BrianJohan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,Briancesar
 
Informatica 1 (1)
Informatica 1 (1)Informatica 1 (1)
Informatica 1 (1)jlocita
 
Magali perez rodriguez y sandy thomas.docx
Magali perez rodriguez y sandy thomas.docxMagali perez rodriguez y sandy thomas.docx
Magali perez rodriguez y sandy thomas.docxmagali2013
 
Medidas de información y Sistemas de Numeración
Medidas de información y Sistemas de NumeraciónMedidas de información y Sistemas de Numeración
Medidas de información y Sistemas de Numeraciónrichard_avariano
 
Tenemaza willian sociales
Tenemaza willian socialesTenemaza willian sociales
Tenemaza willian socialescybertplanet
 
t5 unidades de almacenamiento..docx
t5 unidades de almacenamiento..docxt5 unidades de almacenamiento..docx
t5 unidades de almacenamiento..docxAlinaCardenasRamirez
 

Similar a Big data para principiantes (20)

Preguntas
PreguntasPreguntas
Preguntas
 
Que es el codigo binario
Que es el codigo binarioQue es el codigo binario
Que es el codigo binario
 
Dario chisa
Dario chisaDario chisa
Dario chisa
 
Preguntas y respuestas medidas de almacenamiento
Preguntas y respuestas medidas de almacenamientoPreguntas y respuestas medidas de almacenamiento
Preguntas y respuestas medidas de almacenamiento
 
Trabajo 2 - medidas de almacenamiento
Trabajo 2 - medidas de almacenamientoTrabajo 2 - medidas de almacenamiento
Trabajo 2 - medidas de almacenamiento
 
Medidas de almacenamiento (2)
Medidas de almacenamiento (2)Medidas de almacenamiento (2)
Medidas de almacenamiento (2)
 
La computadora y su clasificación.
La computadora y su clasificación.La computadora y su clasificación.
La computadora y su clasificación.
 
Consulta final
Consulta finalConsulta final
Consulta final
 
Unidades de almacenamiento de datos
Unidades de almacenamiento de datosUnidades de almacenamiento de datos
Unidades de almacenamiento de datos
 
Unidades De Almacenamiento
Unidades De AlmacenamientoUnidades De Almacenamiento
Unidades De Almacenamiento
 
Unidades de medida de informacion
Unidades de medida de informacionUnidades de medida de informacion
Unidades de medida de informacion
 
Johan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,BrianJohan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,Brian
 
Johan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,BrianJohan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,Brian
 
Johan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,BrianJohan,Cesar,Leonardo,Brian
Johan,Cesar,Leonardo,Brian
 
Informatica 1 (1)
Informatica 1 (1)Informatica 1 (1)
Informatica 1 (1)
 
Magali perez rodriguez y sandy thomas.docx
Magali perez rodriguez y sandy thomas.docxMagali perez rodriguez y sandy thomas.docx
Magali perez rodriguez y sandy thomas.docx
 
Medidas de información y Sistemas de Numeración
Medidas de información y Sistemas de NumeraciónMedidas de información y Sistemas de Numeración
Medidas de información y Sistemas de Numeración
 
Unidades informaticas
Unidades informaticasUnidades informaticas
Unidades informaticas
 
Tenemaza willian sociales
Tenemaza willian socialesTenemaza willian sociales
Tenemaza willian sociales
 
t5 unidades de almacenamiento..docx
t5 unidades de almacenamiento..docxt5 unidades de almacenamiento..docx
t5 unidades de almacenamiento..docx
 

Más de Carlos Toxtli

Reproducibility in artificial intelligence
Reproducibility in artificial intelligenceReproducibility in artificial intelligence
Reproducibility in artificial intelligenceCarlos Toxtli
 
Autom editor video blooper recognition and localization for automatic monolo...
Autom editor  video blooper recognition and localization for automatic monolo...Autom editor  video blooper recognition and localization for automatic monolo...
Autom editor video blooper recognition and localization for automatic monolo...Carlos Toxtli
 
Artificial intelligence and open source
Artificial intelligence and open sourceArtificial intelligence and open source
Artificial intelligence and open sourceCarlos Toxtli
 
Bots in robotic process automation
Bots in robotic process automationBots in robotic process automation
Bots in robotic process automationCarlos Toxtli
 
How to implement artificial intelligence solutions
How to implement artificial intelligence solutionsHow to implement artificial intelligence solutions
How to implement artificial intelligence solutionsCarlos Toxtli
 
Multimodal emotion recognition at utterance level with spatio-temporal featur...
Multimodal emotion recognition at utterance level with spatio-temporal featur...Multimodal emotion recognition at utterance level with spatio-temporal featur...
Multimodal emotion recognition at utterance level with spatio-temporal featur...Carlos Toxtli
 
Changing paradigms in ai prototyping
Changing paradigms in ai prototypingChanging paradigms in ai prototyping
Changing paradigms in ai prototypingCarlos Toxtli
 
Inteligencia Artificial From Zero to Hero
Inteligencia Artificial From Zero to HeroInteligencia Artificial From Zero to Hero
Inteligencia Artificial From Zero to HeroCarlos Toxtli
 
ExperTwin: An Alter Ego in Cyberspace for Knowledge Workers
ExperTwin: An Alter Ego in Cyberspace for Knowledge WorkersExperTwin: An Alter Ego in Cyberspace for Knowledge Workers
ExperTwin: An Alter Ego in Cyberspace for Knowledge WorkersCarlos Toxtli
 
Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018
Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018
Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018Carlos Toxtli
 
Cómo vivir de la inteligencia artificial
Cómo vivir de la inteligencia artificialCómo vivir de la inteligencia artificial
Cómo vivir de la inteligencia artificialCarlos Toxtli
 
Education 3.0 - Megatendencias
Education 3.0 - MegatendenciasEducation 3.0 - Megatendencias
Education 3.0 - MegatendenciasCarlos Toxtli
 
Understanding Political Manipulation and Botnets - RightsCon
Understanding Political Manipulation and Botnets - RightsConUnderstanding Political Manipulation and Botnets - RightsCon
Understanding Political Manipulation and Botnets - RightsConCarlos Toxtli
 
Understanding Chatbot-Mediated Task Management
Understanding Chatbot-Mediated Task ManagementUnderstanding Chatbot-Mediated Task Management
Understanding Chatbot-Mediated Task ManagementCarlos Toxtli
 
Single sign on spanish - guía completa
Single sign on   spanish - guía completaSingle sign on   spanish - guía completa
Single sign on spanish - guía completaCarlos Toxtli
 
Los empleos del futuro en Latinoamérica
Los empleos del futuro en LatinoaméricaLos empleos del futuro en Latinoamérica
Los empleos del futuro en LatinoaméricaCarlos Toxtli
 
Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...
Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...
Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...Carlos Toxtli
 
RPA (Robotic Process Automation)
RPA (Robotic Process Automation)RPA (Robotic Process Automation)
RPA (Robotic Process Automation)Carlos Toxtli
 
Chatbots + rpa (robotic process automation)
Chatbots + rpa (robotic process automation)Chatbots + rpa (robotic process automation)
Chatbots + rpa (robotic process automation)Carlos Toxtli
 

Más de Carlos Toxtli (20)

Reproducibility in artificial intelligence
Reproducibility in artificial intelligenceReproducibility in artificial intelligence
Reproducibility in artificial intelligence
 
Autom editor video blooper recognition and localization for automatic monolo...
Autom editor  video blooper recognition and localization for automatic monolo...Autom editor  video blooper recognition and localization for automatic monolo...
Autom editor video blooper recognition and localization for automatic monolo...
 
Artificial intelligence and open source
Artificial intelligence and open sourceArtificial intelligence and open source
Artificial intelligence and open source
 
Bots in robotic process automation
Bots in robotic process automationBots in robotic process automation
Bots in robotic process automation
 
How to implement artificial intelligence solutions
How to implement artificial intelligence solutionsHow to implement artificial intelligence solutions
How to implement artificial intelligence solutions
 
Multimodal emotion recognition at utterance level with spatio-temporal featur...
Multimodal emotion recognition at utterance level with spatio-temporal featur...Multimodal emotion recognition at utterance level with spatio-temporal featur...
Multimodal emotion recognition at utterance level with spatio-temporal featur...
 
Changing paradigms in ai prototyping
Changing paradigms in ai prototypingChanging paradigms in ai prototyping
Changing paradigms in ai prototyping
 
Inteligencia Artificial From Zero to Hero
Inteligencia Artificial From Zero to HeroInteligencia Artificial From Zero to Hero
Inteligencia Artificial From Zero to Hero
 
Bots for Crowds
Bots for CrowdsBots for Crowds
Bots for Crowds
 
ExperTwin: An Alter Ego in Cyberspace for Knowledge Workers
ExperTwin: An Alter Ego in Cyberspace for Knowledge WorkersExperTwin: An Alter Ego in Cyberspace for Knowledge Workers
ExperTwin: An Alter Ego in Cyberspace for Knowledge Workers
 
Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018
Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018
Enabling Expert Critique with Chatbots and Micro-Guidance - Ci 2018
 
Cómo vivir de la inteligencia artificial
Cómo vivir de la inteligencia artificialCómo vivir de la inteligencia artificial
Cómo vivir de la inteligencia artificial
 
Education 3.0 - Megatendencias
Education 3.0 - MegatendenciasEducation 3.0 - Megatendencias
Education 3.0 - Megatendencias
 
Understanding Political Manipulation and Botnets - RightsCon
Understanding Political Manipulation and Botnets - RightsConUnderstanding Political Manipulation and Botnets - RightsCon
Understanding Political Manipulation and Botnets - RightsCon
 
Understanding Chatbot-Mediated Task Management
Understanding Chatbot-Mediated Task ManagementUnderstanding Chatbot-Mediated Task Management
Understanding Chatbot-Mediated Task Management
 
Single sign on spanish - guía completa
Single sign on   spanish - guía completaSingle sign on   spanish - guía completa
Single sign on spanish - guía completa
 
Los empleos del futuro en Latinoamérica
Los empleos del futuro en LatinoaméricaLos empleos del futuro en Latinoamérica
Los empleos del futuro en Latinoamérica
 
Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...
Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...
Empleos que ya están siendo reemplazados por bots y el futuro del RPA (Roboti...
 
RPA (Robotic Process Automation)
RPA (Robotic Process Automation)RPA (Robotic Process Automation)
RPA (Robotic Process Automation)
 
Chatbots + rpa (robotic process automation)
Chatbots + rpa (robotic process automation)Chatbots + rpa (robotic process automation)
Chatbots + rpa (robotic process automation)
 

Último

Instalacion de servicios windows, configuracion y aplicacion.
Instalacion de servicios windows, configuracion y aplicacion.Instalacion de servicios windows, configuracion y aplicacion.
Instalacion de servicios windows, configuracion y aplicacion.CZSOTEC
 
SQL server Analysis Services & SQL Server Reporting Services.pptx
SQL server Analysis Services & SQL Server Reporting Services.pptxSQL server Analysis Services & SQL Server Reporting Services.pptx
SQL server Analysis Services & SQL Server Reporting Services.pptxRAMIROANTONIOGALINDO
 
Se realiza instalacion y configuraacion servicios Windows
Se realiza instalacion y configuraacion servicios WindowsSe realiza instalacion y configuraacion servicios Windows
Se realiza instalacion y configuraacion servicios WindowsCZSOTEC
 
Webinar Resolucion2335 de 2023 Kubapp.pdf
Webinar Resolucion2335 de 2023 Kubapp.pdfWebinar Resolucion2335 de 2023 Kubapp.pdf
Webinar Resolucion2335 de 2023 Kubapp.pdfAnaRosaMontenegro
 
MacOS SISTEMA OPERATIVO CARACTERISTICAS.pptx
MacOS SISTEMA OPERATIVO CARACTERISTICAS.pptxMacOS SISTEMA OPERATIVO CARACTERISTICAS.pptx
MacOS SISTEMA OPERATIVO CARACTERISTICAS.pptxcalzadillasluis134
 
SISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVO
SISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVOSISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVO
SISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVOELIAMARYTOVARFLOREZD
 
Delitos informáticos en Slideshare.pptx
Delitos informáticos en  Slideshare.pptxDelitos informáticos en  Slideshare.pptx
Delitos informáticos en Slideshare.pptxmaykolmagallanes012
 

Último (7)

Instalacion de servicios windows, configuracion y aplicacion.
Instalacion de servicios windows, configuracion y aplicacion.Instalacion de servicios windows, configuracion y aplicacion.
Instalacion de servicios windows, configuracion y aplicacion.
 
SQL server Analysis Services & SQL Server Reporting Services.pptx
SQL server Analysis Services & SQL Server Reporting Services.pptxSQL server Analysis Services & SQL Server Reporting Services.pptx
SQL server Analysis Services & SQL Server Reporting Services.pptx
 
Se realiza instalacion y configuraacion servicios Windows
Se realiza instalacion y configuraacion servicios WindowsSe realiza instalacion y configuraacion servicios Windows
Se realiza instalacion y configuraacion servicios Windows
 
Webinar Resolucion2335 de 2023 Kubapp.pdf
Webinar Resolucion2335 de 2023 Kubapp.pdfWebinar Resolucion2335 de 2023 Kubapp.pdf
Webinar Resolucion2335 de 2023 Kubapp.pdf
 
MacOS SISTEMA OPERATIVO CARACTERISTICAS.pptx
MacOS SISTEMA OPERATIVO CARACTERISTICAS.pptxMacOS SISTEMA OPERATIVO CARACTERISTICAS.pptx
MacOS SISTEMA OPERATIVO CARACTERISTICAS.pptx
 
SISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVO
SISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVOSISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVO
SISTEMA INTEGRADO DE ADMINISTRACION FINANCIERA - SIAF MODULO ADMINISTRATIVO
 
Delitos informáticos en Slideshare.pptx
Delitos informáticos en  Slideshare.pptxDelitos informáticos en  Slideshare.pptx
Delitos informáticos en Slideshare.pptx
 

Big data para principiantes

  • 2. Presentación Carlos Toxtli Hernández 14 años de experiencia Desarrollador multiplataforma
  • 3. Empecemos desde cero … y uno …. Para alcanzar a comprender lo que es big data, empecemos por las bases, el bit es la unidad mínima de almacenamiento
  • 4. bit 1 bit = 0.0000000012 m = 12 atomos posibles valores 0 1 En 1cm2 se pueden llegar a meter 1.5 Tb 1cm2 = 12,000,000,000,000 bits
  • 5. nibble 1 nibble = 4 bits 16 combinaciones Se usa para representar un carácter hexadecimal
  • 6. byte 1 byte = 8 bits 256 combinaciones Es posible expresar cualquier carácter alfabético en un byte. Hagan la prueba guardando un archivo de texto con una sola letra. Pesará 1 byte. ASCII, UTF-8
  • 7. WORD Depende del procesador En un procesador de 32 bits es de 32 bits … en uno de 64 … es deeeee ……. ¿Y eso para qué sirve? El procesador solo procesa palabras enteras, es decir por cada ciclo de reloj desplaza esa información.
  • 8. Más allá del kilo, mega, giga, tera ... Claro que hay más allá del Tera, y es importante que alguien que trabaje con Big Data no se asuste de escuchar unidades estratosféricas ... kilo 1x103 mega 1x106 giga 1x109 tera 1x1012 ¿Cuales siguen?
  • 9. ok, si le atinaron peta 1x1015 exa 1x1018 zetta 1x1021 yotta 1x1024 xona o hella ("hell of a lot [of],") 1x1027 weka 1x1030 vunda 1x1033 uda 1x1036 treda 1x1039
  • 10. y siguen ... sorta 1x1042 rinta 1x1045 quexa 1x1048 pepta 1x1051 ocha 1x1054 nena 1x1057 minga 1x1060 luma 1x1063 se acabaron los nombres pero ...
  • 11. continúan los numerales Undecillion 1x1066 Undecilliarde 1x1069 Googol 1x10100 Sexvigintillion 1x10156 Zentillion 1x10600 Googolplex 1x10Googol Googolplexplex 1x10Googolplex Googolplexplexplex 1x10Googolplexplex Googolplexplexplexplex … ¿Cuánto es?
  • 13. malas noticias ... Pero … ¿ Qué creen ? En todo el universo sólo hay El número de átomos de todo el universo es de 1082 por lo que no es necesario que se aprendan lo del Googol :)
  • 14. y jugando un rato ... Si 12 átomos pueden almacenar un bit, entonces todo el universo tiene una capacidad de … 8.3 x 1018 lumabits ó 8.3 x 10-19 googolbits Aunque bueno ese dato no nos sirve de nada :’(
  • 15. Ahora una prueba ... 1 kilobyte es igual a … a) 1024 bytes b) 1000 bytes c) 1234 bytes :)
  • 16. ¡ Acertaron ! 1 kilobyte = 1000 bytes
  • 17. No hay que confundir los ...bytes con los ...bibytes Los términos ...byte son potencias de 10 Los términos ...bibyte son potencias de 2 Además de que su nombre es distinto. 1 kilobyte = 1 KB = 1 x 103 = 1000 bytes 1 kibibyte = 1 KiB = 1 x 210 = 1024 bytes ...bytes y ...bibytes
  • 19. ...bytes y ...bits Es muy común confundir un GB con un Gb (ó Gbit). Si en su casa tienen conexión de 1Mbps Quiere decir que fluyen 1,000,000 bits por segundo, es decir 1,000,000 / 8 = 125,000 bytes por segundo Por lo que la velocidad máxima de descarga será de: 125 KB/s
  • 20. cifras, cifras y más cifras Cada 5 minutos se genera 1 exabyte de datos = 1,000,000,000,000,000,000 bytes
  • 21. ¡ El GRAN acelerador de Hadrones ! Por muchos considerado el mayor invento de la humanidad, “el que podría ocasionar que el universo se colapse” …. Genera ya por todos sus sensores 500 exabytes diarios de información = 500,000,000,000,000,000,000 bytes
  • 22. ¿Y los gobiernos ? …. El gobierno de Estados Unidos almacena la información de todos sus ciudadanos en el NSA (National Security Agency) de Utah en un data center con una capacidad de 5 Zettabytes = 5,000,000,000,000,000,000,000 bytes
  • 23. y.... ¿Qué hacemos con tanta información? Minarla …. Así como los mineros encuentran piedras preciosas entre taaanta tierra, en el caso de los datos es lo mismo, intentar encontrar patrones que ayuden a tomar decisiones es un arte….
  • 24. Precisamente esta charla es para iniciar a los simples mortales en el Big Data, y que se dieran cuenta del poder que tiene. y…. ¿Qué hay para los simples mortales?
  • 25. y…. ¿Cómo empezamos? Bueno primero es importante tener espacio de almacenamiento. Recuerda que no todas las computadoras soportan discos duros de más de 2TB. El MBR (Master Boot Record) tiene un límite de 2TB y se necesita usar GPT (GUID Partition Table) y debe soportar un tipo de BIOS llamado UEFI (Unified Extensible Firmware Interface).
  • 26. y… ¿Cuánta información necesito? No hay un mínimo de tamaño, bases de datos de Megas, Gigas, Teras, etc pueden ser evaluadas con herramientas de Big Data.
  • 27. y… ¿Qué se usa? Las bases de datos tradicionales tienen algunos límites, por ejemplo: MySQL soporta hasta 4GB en discos duros FAT o hasta 2TB en discos duros Windows NTFS, Linux ext3 y Mac HFS+ Por lo que se usan herramientas especiales.
  • 28. y… ¿Cuáles sí soportan? Los más grandes del mercado son estos, pero existen alternativas Open Source como por ejemplo Hadoop o Cassandra.
  • 29. Bases de datos que usan las grandes empresas Facebook: RocksDB Amazon: Dynamo Google: BigTable Foursquare: MongoDB Twitter: Cassandra Wikipedia: MariaDB Ebay: BerkeleyDB Yahoo: Oracle Microsoft: SQL Server
  • 31. Bases de datos relacionales Permiten establecer interconexiones (relaciones) entre los datos (que están guardados en tablas), y a través de dichas conexiones relacionar los datos de ambas tablas
  • 33. Bases de datos no relacionales Los datos almacenados no requieren estructuras fijas como tablas, no garantizan completamente ACID (atomicidad, coherencia, aislamiento y durabilidad), y habitualmente escalan bien horizontalmente.
  • 35. NewSQL Nace en el 2011 y trata de conseguir el mismo rendimiento escalable de sistemas no relacionales para el procesamiento de transacciones en línea y garantiza el ACID de un sistema de base de datos tradicional
  • 37. NoSQL No usan SQL como el principal lenguaje de consultas. Las principales compañías de Internet se dieron cuenta que el rendimiento era más importantes que cuidar la coherencia.
  • 39. Key Value Relacionan una llave con un valor, este es el principio fundamental que logra que consultas se ejecuten instantáneamente en bases de datos de muy muy alta escala. Buscar en bases de datos de quintillones de registros es instantáneo gracias a esto.
  • 40. Funcionan mediante arreglos En la programación hay una estructura de datos muy común que se llaman arreglos, que consiste en guardar varios valores en una variable y se mandan llamar por su posición.
  • 41. Ejemplo de un arreglo var arreglo = []; arreglo[0] = “Hola”; arreglo[1] = “Amiga”; arreglo[2] = “Sentada”; arreglo[3] = “Atrás”;
  • 42. Extraigamos información Si requerimos en valor de la casilla 1 hacemos lo siguiente: arreglo[1] Y nos devuelve “Amiga”
  • 43. Pasa lo mismo con textos Pero se le suelen llamar mapas (éste es la base de Big Data). var mapa = {}; mapa[“que”] = “Adios”; mapa[“mal”] = “Amigo”; mapa[“ejem”] = “Dormido”; mapa[“plo”] = “Adelante”;
  • 44. Mandamos traer un registro Si queremos traer el valor de la posición “ejem” entonces sería así: mapa[“ejem”] Y nos devolverá: “Dormido”
  • 45. ¿Qué es lo que hace? Inmediatamente ubica la posición de memoria ya sea dependiendo de la posición o trae el registro directamente de una tabla de Hash que genera internamente, lo que lo hace instantaneo y no necesita “buscar”, solo lo trae.
  • 46. Podemos guardar una tabla Ahora podemos hacer esto var tabla = {} tabla[“user1”] = {nombre:”Anastasio”,edad:120}; tabla[“user2”] = {nombre:”Basaltar”,edad:135}; tabla[“user3”] = {nombre:”Malechor”,edad:165}; tabla[“user4”] = {nombre:”Matusalen”,edad:15};
  • 47. Y mandarla traer Si queremos traer la información de “user2” lo llamamos así tabla[“user2”] y nos trae sus datos {nombre:”Basaltar”,edad:135}
  • 48. O pedir algunos datos O podemos pedir solo algún dato tabla[“user2”][“nombre”] Y regresa: Basaltar
  • 49. Así de sencillo funciona Big Data De esta manera es como funciona el “Map - Reduce” que es la base de Big Data. Cuando profundizen en el tema veran que hablan mucho de ello, eso que explicamos es lo que es.
  • 50. BigTable Como mencionamos, las grandes empresas como Google necesitan velocidad en sus búsquedas y no podían perder tiempo buscando en miles de tablas, por lo que todo lo pusieron en una sola, con miles y miles de columnas, de ahí nació BigTable. Esta tablota no tiene porque estar en una sola computadora, puede estar distribuida en una granja de servidores.
  • 51. Uy ¿Todo en una tabla? Muchos profesores de Bases de datos tradicionales me bajarían del escenario porque rompe con los conceptos de normalización ya que la misma información se repite muuuchas veces. Pero recuerden que en BigData no importa que tanto espacio ocupan las tablas, lo importante es que sea instantáneo.
  • 52. Ejemplo user_id user_name bank_name bank_cash group_name school_name dsf5ds6fds Fracasio Banarte 1 teacher ITASM sdfsdf7678 Arnolfo Benemex 40 student UNEM 879s7dfsd Juanelo Banarte 20 student UNEM hjgsdf653a Petronilo Banarte 100 student ITASM 6sdf58sd5f Proculo Scotte 250 staff ITASM 75dsfsdfs7 Agapito Benemex 80 student UNEM sdfsd76sf5 Panfilo Scotte 133 student ITASM dsf678sd6f Germayoni Benemex 244 teacher UNEM usdf8sf6s8f Anivdelarev Scotte 412 staff UNEM d6s6fs7df6 Delfino Benemex 44 student ITASM sdf6s78f6s Ruperto Scotte 2 student UNEM
  • 53. Hagamos una consulta Las búsquedas son por llave valor, ejemplo {user_id:”dsf678sd6f”} Y nos regresa: [ {user_id:”dsf678sd6f”,user_name:”Germayoni”,bank_name:”Benemex”,bank_cash:”244”, group_name:”teacher”,school_name:”UNEM”} ]
  • 54. Ahora por otro registro Las búsquedas son por llave valor, ejemplo {group_name:”teacher”} Y nos regresa 2 registros: [ {user_id:”dsf5ds6fds”,user_name:”Fracasio”,bank_name:”Banarte”,bank_cash:”1”,group_name:”tea cher”,school_name:”ITASM”}, {user_id:”dsf678sd6f”,user_name:”Germayoni”,bank_name:”Benemex”,bank_cash:”244”,group_nam e:”teacher”,school_name:”UNEM”} ]
  • 55. MongoDB Cuenta con una versión estable desde el 2011. Es una de las principales plataformas usadas para Big Data debido a la escalabilidad, el uso de NoSQL y el eficiente uso de llave-valor. Es gratuita y de código abierto.
  • 56. Funciona exactamente como el ejemplo Hagamos el ejemplo en mongo db.table.find({user_id:”dsf678sd6f”}) Y nos regresa exactamente lo mismo [ {user_id:”dsf678sd6f”,user_name:”Germayoni”,bank_name:”Benemex”,bank_cash:”244”, group_name:”teacher”,school_name:”UNEM”} ]
  • 57. Tutorial de MongoDB Este tutorial te guiará paso a paso en el manejo de la herramienta http://docs.mongodb.org/manual/tutorial/gettin g-started/
  • 58. Cómo probarlo Puedes descargar bases de datos públicas muy muy grandes desde aquí http://www.valleyprogramming.com/blog/big- data-datasets-large-examples-boulder- colorado-hadoop-mongodb
  • 59. Prueba BigQuery de Google BigQuery es una herramienta relacional de gran escala que la puedes probar fácilmente con bases de datos ya cargadas https://developers.google.com/bigquery/
  • 60. Gracias Les dejo mis datos google.com/+CarlosToxtli facebook.com/carlos.toxtli La presentación la publicaré en ambas redes.