SlideShare une entreprise Scribd logo
1  sur  54
El Proceso de la Minería de Datos Ing. Samuel Oporto Díaz (Mag) [email_address]
Mapa del Curso
Tabla de Contenido ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
METODOLOGIAS PARA LA MINERIA DE DATOS
CRIPS
CRIPS - DM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Visión general Comprensión del negocio Comprensión de los datos Preparación de los datos Modelación Evaluación Despliegue de resultados DATOS
Fases Determinación de los objetivos. Definición de Criterios de Éxito. Calificación de la Situación. Determinación de las metas de la Minería de datos Recolectar los datos iniciales. Descripción de los datos. Exploración de los Datos. Verificación de la Calidad de los datos. Selección de Datos. Limpieza de los Datos. Construcción de Nuevos Datos. Formateo de los Datos. Selección de la Técnica de Modelación. Generación de Pruebas para el Modelo. Construcción del Modelo. Calificación del Modelo. Aplicación del modelo a la rutina diaria. Monitoreo y mantenimiento. Reporte Final Evaluación del modelo con respecto a los objetivos del proyecto. Evaluación costo-beneficio. Evaluar su aplicación en la realidad Comprensión de negocio Entendimiento de datos Preparación de datos Modelado Evaluación Despliegue de resultados
SEMMA
SEMMA ,[object Object],[object Object],[object Object]
SEMMA ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
SEMMA ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Uso de la metodologías ,[object Object]
Comparación SEMMA CRISP Orientado al desarrollo del proceso de MD Orientado a los objetivos empresariales Se inicia analizando los datos Se inicia analizando los objetivos del negocio Ligada a productos SAS Metodología abierta y gratuita Orientado a una metodología de  gestión de proyectos
EL PROCESO DE LA MINERÍA DE DATOS
El Proceso de la Minería de Datos Explotación Data Selección Conocimiento Patrones Minería de Datos Interpretación/ Evaluación Preparación de Datos Data Pre-procesada Datos Modelos Despliegue inducción deducción
El Proceso de la Minería de Datos ,[object Object],[object Object],[object Object],[object Object],[object Object]
El Proceso de la Minería de Datos Data Objetivo Data Pre-procesada Data Transformada Patrones Fuentes de datos Pre-procesamiento Exploración y transformación Reconocimiento de Patrones Evaluación e Interpretación Data cruda DHW DBMS Texto Evaluación y Entendimiento ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Reportes y Visualización ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
CRIPS
Jerarquía
Fases
Tareas Genéricas y Resultados
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD ( 1 )
Comprensión de negocio
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD ( 2 )
Entendimiento de los Datos
Entendimiento de los Datos Recolección de datos iníciales Descripción de los datos Exploración de los datos Verificación de la calidad de los datos univariada multivariada series de datos
[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD ( 3 ) 60% del tiempo
Preparación de los Datos
Preparación de los Datos Limpieza de datos Integración de Datos Transformación de datos Reducción de datos Valores extremos Valores null Valores con ruido Valores inconsistentes Valores mal clasificados Problemas de semántica ¿significa lo mismo? Problemas de temporalidad ¿cuándo fue registrado? Problemas de codificación y formato. Problemas de idioma. Problemas de duplicidad ¿cuál vale? Problema de medio de almacenamiento. Filas: suma y agregación de datos  Columnas: log, sin, exp, tan, etc… Funciones entre columnas.
[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD( 4) D P ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Modelado
Modelos de Minería de Datos ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],P D D D P
[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD( 5)
Evaluación del Modelo
Evaluación de Modelos Matriz de confusión Curva ROC Lift charts
[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD( 6) ,[object Object],[object Object],[object Object]
Explotación de Resultados
ESTÁNDARES PARA LA MINERIA DE DATOS
Estándares ,[object Object],[object Object],[object Object],[object Object],[object Object],CREATE MINING MODEL  [Heart_Health Prediction] [ID] Int Key, [Age] Int, [Smoker] Int, [Salary] Double discretized, [HeartAttack] Int PREDICT,  USING [Decision_Trees_101] INSERT INTO  [Heart_Health Prediction] ([ID], [Age], [Smoker], [Salary]) SELECT [ID],[Age], [Smoker], [Salary]  FROM Patient_Medical M, Patient_Financial F WHERE M.ID = F.ID SELECT  t.[ID], [Heart_Health  Prediction].[HeartAttack] FROM [Heart_Health Prediction] PREDICTION JOIN ( SELECT [ID],[Age],[Smoker],[Salary] FROM Patient_Medical M, Patient_Financial F WHERE M.ID = F.ID) as t ON [Heart_Health Prediction].Age = t.Age AND [Heath_Health Prediction].Smoker = t.Smoker AND [Heart_Health Prediction].Salary = t.Salary Identifica las columnas de entrenamiento, la columna a predecir y el algoritmo de minería de datos El INSERT representa los datos usados para el entrenamiento del modelo Usa el modelo entrenado y los datos actuales para hacer predicciones
Estándares ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Estándares ,[object Object],[object Object],[object Object],[object Object],[object Object]
HERRAMIENTAS DE SOFTWARE PARA MINERÍA DE DATOS
SAS System
SQL Server Data Mining
ORACLE DATA MINING
IBM - DB2 Intelligent Miner
SPSS Data Mining Pack
Clementine
Weka
XLMiner
Bibliografía ,[object Object],[object Object],[object Object],[object Object]
PREGUNTAS
Mg. Samuel Oporto Díaz [email_address] http://www.wiphala.net/oporto

Contenu connexe

Tendances

Las 4 P en el desarrollo de software
Las 4 P en el desarrollo de softwareLas 4 P en el desarrollo de software
Las 4 P en el desarrollo de software
Sofylutqm
 
Una base de datos relacional
Una base de datos relacionalUna base de datos relacional
Una base de datos relacional
Alex Javier
 
Cuadro comparativo metodos
Cuadro comparativo metodosCuadro comparativo metodos
Cuadro comparativo metodos
ivansierra20
 
Tipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia ArtificialTipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia Artificial
Juank Grifin
 
Métricas de Proceso y proyecto de software
Métricas de Proceso y proyecto de softwareMétricas de Proceso y proyecto de software
Métricas de Proceso y proyecto de software
Lorena Quiñónez
 

Tendances (20)

234632213 sistema-experto-para-el-diagnostico-de-fallas-de-computadora-pdf
234632213 sistema-experto-para-el-diagnostico-de-fallas-de-computadora-pdf234632213 sistema-experto-para-el-diagnostico-de-fallas-de-computadora-pdf
234632213 sistema-experto-para-el-diagnostico-de-fallas-de-computadora-pdf
 
Sistema De Gestion De Notas
Sistema De Gestion De NotasSistema De Gestion De Notas
Sistema De Gestion De Notas
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
Las 4 P en el desarrollo de software
Las 4 P en el desarrollo de softwareLas 4 P en el desarrollo de software
Las 4 P en el desarrollo de software
 
Metodologia de wilson
Metodologia de wilsonMetodologia de wilson
Metodologia de wilson
 
Metricas del proyecto de Software - introduccion
Metricas del proyecto de Software - introduccionMetricas del proyecto de Software - introduccion
Metricas del proyecto de Software - introduccion
 
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICOKTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
 
Pruebas de sistemas y aceptacion
Pruebas de sistemas y aceptacionPruebas de sistemas y aceptacion
Pruebas de sistemas y aceptacion
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Una base de datos relacional
Una base de datos relacionalUna base de datos relacional
Una base de datos relacional
 
Cuadro comparativo metodos
Cuadro comparativo metodosCuadro comparativo metodos
Cuadro comparativo metodos
 
Análisis y diseño de sistemas estructurado
Análisis y diseño de sistemas estructuradoAnálisis y diseño de sistemas estructurado
Análisis y diseño de sistemas estructurado
 
Machine Learning para Todos
Machine Learning para TodosMachine Learning para Todos
Machine Learning para Todos
 
SSTQB - Glosario de terminos de pruebas de software
SSTQB  - Glosario de terminos de pruebas de softwareSSTQB  - Glosario de terminos de pruebas de software
SSTQB - Glosario de terminos de pruebas de software
 
Tipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia ArtificialTipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia Artificial
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Pt7seccion2
Pt7seccion2Pt7seccion2
Pt7seccion2
 
Requerimientos no funcionales
Requerimientos no funcionalesRequerimientos no funcionales
Requerimientos no funcionales
 
Sistemas de Gestión de Seguridad de la Información
Sistemas de Gestión de Seguridad de la Información Sistemas de Gestión de Seguridad de la Información
Sistemas de Gestión de Seguridad de la Información
 
Métricas de Proceso y proyecto de software
Métricas de Proceso y proyecto de softwareMétricas de Proceso y proyecto de software
Métricas de Proceso y proyecto de software
 

En vedette

Presentación colombia junio 2011
Presentación colombia   junio 2011Presentación colombia   junio 2011
Presentación colombia junio 2011
ProColombia
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
María Muñoz Parra
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all Employees
Talent Innovations
 

En vedette (20)

MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentación colombia junio 2011
Presentación colombia   junio 2011Presentación colombia   junio 2011
Presentación colombia junio 2011
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en Weka
 
Datamingse
DatamingseDatamingse
Datamingse
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all Employees
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 

Similaire à mineria de datos

Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd ac
Luis Jherry
 
02000 metodo validacion
02000 metodo validacion02000 metodo validacion
02000 metodo validacion
JEANS DIEGO RAMOS PEÑALOZA
 
Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012
Eduardo Castro
 

Similaire à mineria de datos (20)

Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd ac
 
02000 metodo validacion
02000 metodo validacion02000 metodo validacion
02000 metodo validacion
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Almacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosAlmacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datos
 
U3 foro semana 14
U3 foro   semana 14U3 foro   semana 14
U3 foro semana 14
 
Machine Learning en Recursos Humanos
Machine Learning en Recursos HumanosMachine Learning en Recursos Humanos
Machine Learning en Recursos Humanos
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Diapositiva d
Diapositiva dDiapositiva d
Diapositiva d
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Modulo 1 - Modulo 2 (subir).pptx
Modulo 1 - Modulo 2 (subir).pptxModulo 1 - Modulo 2 (subir).pptx
Modulo 1 - Modulo 2 (subir).pptx
 
Md session1
Md session1Md session1
Md session1
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 

Plus de UNAM Facultad de Contaduría, Administración e Informática

Plus de UNAM Facultad de Contaduría, Administración e Informática (20)

Bimbo Logística.pdf
Bimbo Logística.pdfBimbo Logística.pdf
Bimbo Logística.pdf
 
HISTORIA DEL CIELO DE CAMILO FLAMARION.pdf
HISTORIA DEL CIELO DE CAMILO FLAMARION.pdfHISTORIA DEL CIELO DE CAMILO FLAMARION.pdf
HISTORIA DEL CIELO DE CAMILO FLAMARION.pdf
 
Apuntes prospectiva
Apuntes prospectivaApuntes prospectiva
Apuntes prospectiva
 
Caso kit kat
Caso kit katCaso kit kat
Caso kit kat
 
Glosario clase mundial
Glosario clase mundialGlosario clase mundial
Glosario clase mundial
 
Clasificacion de-los-costos
Clasificacion de-los-costosClasificacion de-los-costos
Clasificacion de-los-costos
 
El cross docking como herramienta importante en la cadena de abastecimiento..
El cross   docking como herramienta importante en la cadena de abastecimiento..El cross   docking como herramienta importante en la cadena de abastecimiento..
El cross docking como herramienta importante en la cadena de abastecimiento..
 
Conceptosestrategicosyfinancierosparaelexito
ConceptosestrategicosyfinancierosparaelexitoConceptosestrategicosyfinancierosparaelexito
Conceptosestrategicosyfinancierosparaelexito
 
Admon de la demanda
Admon de la demandaAdmon de la demanda
Admon de la demanda
 
Prototipo de producto
Prototipo de productoPrototipo de producto
Prototipo de producto
 
Los 7 practica
Los 7 practicaLos 7 practica
Los 7 practica
 
Determinacion costos-productos-y-servicios-principales
Determinacion costos-productos-y-servicios-principalesDeterminacion costos-productos-y-servicios-principales
Determinacion costos-productos-y-servicios-principales
 
Admnnistracion de mercados
Admnnistracion de mercadosAdmnnistracion de mercados
Admnnistracion de mercados
 
Los_7_habitos_de_la_gente_altamente_eefectiva
  Los_7_habitos_de_la_gente_altamente_eefectiva  Los_7_habitos_de_la_gente_altamente_eefectiva
Los_7_habitos_de_la_gente_altamente_eefectiva
 
Teoria de inventarios
Teoria de inventariosTeoria de inventarios
Teoria de inventarios
 
Top down and bottom up
Top down and bottom upTop down and bottom up
Top down and bottom up
 
Clasificacion de-los-costos
Clasificacion de-los-costosClasificacion de-los-costos
Clasificacion de-los-costos
 
Glosario de terminos logisticos (1)
Glosario de terminos logisticos (1)Glosario de terminos logisticos (1)
Glosario de terminos logisticos (1)
 
Sistemay mercadosfinancieros
Sistemay mercadosfinancierosSistemay mercadosfinancieros
Sistemay mercadosfinancieros
 
Mba finanzas1 1-eoctablero financieroigt
Mba finanzas1 1-eoctablero financieroigtMba finanzas1 1-eoctablero financieroigt
Mba finanzas1 1-eoctablero financieroigt
 

Dernier

NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
UPTAIDELTACHIRA
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
lupitavic
 

Dernier (20)

Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 

mineria de datos

  • 1. El Proceso de la Minería de Datos Ing. Samuel Oporto Díaz (Mag) [email_address]
  • 3.
  • 4. METODOLOGIAS PARA LA MINERIA DE DATOS
  • 6.
  • 7. Visión general Comprensión del negocio Comprensión de los datos Preparación de los datos Modelación Evaluación Despliegue de resultados DATOS
  • 8. Fases Determinación de los objetivos. Definición de Criterios de Éxito. Calificación de la Situación. Determinación de las metas de la Minería de datos Recolectar los datos iniciales. Descripción de los datos. Exploración de los Datos. Verificación de la Calidad de los datos. Selección de Datos. Limpieza de los Datos. Construcción de Nuevos Datos. Formateo de los Datos. Selección de la Técnica de Modelación. Generación de Pruebas para el Modelo. Construcción del Modelo. Calificación del Modelo. Aplicación del modelo a la rutina diaria. Monitoreo y mantenimiento. Reporte Final Evaluación del modelo con respecto a los objetivos del proyecto. Evaluación costo-beneficio. Evaluar su aplicación en la realidad Comprensión de negocio Entendimiento de datos Preparación de datos Modelado Evaluación Despliegue de resultados
  • 10.
  • 11.
  • 12.
  • 13.
  • 14. Comparación SEMMA CRISP Orientado al desarrollo del proceso de MD Orientado a los objetivos empresariales Se inicia analizando los datos Se inicia analizando los objetivos del negocio Ligada a productos SAS Metodología abierta y gratuita Orientado a una metodología de gestión de proyectos
  • 15. EL PROCESO DE LA MINERÍA DE DATOS
  • 16. El Proceso de la Minería de Datos Explotación Data Selección Conocimiento Patrones Minería de Datos Interpretación/ Evaluación Preparación de Datos Data Pre-procesada Datos Modelos Despliegue inducción deducción
  • 17.
  • 18.
  • 19. CRIPS
  • 21. Fases
  • 22. Tareas Genéricas y Resultados
  • 23.
  • 25.
  • 27. Entendimiento de los Datos Recolección de datos iníciales Descripción de los datos Exploración de los datos Verificación de la calidad de los datos univariada multivariada series de datos
  • 28.
  • 30. Preparación de los Datos Limpieza de datos Integración de Datos Transformación de datos Reducción de datos Valores extremos Valores null Valores con ruido Valores inconsistentes Valores mal clasificados Problemas de semántica ¿significa lo mismo? Problemas de temporalidad ¿cuándo fue registrado? Problemas de codificación y formato. Problemas de idioma. Problemas de duplicidad ¿cuál vale? Problema de medio de almacenamiento. Filas: suma y agregación de datos Columnas: log, sin, exp, tan, etc… Funciones entre columnas.
  • 31.
  • 33.
  • 34.
  • 36. Evaluación de Modelos Matriz de confusión Curva ROC Lift charts
  • 37.
  • 39. ESTÁNDARES PARA LA MINERIA DE DATOS
  • 40.
  • 41.
  • 42.
  • 43. HERRAMIENTAS DE SOFTWARE PARA MINERÍA DE DATOS
  • 45. SQL Server Data Mining
  • 47. IBM - DB2 Intelligent Miner
  • 50. Weka
  • 52.
  • 54. Mg. Samuel Oporto Díaz [email_address] http://www.wiphala.net/oporto

Notes de l'éditeur

  1. Mine for: Selection Aggregation Abstraction Visualization Transformation/Conversion Statistical Analysis “ Cleaning”