
Data Mining y Big Data
Curso
Online

Controla el manejo efectivo de la información
-
Tipología
Curso
-
Nivel
Nivel intermedio
-
Metodología
Online
-
Duración
15 Semanas
-
Inicio
Fechas disponibles
-
Campus online
Sí
-
Servicio de consultas
Sí
-
Clases virtuales
Sí
Presentar de manera sistemática las técnicas y herramientas que permiten analizar grandes cantidades de datos y descubrir relaciones ocultas pero presentes en ellos de manera de contribuir con nueva información al proceso de toma de decisiones y predicción de fenómenos futuros.
Capacitar en la aplicación y el uso de las técnicas y herramientas necesarias para desarrollar modelos de minería de datos de manera que el participante, luego de haber terminado el curso, esté en condiciones de aplicarlos en su tarea diaria.
Aplicar los contenidos aprendidos en casos de aplicación relacionados con las disciplinas de la ingeniería de cada participante o en casos simulados presentados por el docente: producción, mantenimiento, medioambiente, logística, diseño industrial, desarrollo de software, marketing.
Sedes y fechas disponibles
Ubicación
inicio
inicio
Información relevante sobre el curso
¿Por qué estudiar en la UCA? El conocimiento es el activo de mayor valor en los negocios actuales,pues permite diferenciarse de la competidores y gestionar efectivamente el resto de los activos de la organización. El conocimiento existe en todos las funciones del negocio, incluyendo compras, marketing, diseño, manufactura, producción, mantenimiento y distribución, pero es de difícil identificación, captura y gestión. Estos reservorios de datos son una fuente de alto potencial de nuevo conocimiento para la organización, y es aquí donde el Data Mining puede utilizarse para modelar, clasificar, y hacer predicciones para numerosas aplicaciones. Este curso de posgrado le brinda al participante información y práctica suficiente para implementar aplicaciones de descubrimiento de conocimiento a partir delos datos recolectados y almacenados en su organización. La implementación de la modalidad on-line permite que los alumnos que se encuentran alejados dela ciudad de Buenos Aires puedan realizar el curso en forma virtual por medio de una plataforma de e-learning interactiva, en el horario y días que cada uno determine y a un ritmo semanal. La formación virtual se complementa con una clase optativa presencial en Buenos Aires, para lo cual se requiere de un único viaje de traslado. En la misma se vivencia una aplicación real y se discuten los trabajos de aplicación a ser realizados por los diversos grupos de participantes.
Graduados universitarios, graduados de carreras terciarias, idóneos o ejecutivos previa comprobación de conocimientos necesarios. Lectura de material en idioma inglés.
Copia legalizada del Título universitario (de corresponder) Currículo Vitae. Copia del DNI (argentinos) o Documento de Identidad vigente (extranjeros). Foto carnet (formato JPG o similar).
Opiniones
Logros de este Centro
Todos los cursos están actualizados
La valoración media es superior a 3,7
Más de 50 opiniones en los últimos 12 meses
Hace 13 años que este centro está en Emagister.
Materias
- Patrones
- Data Mining
- Redes
- Programación
- Fundamentos
- Modelos
- Bbdd
- Bases de datos
- Minería de Datos
- Proyectos
- Clasificación
- Ejercicios
- Visualización
- Big Data
- Procesamiento de datos
- Etnografías
- Scrapping
- API´s
- Clustering
- Métodos avanzados
- Casos de aplicación
Plan de estudios
Contenido Académico:
Introducción a la minería de datos¿Qué es y qué no es Data Mining? Aplicaciones de la minería de datos en las organizaciones: predicciones bursátiles, marketing, detección de fraudes, patrones de fuga, producción, mantenimiento, logística, ciencia. Introducción a las herramientas deminería de datos: métodos predictivos y descriptivos. Tareas de Data Mining: clasificación, agrupamiento (clustering), descubrimiento de reglas de asociación, descubrimiento de patrones secuenciales, regresión, detección de anomalías.
Selección y pre-procesamiento dedatosIntroducción a los proyectos de inteligencia de negocios (Business Intelligence). Manejode datos e información. Bases de datos (Data Warehousing). Selección e integraciónde datos. Pre-procesamiento de datos: limpieza, integración, transformación, reducción,y discretización de datos.
ClasificaciónEjemplos de problemas de clasificación. Árboles de decisión. Clasificadores basados enreglas. Métodos bayesianos: Naïve Bayes. Máquinas de soporte vectorial (Support Vector Machines). Redes Neuronales: perceptrón multicapa. Vecinos más cercanos.Implementación de clasificadorescon paquete de software libre WEKA (Universidad deWaikato, Nueva Zelandia).
ClusteringAplicaciones del análisis de clustering: descriptiva y sumarización. Clasificación de de clusters: jerárquico/particional, exclusivos/no-exclusivos, fuzzy/no-fuzzy, parcial/completo, heterogéneo/homogéneo. Tipo de clusters: bien separados,basadosen centros, contiguos, basados en densidad, conceptuales, descritos por unafunción objetivo. Medidas de similaridad. Algoritmos de clustering: vecinos máscercanos,clustering jerárquico y basado en densidad. Análisis de casos.
Aspectos prácticosAspectos prácticos al implementar clasificadores: sobreajuste, subajuste, valoresfaltantes, expresividad, evaluación y comparación de modelos (métricas y métodos).Reducción de la dimensionalidad. Desbalanceo de clases.
Multimedia Data MiningAplicación de herramientas de Data Mining en datos provenientes de imágenes, videos, audio y habla.
Casos de aplicación de Data MiningIntroducción al paquete de software libre “R” (R Foundation for Statistical Computing). Aplicación de los métodos de regresión múltiple y regresión LASSO. Aplicación de redes neuronales aun proceso de negocios. Determinación de las causas de fallaempleando la metodología de Clustering. Aplicación de la reducción de dimensionalidaden un proceso industrial.
Big Data¿Qué es Big Data? Gestión de grandes volúmenes de datos ¿Cómo trabaja Map-Reduce? Entorno Open-Source de software para procesamiento y almacenamiento distribuido: Apache Hadoop. Algoritmos de Data Mining en Big Data. Computación iterativa distribuida. Entorno para el procesamiento en cluster de computadoras: Apache Spark.
Trabajo finalEl trabajo final se realiza en forma grupal y tiene como finalidad que los participantesapliquen losconocimientos adquiridos durante el curso en la resolución de problemasde casos reales de sus organizaciones. Algunos trabajos presentados en ediciones anteriores:
- Optimización del diseño de productos siderúrgicos para el cumplimiento de especificaciones de atributos cualitativos.
- Optimización en el proceso de resolución de siniestros de daños materiales en automotores mediante el Sistema CLEAS.
- Análisis de datos antropométricos del cráneo humano: estrategias de clasificación y modelado.
- Determinación de la flota de equipos mineros más eficiente para la extracción de material desde un determinado PIT en Santa Cruz.
- Determinación de áreas inundadas a través del uso de imágenes satelitales y fotografías aéreas.
- Aplicación de técnicas de Data Mining para la detección de operaciones sospechosas de Lavado de Dinero.
- Reducción de tiempos en el proceso de cobranza de una empresa de venta de equipos de informática.
- Reducción de siniestros en una empresa de transporte público de pasajeros.
- Segmentación de compradores de camas náuticas en una guardería de lanchas.
- Optimización de parámetros de diseño de recubrimientos comestibles de alimentos.
- Detección de Inicios de Calidad en Venta Directa
- Mantenimiento de flota logística
- Parámetros de Inyección de pieza plástica vs pieza no conforme de calidad
- Predicción de compra de clientes
Información adicional
Data Mining y Big Data