Data mining & big data

Pontificia Universidad Católica Argentina - UCA
Online

Precio a consultar
¿Querés hablar con un Asesor sobre este curso?

Información importante

Tipología Especialidad
Metodología Online
Inicio Fechas a escoger
  • Especialidad
  • Online
  • Inicio:
    Fechas a escoger
Descripción

El curso de posgrado de Data Mining & Big Data (DMI) le brinda al participante información y práctica suficiente para implementar aplicaciones de descubrimiento de conocimiento a partir de los datos recolectados y almacenados en su organización.
La implementación de la modalidad online permite que los alumnos que se encuentran alejados de la ciudad de Buenos Aires puedan realizar el curso en forma virtual por medio de una plataforma de e- learning interactiva, en el horario y días que cada uno determine y a un ritmo semanal. La formación virtual se complementa con una clase optativa presencial en Buenos Aires, para lo cual se requiere de un único viaje de traslado. En la misma se vivencia una aplicación real y se discuten los trabajos de aplicación realizados por los diversos grupos de participantes.
Fecha de inicio: Próximas fechas a confirmar.

Sedes

Dónde se enseña y en qué fechas

inicio Ubicación
Fechas a escoger
Online
inicio Fechas a escoger
Ubicación
Online

Preguntas Frecuentes

· ¿Cuáles son los objetivos de este curso?

Presentar de manera sistemática las técnicas y herramientas que permiten analizar grandes cantidades de datos y descubrir relaciones ocultas pero presentes en ellos de manera de contribuir con nueva información al proceso de toma de decisiones y predicción de fenómenos futuros. Capacitar en la aplicación y el uso de las técnicas y herramientas necesarias para desarrollar modelos de minería de datos de manera que el participante, luego de haber terminado el curso, esté en condiciones de aplicarlos en su tarea diaria. Aplicar los contenidos aprendidos en casos de aplicación relacionados con las disciplinas de la ingeniería de cada participante o en casos simulados presentados por el docente: producción, mantenimiento, medioambiente, logística, diseño industrial, desarrollo de software, marketing.

· ¿A quién va dirigido?

El curso se dirige a profesionales de la ingeniería y técnicos que participan de los procesos relacionados con el diseño de productos y procesos, la planificación de la producción, el control, el mantenimiento de activos, la gestión ambiental, así como todas aquellas actividades del negocio factibles de identificar, capturar y gestionar conocimiento, a profesionales de áreas staff relacionados con las anteriores y consultores de empresas. Perfil de los alumnos a anteriores ediciones: Cargo: Analista de Procesos y calidad, Analista Depto. Operaciones, Analista Senior BI, Auditor Interno Sr, Auditor Sr de TI, Autoridad de la cuenca, Consultora, Contratista de Ternium, Coordinador planta H2, Director Obras de Red, Gerente Ingeniería, Gestor de la Demanda, Ingeniero ATP, Ingeniero de IT, Ingeniero Producto y analista en Investigación y Desarrollo, Líder Proyectos, Profesor, Profesor / Investigador, Project Manager, Regional Business Developer, Resp. Base datos, Responsable Planificación mantenimiento de mina, Software Developer, Team Member BI Estudios: Analista Sistemas, Analista Universitario, Contadora Pública, Dr. Física, Ing. Civil, Ing. Electricista Mag. C.Computación, Ing. Electromecánico, Ing. Electrónico, Ing. Electrónico, Mag., Esp., Ing. Industrial, Ing. Informática, Ing. Mecánico, Ing. Nuclear, Ing. Químico, Ing. Sistemas, Ing. Sistemas Información, Lic. Matemática, Lic. Sistemas, Contador, Mag., Esp., Ing. Sistemas. Empresas: Alcatel-Lucent, Arcor, AUTOCON, Banco San Juan, Bco. Supervielle, Cerro Vanguardia, Cesvi, Comité Interjurisdiccional del Río Colorado, CONAE, CONUAR, Entidad Binacional Yacyreta, Grisino Indumentaria, HAC, HLTNetwork, Hychico – CAPSA, Loma Negra, Nokia, Tarjeta Naranja, TATA Consulting Services, Telefónica de Argentina, Telefonica Movistar Ecuador, UCA, UTN B.Blanca - U.del Sur, VATES – CONAE.

· Titulación

Curso de Posgrado Online

Opiniones

Todavía no hay opiniones de este curso

¿Qué aprendés en este curso?

Data Mining
Redes
Ejercicios
Programación
Proyectos
Fundamentos
Modelos
Bbdd
Bases de datos
Etnografías
Visualización
Scrapping
API´s

Temario


MÓDULO

MODALIDAD

CARGA HORARIA

Introducción a la minería de datos

Online
8/5 al 24/7/17













7

Selección y pre-procesamiento de datos

5

Clasificación

20

Clustering

5

Métodos avanzados

5

Casos de aplicación de Data Mining

10

Big Data & tendencias actuales

5

Trabajos Final Grupal

20

Demostración de tecnología actual y presentación de trabajos finales


Presencial

8


Módulo 1: Introducción a la minería de datos

¿Qué es y qué no es Data Mining?. Aplicaciones de la minería de datos en las organizaciones: predicciones bursátiles, marketing, detección de fraudes, patrones de fuga, producción, mantenimiento, logística, ciencia. Introducción a las herramientas de minería de datos: métodos predictivos y descriptivos. Tareas de Data Mining: clasificación, agrupamiento (clustering), descubrimiento de reglas de asociación, descubrimiento de patrones secuenciales, regresión, detección de anomalías.

Módulo 2: Selección y pre-procesamiento de datos

Introducción a los proyectos de inteligencia de negocios (Business Intelligence). Manejo de datos e información. Bases de datos (Data Warehousing). Selección e integración de datos. Pre-procesamiento de datos: limpieza, integración, transformación, reducción, y discretización de datos.

Módulo 3: Clasificación

Ejemplos de problemas de clasificación. Clasificadores perezosos (eager learners) y ansiosos (lazy learners o instance learners). Árboles de decisión. Clasificadores basados en reglas. Métodos bayesianos: Naïve Bayesy Redes Bayesianas. Modelos lineales: regresión, regresión logística. Máquinas de soporte vectorial (Support Vector Machines). Redes Neuronales: perceptrón multicapa. Vecinos más cercanos. Implementación de clasificadores con paquete de software libre WEKA (Universidad de Waikato, Nueva Zelandia). Aspectos prácticos al implementar clasificadores: sobreajuste, subajuste, valores faltantes, expresividad, evaluación y comparación de modelos (métricas y métodos). Análisis de casos.

Módulo 4: Clustering

Aplicaciones del análisis de clustering: descriptiva y sumarización. Clasificación de de clusters: jerárquico/particional, exclusivos/no-exclusivos, fuzzy/no-fuzzy, parcial/completo, heterogéneo/homogéneo. Tipo de clusters: bien separados, basados en centros, contiguos, basados en densidad, conceptuales, descritos por una función objetivo. Medidas de similaridad. Algoritmos de clustering: vecinos más cercanos, clustering jerárquico y basado en densidad. Análisis de casos.

Módulo 5: Métodos avanzados

Reducción de la dimensionalidad. Análisis de componentes principales. Análisis de componentes independientes. Redes neuronales aplicadas a la reducción de la dimensión. Análisis de casos. Clasificadores de ensamble. Clasificadores basados en las técnicas de boosting, bagging, stacking, y aleatoriedad.

Módulo 6: Casos de aplicación de Data Mining

Introducción al paquete de software libre “R” (R Foundation for Statistical Computing). Aplicación de los métodos de regresión múltiple y regresión LASSO. Aplicación de redes neuronales a un proceso de negocios. Determinación de las causas de falla empleando la metodología de Clustering. Aplicación de la reducción de dimensionalidad en un proceso industrial.

Módulo 7: Big Data

¿Qué es Big Data? Gestión de grandes volúmenes de datos ¿Cómo trabaja Map-Reduce? Entorno Open-Source de software para procesamiento y almacenamiento distribuido: Apache Hadoop. Algoritmos de Data Mining en Big Data. Computación iterativa distribuida. Entorno para el procesamiento en cluster de computadoras: Apache Spark.

Módulo 8: Trabajo final

El trabajo final se realiza en forma grupal y tiene como finalidad que los participantes apliquen los conocimientos adquiridos durante el curso en la resolución de problemas de casos reales de sus organizaciones. Algunos trabajos presentados en ediciones anteriores:

  • Optimización del diseño de productos siderúrgicos para el cumplimiento de especificaciones de atributos cualitativos.
  • Optimización en el proceso de resolución de siniestros de daños materiales en automotores mediante el Sistema CLEAS.
  • Análisis de datos antropométricos del cráneo humano: estrategias de clasificación y modelado.
  • Determinación de la flota de equipos mineros más eficiente para la extracción de material desde un determinado PIT en Santa Cruz.
  • Determinación de áreas inundadas a través del uso de imágenes satelitales y fotografías aéreas.
  • Aplicación de técnicas de Data Mining para la detección de operaciones sospechosas de Lavado de Dinero.
  • Reducción de tiempos en el proceso de cobranza de una empresa de venta de equipos de informática.
  • Reducción de siniestros en una empresa de transporte público de pasajeros.
  • Segmentación de compradores de camas náuticas en una guardería de lanchas.

Usuarios que se interesaron por este curso también se interesaron por...
Ver más cursos similares