- Facultad: Estadística
- Duración (Horas): 120 horas.
- Fecha de inicio y horario: 02 de diciembre de 2024
- Fecha de cierre y horario: 24 de enero de 2025
- Valor de la inscripción: $2.500.000
- Dirigido a: PMT: Este curso se ofrecerá a través de conexión remota a través de Microsoft Teams. Todos los encuentros se realizarán de forma sincrónica donde se tendrá interacción permanente entre el docente y los estudiantes, habrá intercambio de conocimiento en tiempo real.
- Modalidad: PMT (Presencial Mediado por Tecnología)
Descripción:
Cursar un diplomado en Gestión de Bases de Datos y Análisis Avanzado de grandes volúmenes de Datos con herramientas como Python, SQL Server y Big Data es importante por varias razones clave, especialmente en el contexto actual donde los datos son fundamentales para la toma de decisiones estratégicas en casi todas las industrias. Algunas razones son: Alta demanda en el mercado laboral: Las empresas buscan profesionales con habilidades en la gestión de bases de datos y análisis avanzado, ya que cada vez más organizaciones dependen del análisis de grandes volúmenes de datos para obtener información valiosa que optimice procesos, identifique oportunidades y resuelva problemas. Manejo de grandes volúmenes de datos (Big Data): El diplomado te enseña a gestionar y analizar Big Data, un tipo de dato cada vez más común en áreas como comercio, finanzas, salud y tecnología. Poder gestionar y extraer información útil PRESENTACIÓN DE PROGRAMAS DE EDUCACIÓN CONTINUA Código: 2020-F-127 Versión: 01 Emisión: 30 - 04 - 2014 Página 2 de 8 de grandes conjuntos de datos es crucial en un mundo donde la cantidad de información disponible sigue creciendo exponencialmente. Python y SQL Server, herramientas esenciales: • Python es uno de los lenguajes de programación más utilizados en el análisis de datos por su versatilidad, facilidad de uso y potentes bibliotecas (como Pandas, NumPy y Scikit-learn) que facilitan el análisis y la visualización de datos. • SQL Server es una herramienta robusta para gestionar bases de datos relacionales, permitiendo consultas eficientes para acceder y organizar datos estructurados de manera precisa. Análisis avanzado: El diplomado no solo cubre la gestión de bases de datos, sino también técnicas avanzadas de análisis, lo que permite interpretar los datos de manera profunda y generar insights que apoyen la toma de decisiones basadas en datos (data-driven decision making). Esto es especialmente útil para el análisis predictivo y la inteligencia empresarial. Competitividad: Tener un diplomado en esta área le brinda al estudiante, una ventaja competitiva frente a otros profesionales, al demostrar que no solo tiene conocimientos teóricos, sino también habilidades prácticas para trabajar con herramientas de análisis y gestión de datos actuales. Soluciones integrales: Aprender a combinar el poder de Big Data con el uso de tecnologías modernas te permite ofrecer soluciones integrales que abarcan desde la recopilación de datos hasta el análisis avanzado, lo que es fundamental para la innovación y mejora continua en las empresas.
Objetivos:
- Proporcionar al estudiante las competencias necesarias para iniciar en el lenguaje de programación Python, familiarizándose con su sintaxis, las estructuras de programación básicas y algunas herramientas de exploración y visualización de datos. Este curso le permitirá al estudiante avanzar de forma progresiva en el uso de este lenguaje de programación de alto nivel, y le dará al estudiante las herramientas necesarias para iniciar un proceso de autoaprendizaje en estructuras más avanzadas de acuerdo con sus necesidades.
Contenido Programático:
El diplomado se encuentra conformado por los siguientes módulos:
Módulo 1: Introducción a bases de datos con Python. (24 horas)
• Introducción a bases de datos y su importancia.
• Conceptos básicos de SQL (Structured Query Language).
• Introducción a Python y bibliotecas relacionadas (p. ej., SQLite, SQLAlchemy, pandas).
• Conexión y manipulación de bases de datos usando Python.
• Prácticas de modelado y diseño de bases de datos.
Módulo 2: Bases de Datos MICROSOFT SQL SERVER (36 horas)
• Introducción a Microsoft SQL Server y sus componentes.
• Conceptos básicos de T-SQL (Transact-SQL).
• Diseño y modelado de bases de datos en SQL Server.
• Manipulación de datos y administración de bases de datos.
• Optimización y seguridad en SQL Server.
Módulo 3: Databricks y Apache Spark para Big Data. (24 horas)
• Fundamentos de Apache Spark y su arquitectura.
• Introducción a Databricks y su integración con Spark.
• Procesamiento de datos en tiempo real y por lotes.
• Optimización y buenas prácticas en Spark y Databricks.
Módulo 4: Introducción en minería de datos y redes Neuronales (36 horas)
• Métodos de clasificación, regresión y clustering.
• Conceptos de aprendizaje supervisado y no supervisado.
• Arquitectura básica de una red neuronal: capas, nodos y funciones de activación.
• Algoritmo de retropropagación.
• Implementación de redes neuronales con Keras y TensorFlow.
• Aplicación de algoritmos a conjuntos de datos reales.