Curso Ciencia de datos con R, Python y Julia

  • FACULTAD: Facultad de Estadística.
  • DURACIÓN (Horas): 36
  • FECHA DE INICIO: 03 de octubre de 2022
  • FECHA DE TERMINACIÓN: 28 de octubre de 2022
  • HORARIO: 6:00 p.m a 10:00 p.m (martes. miércoles y jueves) 
  • SEDE: Presencial mediado por tecnología (PMT)
  • DIRIGIDO A: Profesionales de cualquier área del conocimiento
  • REQUISITOS DE INGRESO: Profesionales de cualquier área del conocimiento
  • REQUISITOS DE ACREDITACIÓN: N/A

DESCRIPCIÓN DEL PROGRAMA 

Sin duda alguna, la era digital con la conexión a la red donde se comparte gran cantidad de información diariamente y los grandes avances computacionales han permitido y facilitado el acceso a grandes bases de datos, la importancia que tiene un manejo adecuado de esta información para fortalecer procesos de toma de decisiones ha sido ampliamente resaltada: “En la siguiente década un número creciente de empleos van a requerir altos niveles de conocimientos en las áreas de las matemáticas y la estadística. Las oportunidades laborales se esperan que sean muy favorables para aquellos que tengan fuertes habilidades en lo cuantitativo y el análisis de datos y por supuesto tener habilidades en el uso de lenguajes de programación resulta una herramienta indispensable en el manejo de datos.” (Fuente: https://www.bls.gov/ooh/math/mathematicians-and-statisticians.htm#tab-6). La estadística se multiplica en la vida cotidiana y es transversal a todas las disciplinas y áreas del conocimiento, en muchos casos, la escasez de profesionales hace que otras disciplinas se encarguen de esos estudios, como los economistas, ingenieros, matemáticos, los sociólogos, psicólogos. Profesionales de distintas áreas ven la necesidad de formarse en temas estadísticos para incrementar sus competencias laborales y apoyar de forma más eficaz la toma de decisiones a través de un uso adecuado de la información disponible. De lo anterior, resulta fácil inferir que la estadística se ha convertido en uno de los referentes científicos más importantes. Porque ella aporta elementos fundamentales para la aplicación práctica de buena parte de las demás ciencias; porque resulta un elemento imprescindible para cualquier organización política, social y empresarial.

En este sentido, saber utilizar una herramienta computacional para el análisis de datos es imprescindible pues ellas nos permiten analizar grandes volúmenes de datos en un tiempo muy reducido, analizar varios modelos, realizar múltiples predicciones, ajustes y comparaciones. Actualmente existen una gran cantidad de programas estadísticos disponibles R, Python, Julia, SAS, SPSS, SPAD, Stata, Statgraphics, Minitab, Matlab, S-PLUS, LISREL, Excel, PSPP entre otros. Algunos de ellos son software propietario y otros corresponden a software libre. En este curso de 30 horas, se propone una introducción al análisis de Datos a través de las herramientas de software más populares y versátiles: R, Python y Julia. Es un curso diseñado para dar un panorama general del uso de estos tres lenguajes en el contexto del análisis y visualización de datos. Python: Python se ha convertido en una de las herramientas más utilizadas y quizá la más importante, por su sencillez y versatilidad en distintas aplicaciones, análisis de datos y machine learning. Algunas de las ventajas ampliamente reportadas en la web, sobre el uso de python son:

  • Es un programa sencillo frente a otros lenguajes de programación, muchos expertos lo recomiendan para aprender a programar por su sencillez y alta capacidad
  • Multiplataforma: Se pude programar en Python en cualquier sistema operativo. Disponible para Linux, Windows, Mac OS, etc.
  • Desarrollado bajo una licencia Open-Source y gratuita. “Es administrado por la Python Software
  • Foundation. Posee una licencia de código abierto, denominada Python Software Foundation License,2 que es compatible con la Licencia pública general de GNU a partir de la versión 2.1.1, e incompatible en ciertas versiones anteriores.”” https://es.wikipedia.org/wiki/Python
  • Python es multipropósito: Una de las ventajas es que su uso se extiende desde aplicaciones sencillas hasta las más sofisticadas en ciencia de datos, inteligencia artificial, entre otras.
  • Librerías en Inteligencia artificial y machine learning: Contiene importantes librerías de importantes empresas tecnológicas como TensorFlow de Google y PyTorch de Facebook, especializadas en estas dos áreas.

R y Rstudio: El lenguaje más utilizado y famoso en el ramo de la estadística es R. Este cuenta con ciertas virtudes y ventajas ampliamente reportadas en la literatura:

1) R es un software libre cuenta con la licencia GNU GPL (General Public License),
2) Es de código abierto, El código está disponible en cualquier plataforma de desarrollo colaborativo como GitHub.
3) Es multiplataforma, funciona para Windows, Mac, Linux.
4) Esta alimentado por un conjunto grande de paquetes. Los paquetes son colecciones de funciones, datos y código R que se almacenan en una carpeta conforme a una estructura bien definida, fácilmente accesible para R y que permite que para casi toda técnica estadística tengamos a la mano un paquete de funciones bien documentado que podemos adaptar y mejorar de acuerdo a nuestros objetivos. Esta es quizá su mayor fortaleza pues permite utilizar una gran cantidad de técnicas estadísticas.
5) Las herramientas gráficas de visualización de datos en R tienen una gran versatilidad.
6) Permite interactuar con otros programas tales como SPSS, Excel y Stata
7) Es empleado por entidades estatales como el DANE y Icfes para el procesamiento de datos.

Julia: “Julia se originó por la necesidad de contar con un lenguaje moderno, rápido, legible y multiplataforma para su uso en aplicaciones técnicas, académicas y científicas. Respecto de las disciplinas beneficiadas de manera directa, se pueden enunciar las siguientes: cálculo infinitesimal, ecuaciones diferenciales, álgebra matricial, geometría, investigación de operaciones, estadística, física cuántica, astrofísica, bioquímica, bioinformática, genética, ecología, criptografía, economía, finanzas, entre otras. Sus inicios se remontan al año 2009, con los trabajos de Jeff Bezanson, Stefan Karpisnki, Viral B. Shah y Alan Edelman [3], pero, es en 2012 cuando crearon un sitio web alusivo al proyecto de desarrollo; lo cual ha permitido la conformación de una comunidad de usuarios que contribuyen de manera entusiasta y comprometida a su desarrollo. Los creadores concibieron el proyecto de trabajo estableciendo parámetros comparables con otros lenguajes de programación; asimismo, se planeó que su curva de aprendizaje fuese similar a la de Python, que incorporara el dinamismo de Ruby, la velocidad de C, la capacidad de procesamiento cadena de caracteres de Perl, la facilidad para cálculo matricial de Matlab; además, la potencia en análisis y visualización de datos en R.” (Estadística computacional con Julia.
Ventajas de su enseñanza en la universidad. Revista digital — Matemática, Educación e Internet, Vol 20, No 2. Marzo − Agosto, 2020)

Ventajas reportadas:

1) Es un lenguaje multiplataforma de forma que puede ejecutarse en Linux, Windows y macOS.
2) Es software libre y puede ser descargado de su página web de forma gratuita.
3) Se dice que Julia tiene la facilidad de uso de Python y la velocidad de C.
4) Julia tiene una sintaxis de alto nivel que es fácil de aprender.
5) Julia tiene una biblioteca estándar extendida, además, están disponibles numerosos paquetes de terceros.


OBJETIVOS O PROPÓSITOS FORMATIVOS DEL PROGRAMA

Este curso le permitirá al estudiante avanzar de forma progresiva en el uso de estos lenguajes de programación de alto nivel, y le dará al estudiante las herramientas necesarias para iniciar un proceso de autoaprendizaje en estructuras más avanzadas de acuerdo con sus necesidades.

Para los tres software estadísticos R, Python y Julia este curso se propone proporcionar al estudiante las competencias necesarias para iniciar en estos lenguajes de programación, familiarizándose con su sintaxis, las estructuras de programación básicas y algunas herramientas de exploración y visualización de datos.


JUSTIFICACIÓN

Este curso responde a las necesidades que tienen profesionales de distintas áreas del conocimiento en formarse y fortalecer sus habilidades en el tema de análisis de datos, uso de software y herramientas computacionales. 


CONTENIDO PROGRAMÁTICO

Módulo I: R para el manejo de datos

  • Introducción: Instalación R y rstudio, elaboración de Scripts y directorios de trabajo, importar y exportar bases de datos en distintos formatos, tipos de datos, clases de objetos (Vectores, Matrices, Listas y data frames).
  • Manejo de información estadística: Bases de datos, visualización de datos, Visualización gráfica de variables continuas y cruces de variables, Gramática de gráficos. uso de los paquetes tidyverse

Módulo II: Python para el manejo de datos

  • Conceptos básicos en Python y operaciones con datos
  • Funciones, paquetes y manejo de bases
  • Web scrapping, exploración de datos y análisis estadístico

Módulo III: Julia para el manejo de datos

  • Presentación del lenguaje
  • Instalación
  • Consola
  • Paquetes
  • IDE ́s
  • Funciones, métodos y tipos
  • Arreglos
  • Algunos paquetes para Estadística.

USTA

Institución de Educación Superior, reconocida mediante Resolución 3645 del 06 de agosto de 1965 expedida por el Ministerio de Justicia

Institución de Educación Superior sujeta a la inspección y vigilancia del Ministerio de Educación Nacional - SNIES 1704

Línea gratuita nacional:
01 8000 111 180
Bogotá, PBX: 587 87 97

Condiciones de uso PORTAL WEB
Aviso de privacidad

       
Sello Multicampus Icontec IQNet Acreditación Internacional
       
       
       
       
rtp demo pragmatic slot demo slot online gacor https://slot-demo.itifistas.edu.co/