Los Mejores Cursos Online en Ciencia de Datos

Jairo Mejía y Joan Llop

d&a blog

El perfil profesional del científico de datos está en auge, y, como consecuencia, cada vez tenemos una mayor oferta de formación a nuestra disposición, tanto para aquellos que buscan especializarse en campos específicos con un nivel avanzado como para los que desean iniciarse en el mundo de la ciencia de datos.

Además de los cursos y másteres presenciales, que ya abordamos anteriormente en este artículo, existen una gran variedad de cursos online para aquellos que requieran de mayor flexibilidad en su formación. Desde los conceptos fundamentales del aprendizaje autónomo (Machine Learning) hasta especializaciones en modelos probabilísticos, la oferta de formación en línea respecto a ciencia de datos se adapta a todos los niveles y necesidades. En las siguientes líneas presentamos una selección de cursos recomendados por científicos de datos de BBVA Data & Analytics, ordenados según el nivel de especialización. Se trata de un listado basado en la opinión personal de varios compañeros y compañeras, por lo que no se debe tomar como una guía exhaustiva.

Nuestra selección centra el aprendizaje en los conocimientos y técnicas fundamentales en ciencia de datos, abordando conceptos como Deep Learning, Machine Learning, o Natural Processing Language (NLP), entre otros. Algunos de estos cursos en línea son específicos para la materia tratada, mientras que otros forman parte de un programa de formación más amplio que incluye más cursos.

Nivel básico / principiante

En este primer nivel incluimos aquellos cursos en línea que aportan una base de conocimientos para iniciarse en la ciencia de datos. Ofrecen una primera aproximación a los lenguajes y herramientas utilizados, así como una explicación de conceptos como Deep Learning o Machine Learning.

  • Especialización en Data Science.  Creado por la Universidad Johns Hopkins. Este programa de formación está compuesto por 10 cursos de diferente duración destinados a principiantes que se quieran iniciar en el mundo de la ciencia de datos. Su enfoque persigue aglutinar todos los conceptos básicos que guían la ciencia de datos. Disponible en Coursera.
  • Deep Learning Course. Creado por Lazy Programmer. Como en el caso anterior, se trata de un conjunto de cursos en línea enmarcados en el concepto de Deep Learning, pero que repasa prácticamente todos los conceptos de ciencia de datos desde un nivel básico, pasando por Machine Learning o NLP. La sencillez de las explicaciones son uno de los puntos fuertes de estos cursos.
  • Machine Learning Foundations: a case study approach. Creado por la Universidad de Washington. Con un tiempo de dedicación aproximado de entre 30 y 48 horas, este curso enseña casos prácticos para la mayoría de los problemas típicos de Machine Learning, como regresiones, predicciones o clasificaciones. Bien explicado. Es el primer curso del programa de formación Machine Learning Specialization, formado por cuatro cursos y disponible en Coursera.

Nivel intermedio

Aunque se siguen abordando conceptos básicos de Machine Learning y Deep Learning, el grado de especialización es mayor en este segundo nivel. Hay cursos con más peso teórico y otros centrados fundamentalmente en la parte práctica, pero todos requieren algunos conocimientos previos.

  • Machine Learning. Creado por la Universidad de Stanford. Con un temario estructurado en 11 semanas, se trata de un curso que contempla todos los conceptos básicos de Machine Learning desde un enfoque teórico, pero sin perder el punto de vista aplicado. El nivel es alto y resulta muy recomendable para quien quiera empezar a saber qué es Machine Learning y sus matemáticas, así como para quien quiera refrescar algunos conceptos vistos en el pasado. Eso sí, requiere esfuerzo para entender los detalles matemáticos y dedicación para realizar las prácticas. Es impartido por Andrew Ng, gurú en Machine Learning, y está disponible en Coursera.
  • Text Retrieval and Search Engines y Text Mining and Analytics. Creado por la Universidad de Illinois. Ambos cursos pertenecen al programa de formación especializado en Data Mining y constituyen una buena introducción a las técnicas clásicas de NLP, la analítica de texto, los buscadores y los sistemas de recomendación basados en contenido. Su tiempo de dedicación estimado es de 20 horas cada uno. Además, estos dos cursos introducen el modelo vectorial de documentos, TF-IDF, técnicas de evaluación de clasificadores y buscadores, análisis de sentimiento, clusterización de documentos, modelado de topics y visualización. Son, sin duda, un buen complemento a otros cursos de NLP para Deep Learning que suelen centrarse en problemas supervisados. Disponibles en Coursera.
  • Practical Deep Learning For Coders. Creado por el Data Institute en la USF e impartido por Jeremy Howard (Kaggle’s Grandmaster #1 durante varios años), requiere una dedicación de siete semanas. El temario está dividido en dos partes y el enfoque es muy práctico, abordando contenido que va desde “Embeddings”, “Structured Deep Learning”, “Collaborative Filtering” hasta “Natural Language Processing” o “Generative Adversarial Networks”. Además, utiliza una librería de elaboración propia sobre PyToch. Tiene nuevas ediciones año tras año por lo que está muy actualizado a las últimas técnicas en Deep Learning.

Nivel avanzado / experto

Los cursos mostrados aquí están dirigidos para profesionales que quieran ampliar su formación, por lo que se abordan temas más específicos y con mayor complejidad técnica.

  • Probabilistic Graphical Models. Creado por la Universidad de Stanford. Un total de tres cursos (“Representación”, “Inferencia” y “Aprendizaje”) componen este programa de especialización sobre modelos probabilísticos gráficos (Bayesian Networks y Markov Networks) con aplicaciones en aprendizaje automático y modelos de decisión. Uno de los mejores aspectos es que los ejercicios (Matlab, Octave) requieren bajar al detalle, lo que en este caso facilita mucho interiorizar los conceptos teóricos de la parte de inferencia y aprendizaje.
  • Deep Learning by Google. Creado por Google y pensado para un tiempo de dedicación de tres meses. Se trata de un curso avanzado de introducción al mundo de Deep Learning, muy completo y que aborda temas a muy bajo nivel, por lo que resulta perfecto para aquellos que quieran convertirse en profesionales. Disponible en Udacity.