Roadmap para Inteligencia Artificial y Data

Roadmaps, guías y recursos para aprender sobre Inteligencia Artificial, Ciencia de Datos y Análisis de Datos.

27 de abril de 2024

La Inteligencia Artificial ha dado mucho de qué hablar en los últimos años, lo que ha hecho que mucha gente no solo en el área de la tecnología, sino en otras áreas de trabajo, tenga un gran interés por aprender cómo usar estas tecnologías o incluso crearlas.

Siendo estudiante, no puedo dar como un hecho que tengo los mejores recursos para aprender sobre estos temas, pero quiero compartir algunas guías y recursos que he encontrado para estudiar y aprender sobre ello. Te daré las herramientas y algunos puntos de vista de cómo los he usado yo.

AI and Data Scientist Roadmap te da una guía sobre qué temas debes aprender y en qué orden, además de que incluye enlaces a recursos para aprender sobre cada tema por separado. Un resumen sobre el Roadmap es el siguiente:

1. Matemáticas:

  • Álgebra lineal
  • Probabilidad
  • Estadística

2. Código

  • Programación con Python
  • Kaggle
  • Estructuras de Datos
  • SQL

3. Análisis Exploratorio de Datos (EDA)

  • Análisis de Datos con Pandas
  • Análisis Exploratorio de Datos con Seaborn

4. Machine Learing

  • Cursos de Machine Learning
  • Reconocimiento de Patrones y Machine Learning

5. Deep Learning

  • Especialización en Deep Learning

Comparto también otro Roadmap del YouTuber Rafa Gonzalez Gouveia que lo divide en 4 bloques principales.

Roadmap Rafa Gonzales Gouveia

Puedes encontrar su Roadmap en su repositorio de GitHub o ver su vídeo de YouTube para tener una mejor explicación de él mismo.

Igualmente te doy un resumen de los temas por ver para este Roadmap.

Bloque 0

  • Conceptos sobre Data Science

Bloque 1 Fundamentals

  • Programación en Python
  • Data Wrangling (organización / limpieza de datos)
  • Matemáticas y Estadística

Bloque 2 Análisis de Datos

  • EDA
  • Bases de Datos

Bloque 3 MLOps

  • Machine Learning
  • Python y Programación Avanzada

De este mismo youtuber tiene un vídeo sobre libros para aprender sobre Data Science. Personalmente te recomiendo 2, los cuales son:

  • Python Data Science Handbook

Python Data Science Handbook

  • Practical Statistics for Data Scientists

Practical Statistics for Data Scientists

El siguiente Roadmap de Moataz Elmesmary donde habla sobre las diferencias entre Data Science, Data Analytics y Data Engineering. Además de las herramientas específicas que se ocupan para diferentes áreas y temas.

Te recomiendo también visitar el canal de Codificando Bits, Pyninja y Santiago Fiorino los cuales hablan sobre temas de Inteligencia Artificial y Machine Learning, tienen contenido muy visual haciendo el aprendizaje más dinámico para el espectador. Codificando Bits Pyninja Santiago Fiorino Como último vídeo te comparto este titulado How I'd Learn AI (If I Had to Start Over), donde da consejos en base a experiencia personal de cómo y qué aprender.

Y, Finalmente, te comparto un recurso para prepararse con Trabajos en Data.

Consejos personales

Como consejos personales te recomiendo lo siguiente:

Aprender lo necesario en matemáticas: Álgebra lineal, Probabilidad y Estadística

Estos temas se ven demasiado para temas de análisis de datos y comprender como se comportan los datos ante ciertas circunstancias.

Programación en Python

Python es el lenguaje más usado para Inteligencia Artificial y Datos. También existe la alternativa con R, pero muchas veces este se usa en situaciones más específicas de investigación u otras cosas. Python tiene muchas librerías bastante buenas como los son NumPy, Pandas, SciPy, Matplotlib, Scikit Learn, entre otros.

Aprender Inglés

El inglés se usa bastante en cualquier área de la tecnología, por lo que es muy importante dominarlo tanto para comunicarse, como para tener la mejor información y recursos para aprender.

Proyectos en Kaggle y proyectos propios

Puedes comenzar buscando proyectos y datasets en plataformas como Kaggle para poder practicar las habilidades conseguidas. Un consejo que he escuchado constantemente es crear un portafolio con proyectos propios y de preferencias con datos reales.

Consultas en SQL

Las consultas en SQL ayudan a comprender un mejor manejo de datos, esto también se puede hacer con librerías de Python como Pandas.

Control de versiones con Git

Aprender control de versiones para el manejo del flujo de trabajo o para la seguridad y mantenimiento del trabajo que se haga. De la mano de esto, lo cual se hace en su mayoría con Git y de igual forma GitHub y/o GitLab para subir los proyectos en repositorios.