Docker para científicos de datos: crea tu entorno aislado en 5 pasos

¿Alguna vez has tenido problemas al compartir tu proyecto de ciencia de datos porque a tu compañero no le funciona “como en tu máquina”? Docker puede ser tu mejor aliado.

En esta entrada te enseñaré cómo crear un entorno reproducible, limpio y profesional para tus experimentos de ciencia de datos usando Docker. No necesitas ser un experto en sistemas, solo seguir estos 5 pasos.

¿Por qué usar Docker en ciencia de datos?

Imagina poder compartir tu proyecto con un simple comando y que funcione exactamente igual en cualquier ordenador. Docker te permite:

  • Evitar conflictos de versiones
  • Automatizar la instalación de dependencias
  • Asegurar que tus notebooks corran igual siempre
  • Mejorar la colaboración en equipo
  • Prepararte para producción y despliegue real

Paso 1: Instala Docker

Primero, instala Docker Desktop desde su web oficial. Es gratuito y disponible para Windows, macOS y Linux.

Una vez instalado, abre tu terminal y verifica que todo funciona con:

docker --version

 Paso 2: Crea tu carpeta de proyecto

Abre tu terminal o explorador de archivos y crea una carpeta para tu proyecto:

mkdir ds-docker-env

cd ds-docker-env


Aquí irán todos tus archivos, incluyendo notebooks, datos y configuración.

Paso 3: Escribe tu Dockerfile

Dentro de la carpeta, crea un archivo llamado Dockerfile (sin extensión) con el siguiente contenido:

# Imagen base con Python y Jupyter

FROM jupyter/scipy-notebook:latest

# Establece un directorio de trabajo

WORKDIR /home/jovyan/work

# Copia tus archivos de proyecto (opcional)

# COPY . /home/jovyan/work

# Instala librerías adicionales si necesitas

RUN pip install pandas matplotlib scikit-learn seaborn


Esto creará un contenedor basado en Jupyter con las principales librerías científicas instaladas.

Paso 4: Construye y corre el contenedor

Ejecuta lo siguiente en tu terminal:


docker build -t ds-env .


docker run -p 8888:8888 -v $(pwd):/home/jovyan/work ds-env

Esto:

  • Expone Jupyter Notebook en tu navegador (puerto 8888)
  • Monta tu carpeta actual dentro del contenedor
  • Usa la imagen que acabas de construir

Cuando se abra el navegador, copia la URL con el token que aparece en la terminal y empieza a trabajar como siempre, pero dentro de tu contenedor.

Paso 5: Cierra y guarda tu entorno

Cuando termines, simplemente detén el contenedor con Ctrl+C.

Si quieres guardar tu entorno para compartirlo con otros, puedes subir el Dockerfile y tus notebooks a GitHub, o incluso exportar la imagen:


docker save ds-env > ds-env.tar

Conclusión: Tu ciencia de datos, ahora profesional

Con estos 5 pasos has pasado de un entorno caótico a uno limpio, portátil y listo para colaboración o despliegue. Docker no solo te ahorra dolores de cabeza, también te acerca al nivel profesional que buscan muchas empresas tecnológicas.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *