¿Alguna vez has tenido problemas al compartir tu proyecto de ciencia de datos porque a tu compañero no le funciona “como en tu máquina”? Docker puede ser tu mejor aliado.
En esta entrada te enseñaré cómo crear un entorno reproducible, limpio y profesional para tus experimentos de ciencia de datos usando Docker. No necesitas ser un experto en sistemas, solo seguir estos 5 pasos.
¿Por qué usar Docker en ciencia de datos?
Imagina poder compartir tu proyecto con un simple comando y que funcione exactamente igual en cualquier ordenador. Docker te permite:
- Evitar conflictos de versiones
- Automatizar la instalación de dependencias
- Asegurar que tus notebooks corran igual siempre
- Mejorar la colaboración en equipo
- Prepararte para producción y despliegue real
Paso 1: Instala Docker
Primero, instala Docker Desktop desde su web oficial. Es gratuito y disponible para Windows, macOS y Linux.
Una vez instalado, abre tu terminal y verifica que todo funciona con:
docker --version
Paso 2: Crea tu carpeta de proyecto
Abre tu terminal o explorador de archivos y crea una carpeta para tu proyecto:
mkdir ds-docker-env
cd ds-docker-env
Aquí irán todos tus archivos, incluyendo notebooks, datos y configuración.
Paso 3: Escribe tu Dockerfile
Dentro de la carpeta, crea un archivo llamado Dockerfile (sin extensión) con el siguiente contenido:
# Imagen base con Python y Jupyter
FROM jupyter/scipy-notebook:latest
# Establece un directorio de trabajo
WORKDIR /home/jovyan/work
# Copia tus archivos de proyecto (opcional)
# COPY . /home/jovyan/work
# Instala librerías adicionales si necesitas
RUN pip install pandas matplotlib scikit-learn seaborn
Esto creará un contenedor basado en Jupyter con las principales librerías científicas instaladas.
Paso 4: Construye y corre el contenedor
Ejecuta lo siguiente en tu terminal:
docker build -t ds-env .
docker run -p 8888:8888 -v $(pwd):/home/jovyan/work ds-env
Esto:
- Expone Jupyter Notebook en tu navegador (puerto 8888)
- Monta tu carpeta actual dentro del contenedor
- Usa la imagen que acabas de construir
Cuando se abra el navegador, copia la URL con el token que aparece en la terminal y empieza a trabajar como siempre, pero dentro de tu contenedor.
Paso 5: Cierra y guarda tu entorno
Cuando termines, simplemente detén el contenedor con Ctrl+C.
Si quieres guardar tu entorno para compartirlo con otros, puedes subir el Dockerfile y tus notebooks a GitHub, o incluso exportar la imagen:
docker save ds-env > ds-env.tar
Conclusión: Tu ciencia de datos, ahora profesional
Con estos 5 pasos has pasado de un entorno caótico a uno limpio, portátil y listo para colaboración o despliegue. Docker no solo te ahorra dolores de cabeza, también te acerca al nivel profesional que buscan muchas empresas tecnológicas.