Domina la Ciencia de Datos: Guía Definitiva para Usar Jupyter Notebook en VS Code (Con Entornos Conda)


Los cuadernos de Jupyter (o Jupyter Notebooks) se han convertido en el estándar de oro para la ciencia de datos y la investigación computacional. Su capacidad para combinar código ejecutable, visualizaciones, texto narrativo y ecuaciones en un solo documento los hace increíblemente poderosos para desarrollar, comunicar y compartir proyectos de datos.

Tradicionalmente, se usan a través de un navegador web. Pero, ¿y si pudiéramos potenciar esa experiencia con todas las ventajas de un editor de código moderno como Visual Studio Code? En esta guía, te mostraré cómo hacer precisamente eso: configurar y usar Jupyter Notebooks directamente en VS Code, evitando las limitaciones del navegador y aprovechando al máximo tu flujo de trabajo.

¿Qué es un Jupyter Notebook y por qué deberías usarlo?

Antes de entrar en materia, aclaremos el concepto. Un «cuaderno» o notebook es un documento interactivo que integra código y su resultado en un solo lugar. Puedes escribir y ejecutar fragmentos de código (como Python), y justo debajo ver la salida: tablas, gráficos, estadísticas, etc. Lo mejor es que también puedes añadir texto enriquecido (con formato Markdown) para explicar tu razonamiento, incluir fórmulas matemáticas o enlazar a fuentes externas.

En resumen: es un diario de trabajo vivo, transparente y reproducible.

Para cualquier persona que trabaje con datos, usar notebooks acelera el flujo de trabajo, facilita la comunicación de resultados y es una habilidad fundamental en la industria. Y lo mejor de todo, al ser parte del proyecto de código abierto Jupyter, es completamente gratuito.

Aunque Jupyter soporta múltiples lenguajes, en esta guía nos centraremos en Python, el más popular y para el cual VS Code ofrece la mejor integración.

¿Por qué usar Jupyter Notebooks en VS Code en lugar del Navegador?

Usar la extensión de Jupyter en VS Code transforma tu experiencia de desarrollo. La interfaz de cuaderno nativa de VS Code ofrece ventajas significativas:

  • Entorno de Desarrollo Unificado: Disfruta de todas las funcionalidades de un editor de código profesional mientras trabajas en tu notebook: resaltado de sintaxis avanzado, autocompletado inteligente (IntelliSense), refactorización de código, y soporte para extensiones como VIM, linters o formateadores de código.
  • Herramientas de Productividad: Aplica funciones de edición avanzada directamente en tus celdas, como búsqueda y reemplazo global, plegado de código o edición en múltiples líneas (multi-cursor).
  • Navegación y Gestión de Archivos: VS Code te da una visión de proyecto completa. Puedes navegar fácilmente entre tu notebook y otros archivos del proyecto (.py, .csv, .json), usar el control de versiones (Git) integrado, y tener una vista de esquema con la tabla de contenidos de tu notebook.
  • Velocidad y Eficiencia: Los archivos .ipynb se cargan casi instantáneamente. Además, VS Code incluye un visor de diferencias (diff) para notebooks, lo que facilita enormemente la revisión de cambios en el código y los resultados.
  • Depuración Avanzada: Una de las características estrella es «Ejecutar por Línea», que te permite depurar tu código paso a paso dentro del propio notebook.

Requisito Fundamental: Instalación de Anaconda (Conda)

Atención: Este es un paso crucial. Para que todo funcione de manera fluida en VS Code y evitar errores de versiones o de reconocimiento de entornos, es altamente recomendable (y para muchos usuarios, necesario) instalar Anaconda. Anaconda incluye Conda, un potente gestor de paquetes y entornos virtuales que usaremos para aislar nuestros proyectos.

¿Por qué es tan importante?

  • Aislamiento: Podrás tener un proyecto con Python 3.9 y librerías antiguas, y otro con Python 3.11 y las últimas versiones, sin que uno rompa al otro.
  • Evita errores en VS Code: Muchos problemas al seleccionar kernels o al importar librerías en VS Code se solucionan simplemente usando entornos Conda bien configurados.

Descarga e Instalación de Anaconda

  1. Descarga: Ve a la página oficial de Anaconda y descarga el instalador para tu sistema operativo (Windows, macOS, Linux).
  2. Ejecuta el Instalador: Una vez descargado, ejecuta el archivo.
  3. Acepta la Licencia: Lee y acepta los términos de la licencia.
  4. Tipo de Instalación: Selecciona «Solo para mí» (recomendado) a menos que necesites instalarlo para todos los usuarios del equipo.
  5. Ubicación de Instalación: ¡Muy importante! Elige una carpeta de destino cuya ruta no contenga espacios ni caracteres especiales (como tildes o eñes). Por ejemplo: C:\anaconda3 en Windows o /Users/tu_usuario/anaconda3 en macOS. Esto previene errores futuros.
  6. Opciones Avanzadas:
    • Marca la opción que dice «Registrar Anaconda como mi Python predeterminado» (a menos que tengas otra instalación de Python que quieras conservar como principal).
    • Deja las demás opciones por defecto.
  7. Instalación: Haz clic en «Instalar». El proceso puede tomar varios minutos. Puedes marcar la casilla «Mostrar detalles» para ver qué paquetes se están instalando.
  8. Finalización: Una vez terminado, verás una pantalla de «Gracias por instalar Anaconda». Ya puedes cerrar el instalador.

¡Felicidades! Ya tienes Conda instalado en tu sistema. Ahora podemos proceder a configurar VS Code.

Configuración Rápida de VS Code y Jupyter

Paso 1: Instalar VS Code
Si aún no lo tienes, descarga e instala Visual Studio Code desde su página oficial.

Paso 2: Instalar la Extensión de Jupyter
Abre VS Code, ve al panel de extensiones (icono de cuadrícula en la barra lateral izquierda o Ctrl+Shift+X) y busca «Jupyter». Instala la extensión desarrollada por Microsoft (ms-toolsai.jupyter). Esta extensión ya incluye por defecto mapas de teclado similares a los de Jupyter y visualizadores para gráficos (Plotly, etc.).

Paso 3: Crear o Abrir un Notebook
Puedes crear un nuevo archivo de notebook de varias formas:

  • Ve a la paleta de comandos (Ctrl+Shift+P), escribe «Crear: Nuevo cuaderno Jupyter» y selecciona la opción.
  • O simplemente crea un nuevo archivo con la extensión .ipynb.

Ya tienes un notebook funcionando en VS Code. Ahora, vamos a usar Conda para crear el «motor» (kernel) de Python que ejecutará el código de forma aislada.

Gestionando Entornos de Ejecución con Conda

Ahora que tenemos Anaconda instalada y VS Code listo, vamos a crear un entorno virtual con las librerías científicas esenciales (numpy, matplotlib, scipy) y conectarlo a nuestro notebook.

Paso 1: Abrir la Terminal Correcta
Abre la terminal integrada de VS Code (Ctrl+ñ o View > Terminal). Como ya instalamos Anaconda, el comando conda debería ser reconocido automáticamente.

Paso 2: Crear un Nuevo Entorno Conda
Ejecuta el siguiente comando para crear un entorno llamado mi_entorno con Python 3.10 (una versión muy estable):

conda create -n mi_entorno python=3.10

Confirma la creación escribiendo y cuando el sistema te lo pida.

Paso 3: Activar el Entorno
Una vez creado, actívalo con:

conda activate mi_entorno

Verás que el prompt de la terminal ahora comienza con (mi_entorno), indicando que estás dentro.

Paso 4: Instalar las Librerías Esenciales
Con el entorno activado, instala los paquetes que necesitas. El paquete ipykernel es fundamental para que Jupyter pueda reconocer tu entorno.

conda install numpy matplotlib scipy ipykernel

De nuevo, confirma con y.

Paso 5: Registrar el Entorno en Jupyter
Este paso crea un «registro» para que VS Code y Jupyter sepan que este entorno existe y pueden usarlo como kernel.

python -m ipykernel install --user --name mi_entorno --display-name "Python (mi_entorno)"

Paso 6: Seleccionar el Kernel en VS Code
Vuelve a tu notebook en VS Code. En la esquina superior derecha, haz clic en el texto que indica el kernel (probablemente dirá «Python 3…»). Se abrirá una lista. Busca y selecciona la opción que dice «Python (mi_entorno)». Si no aparece, prueba a reiniciar VS Code.

Paso 7: ¡A Codificar!
Ya puedes ejecutar celdas. Prueba con este pequeño script para verificar que todo funciona:

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import linregress
print("¡Entorno configurado correctamente!")
print(f"NumPy versión: {np.__version__}")
# Un pequeño test gráfico
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
plt.scatter(x, y)
plt.title("Gráfico de prueba")
plt.show()

Trabajando con Python y Más Allá

Si te centras en Python, asegúrate de tener también instalada la Extensión de Python (ms-python.python) para disfrutar de la mejor experiencia de edición. La combinación de ambas extensiones es imbatible.

Característica Destacada: «Ejecutar por Línea»

Una de las herramientas más útiles para depurar es «Ejecutar por Línea». Con una celda de código seleccionada, puedes presionar F10 o hacer clic en el botón «Ejecutar por Línea» (un icono de depuración) en la barra de la celda. Esto iniciará una sesión ligera de depuración, ejecutando tu código línea por línea y actualizando el «Explorador de Variables» en tiempo real para que veas cómo cambia el valor de tus datos. Para avanzar a la siguiente línea, pulsa Ctrl+Enter. Para detener la ejecución, haz clic en el botón de parada.

Conclusión

Combinar la potencia narrativa de Jupyter Notebooks con la robustez y flexibilidad de Visual Studio Code es un cambio radical en el flujo de trabajo de ciencia de datos. Has aprendido a configurar este entorno desde cero (comenzando por la base sólida de Anaconda), a gestionar tus proyectos con entornos Conda aislados y a aprovechar funciones exclusivas como «Ejecutar por Línea». Ahora tienes las herramientas para desarrollar proyectos de datos de forma más profesional, organizada y eficiente. ¡Es hora de ponerlo en práctica!

Arquitecturas del bien común digital: cómo Wikipedia, OpenStreetMap e Internet Archive resisten la web de las plataformas


En un ecosistema dominado por plataformas comerciales siguen existiendo proyectos que operan con otra lógica: Wikipedia, OpenStreetMap, Internet Archive, pero también forjas de software libre como SourceForge o GitHub en su vertiente colaborativa. Todos ellos comparten una intuición sencilla y, a la vez, exigente: que la información, el conocimiento y el código pueden ser un bien compartido, no solo un producto envuelto en publicidad y métricas de atención.​

En los orígenes de la web, la publicación era casi artesanal: servidores universitarios o domésticos y estándares abiertos como HTML o HTTP permitían compartir información sin depender de grandes propietarios tecnológicos. Hoy el paisaje es muy distinto: la web se ha convertido en una máquina de capturar datos y vender atención mediante publicidad segmentada, donde cada clic y cada segundo de permanencia se traducen en oportunidades de negocio​

Frente a este modelo, proyectos como Wikipedia, OpenStreetMap, Internet Archive o las comunidades de software libre ofrecen otra capa de infraestructura: enciclopedias colaborativas, mapas abiertos, archivos históricos y repositorios de código que cualquiera puede estudiar, reutilizar y mejorar. Su financiación se apoya en donaciones, cuotas de miembros y apoyo institucional; su gobernanza, en normas públicas y comunidades distribuidas que revisan, corrigen y cuidan los contenidos.​

Lista de sitios mas relevantes

Amigo lector , bajo mi humilde opinión estos son los sitios sobre bienes comunes digitales y resistencia al modelo comercial, que encajan perfectamente con este planteamiento aun a dia de hoy:

  • Wikipedia (https://www.wikipedia.org/): Enciclopedia libre colaborativa con millones de artículos en múltiples idiomas. Útil para consulta rápida de conocimiento verificable y como base para investigaciones o aprendizaje.​
  • GitHub (https://github.com/): Plataforma líder para repositorios de código fuente, con énfasis en proyectos open source colaborativos. Útil para desarrollo de software, control de versiones, foros de discusión y hosting de documentación técnica. Si bien es cierto que fue comprada por Microsoft, aun hoy en dia carece de publicidad y sigue siendo una de las mejores referencias de repositorios para código que existen.
  • SourceForge (https://sourceforge.net/): Plataforma de alojamiento de proyectos open source con herramientas para descargas, foros y gestión de bugs. Útil para descubrir y distribuir software libre, aunque con controversias pasadas sobre bundles publicitarios.
  • OpenStreetMap (https://www.openstreetmap.org/): Base de datos geográfica editable colaborativamente que mapea el mundo entero. Útil para aplicaciones de navegación, planificación urbana, desastres humanitarios y datos GIS gratuitos.
  • Internet Archive (https://archive.org/): Archivo digital masivo que preserva sitios web, libros, audio, vídeo y software histórico vía Wayback Machine. Útil para investigación histórica, acceso a contenidos perdidos y preservación cultural.

En esta escueta lista ademas podríamos incluir muchos sitios mas, como por ejemplo Mozilla Commons o Creative Commons (https://creativecommons.org/), que proporciona licencias abiertas para compartir conocimiento y cultura creativos, o Stack Overflow en su vertiente Q&A open source (https://stackoverflow.com/), como repositorio de conocimiento técnico colaborativo. ​

A continuación veamos una comparativa de visitas mensuales (datos estimados diciembre 2025, vía SimilarWeb) de los sitios anteriormente comentados:

SitioVisitas mensuales aprox.Bounce RatePáginas/VisitaDuración mediaNotas similarweb+2​
Wikipedia.org3.700 millones54%3.23:13 minLíder absoluto en consultas informativas similarweb​.
GitHub.com~500-1.000 millones~40%~5~4 minAlta en desarrolladores; repositorios superan 1 billón en 2025 wikipedia+1​.
Archive.org157 millones46%7.94:21 minFuerte en preservación; alto engagement similarweb​.
OpenStreetMap.org~20-50 millones~50%~4~3 minDatos indirectos; tráfico crece con apps derivadas wiki.openstreetmap+1​.
SourceForge.net~10-20 millones~45%~3~2:30 minPlataforma niche para open source; menor volumen sourceforge+1​.
Web.Archive.org41 millones49%5.73:31 minSubdominio clave de IA; +8% mensual similarweb​.

Wikipedia domina por órdenes de magnitud gracias a su rol enciclopédico universal. GitHub destaca en tráfico cualificado de devs, mientras que los demás son más nicho pero esenciales para sus comunidades. Datos de SimilarWeb tienen variaciones (±20% vs. Google Analytics).​

    Conclusion

    El reto llega cuando estos bienes comunes digitales dependen cada vez más de intermediarios poderosos: buscadores, grandes plataformas y ahora modelos de inteligencia artificial que reutilizan su contenido sin mostrar siempre con claridad el origen. El resultado es una paradoja: sus datos se usan más que nunca, pero su visibilidad y su capacidad para sostenerse gracias al apoyo directo de la comunidad pueden verse debilitadas.​

    En un ecosistema dominado por plataformas comerciales y servicios diseñados para maximizar la captación de datos y la monetización de la atención, siguen existiendo proyectos que operan con una lógica distinta. Iniciativas veteranas como Wikipedia, GitHub, SourceForge, OpenStreetMap o Internet Archive representan una tradición de la web que prioriza la colaboración, la reutilización del conocimiento y la preservación a largo plazo frente al beneficio inmediato. Muchas de ellas nacieron antes de la consolidación del actual modelo de plataformas y han logrado mantenerse relevantes durante décadas sin basarse en publicidad intrusiva ni en la explotación sistemática de perfiles de usuario. Comparten una idea tan simple como exigente: la información, el software y el conocimiento técnico constituyen bienes comunes que deben poder ser estudiados, reutilizados y compartidos libremente, incluso en un entorno digital cada vez más concentrado.

    De que seamos capaces o no de mantener viva esta capa abierta —wikis, mapas, archivos, repositorios— depende en buena medida que Internet siga siendo algo más que un escaparate infinito de plataformas. La pregunta para los próximos años no es solo técnica, sino política: si queremos que estos proyectos sigan siendo bienes comunes, tendremos que encontrar maneras de financiarlos, protegerlos y darles reconocimiento en medio del ruido comercial.​