Instalación de conda en windows


En este post vamos a explicar paso a paso cómo instalar Anaconda Navigator 3 para Windows 10 o 11  paso a paso

¿ Qué son las Jupyter Notebooks ?

Como primer paso para manejar nuestros conjuntos de datos (data sets)utilizaremos  la herramienta favorita de los científicos de datos el llamado  Jupyter Notebooks.

que funciona como un cuaderno de notas “interactivo” donde podremos ir haciendo paso a paso nuestros ejercicios y nuestros propios proyectos de Aprendizaje Automático  (Machine Learning)  e Inteligencia Artificial.

Júpiter notebook se puede utilizar de 2 formas diferentes:

  • Desde Google a través de una herramienta llamada Google colaboratory,  la cual permite ejecutar Júpiter notebook en un ambiente totalmente en la nube como sin la necesidad de estar instalando librerías no cambiará nada desde terceras fuentes.    Hay muchos tutoriales de cómo utilizar colaboratory.  Lo primero que hay que hacer es hacer una cuenta de correo en Gmail, con lo que tendremos acceso A Google Drive dónde guardaríamos nuestros modelos de datos.  Activarlo es tan simple como hacer un clic derecho y darle abrir A Google colaboratory, la primera vez que lo utilices se instalará coma y posteriormente no hace falta instalarlo nuevamente. Los archivos de Júpiter notebook tienen la extensión tipo “.ipynb” posteriormente Google reconocerá este tipo de extensión para seguir abriendo la Júpiter notebook de manera automática.
  • A través de una suite de datos muy utilizada también en el mundo de la ciencia de datos y que se conoce como Anaconda  Navigator.   Esta es la Suite más completa para la Ciencia de datos y que utiliza el lenguaje Python, y cuenta con más de 25 millones de usuarios alrededor del mundo   y que nos brinda una gran cantidad de funcionalidades que permitirán que desarrollemos aplicaciones de una manera más eficiente, rápida y sencilla.  Dentro de anaconda Navigator también se incluye el conocido paquete R muy utilizado en el mundo de la estadística y el procesamiento de datos.

Anaconda navigator la mejor suite para la ciencia de datos

Anaconda es una Suite de código abierto que abarca una serie de aplicaciones, librerías y conceptos diseñados para el desarrollo de la Ciencia de datos.   funciona como un gestor de entorno, un gestor de paquetes y que posee una colección de más de 720 paquetes de código abierto.  La instalación de anaconda es relativamente simple y tiene la ventaja de qué es interoperable o sea que puede instalarse ya sea en ambientes Linux,  Windows, iOS (Mac).

La ultima versión de Anaconda es la 3 y por defecto instala la versión de Python 3.11, lo cual es hasta cierto punto un problema, ya que muchas de las librerías que se pueden necesitar para nuestros modelos de datos todavía no han sido actualizadas a esa versión de Python,  por lo tanto utilizaremos una de las grandes funcionalidades que ofrece Anaconda que se conoce como “ambientes virtuales” en los cuales es posible instalar diferentes versiones de Python, y por tanto seguir utilizando las librerías anteriores que si funcionaban  por ejemplo la versión de Python 3.8 que necesitamos para NILMTK.

Pasos para la instalación

1) Lo primero es ingresar a esta dirección y descargar la versión ó distribución que corresponde a nuestro computador (Windows, Mac , o Linux ). OJO no hay disponibilidad de Anaconda para Smartphones ni tabletas.

https://www.anaconda.com/products/individual

El sistema de forma automática identificará su sistema operativo y le guiará hacia la mejor versión para usted, en caso contrario seleccione la mejor versión de acuerdo a su computador y su sistema operativo.

Anaconda navigator la suite para la ciencia de datos

Anaconda navigator la suite para la ciencia de datos

2.) Descargue la versión sugerida haciendo clic sobre el boton “Download”

Pantalla para la instalación de anaconda navigator 3

Pantalla de instalación para la versión de anaconda navigator 3

en este caso el sistema ha seleccionado para mí la versión 3 para Windows y procesadores de 64 bits.

Ingresando a Anaconda Navigator MENU PRINCIPAL

3.) continúe aceptando las opciones por defecto que le va mostrando la instalación y que finalmente lo llevará a la pantalla de inicio básica donde estarán instaladas las aplicaciones esenciales.  ( al inicio notará que varias pantallas de color negro se Irán apareciendo y desapareciendo hasta que finalmente llegará al menú principal.  En nuestro caso seleccione la opción Júpiter Notebooks,  (preste atención que también hay otra opción con un nombre similar llamada Júpiter Labs, que es un poco mas completa pero un tanto compleja al inicio)

Menú principal Júpyter notebook

seleccione el icono de la primera fila a la derecha. (jupyter Notebook)     el programa tarda unos segundos en arrancvar.  ESPERE !!!

4.) Una vez dentro de Jupyter , el primer paso es familiarizarse con los menús, e ir actualizando algunas de las versiones internas.  Para ello deberá localizar en primer término el boton par acceder a la ventana de terminal.

Localice en la parte superior derecha el botón New, haga clic, hasta la opción terminal y se abrirá una pantalla en negro, similar a la siguiente:

Júpiter notebook ventana terminal

Júpiter notebook ventana terminal

5.) paso seguido actualizaremos e instalaremos algunas de las librerías necesarias desde el inicio.  Ahora deberá ir escribiendo estos comandos (ponga especial cuidado en los espacios y en las mayúsculas /minúsculas) si obtiene un error, puede escribirlo de nuevo)    haga un enter después de cada línea para ir ejecutando los comandos uno por uno

conda update conda
conda update conda-build

conforme vaya instalando las diferentes librerías podrá ir obteniendo pantallas similares a esta,  observe que debe dar su aprobación (Proceed ( y / n) para la respectiva instalación con la tecla “Y” de yes aprobado .

Júpyter notebook instalando librerías

Júpyter notebook instalando librerías

Instalación de librerías en Jupyter Notebook

A lo largo del curso hablaremos de Cómo instalar Anaconda 3 en Windows 11 paso a paso, par ello les iré compartiendo algunas notebooks que posiblemente requieran alguna librería que no está instalada. En estos casos para instalar esas librerías se puede hacer de diversas maneras:

a.) la manera más simple de instalar una librería es con el comando PIP seguido del nombre de la librería. Veamos estos ejemplos:

Ej. pip install pandas  pip install numpy, pip install selenium, pip install xgboost, etc

b.) tambien se pueden instalar con sus dependencias dentro del ambiente “conda” de Anaconda  (con esta forma de instalación se instalan además algunas otras librerías que son dependientes de la librería principal y que en ocasiones son requeridas para realizar algunas funciones más específicas dentro de los modelos. Si ya tiene alguna experiencia puede utilizar preferiblemente el comando que a continuación se describe

Ej. conda install lightgbm   

b.1) las librerías de condá están en repositorios públicos que se conocen como canales,  muchas veces estos repositorios deben indicarse de manera explícita, lo que facilita su instalación de manera más expedita

Ej. conda install -c conda-forge lightgbm

c. )  otra forma simple de instalar las librerías con sus respectivas dependencias es directamente desde el menú principal de anaconda,  (ver tres pasos en la figura)  . Veamos la pantalla donde se accede a estas opciones

Júpiter notebook agregando librerías adicionales

Júpiter notebook agregando librerías adicionales

Instalación de los ambientes virtuales (vitual environments)

Debemos reconocer que una de las grandes ventajas que ofrece Anaconda es la posibilidad de instalar simultáneamente varios ambientes de trabajo. A estos ambientes se les conoce como ambientes virtuales o virtual environments.Para crear un ambiente virtual en anaconda debemos entrar al mismo menú que expusimos anteriormente en la opción environments y debemos seleccionar del menú inferior la opción crear.

El menú nos pregunta qué versión de Python queremos instalar y el nombre que queremos darle al nuevo ambiente de trabajo.

Podemos utilizar cualquier nombre por ejemplo Python37  y escogemos la versión de Python 3.7. x para arrancar.  Una vez que el proceso finaliza entramos utilizando el mismo menú a la opción de ventana terminal del nuevo ambiente de trabajo que recién acabamos de crear.

Júpyter notebook agregar ambiente de trabajo virtuales

Júpyter notebook añadiendo ambientes de trabajo virtuales

Instalar librerías dentro de ambientes virtuales

Si queremos instalar  librerías, siempre debe ser en algún ambiente determinado .  Para hacerlo  primero debemos seleccionarlo y abrir la ventana terminal respectiva.  ( la ventana terminal mostrará a la izquierda el nombre del ambiente de trabajo escogido)

una vez abierta la ventana terminal podemos utilizar las opciones de instalación antes mencionadas coma ya sea, PIP, conda, ó a través de anaconda los ambientes de trabajo deben activarse ya sea de forma manual o a través de anaconda.

Los comandos para instalar y activar los ambientes virtuales son los siguientes:  ( estos comando se escriben  en la ventana terminal del ambiente “Base ó root”

CREAR:  conda create -n v-env python=3.7   ( OJO: v-env es un nombre cualquiera escogido por mi )
ACTIVAR:  conda activate v-env

Para consultar comandos adicionales que se utilizan en los ambientes virtuales y el uso de los kernels consulte acá

Para ver todos los entornos que tenemos instalados se puede utilizar: conda env list

Para instalar paquetes dentro de nuestro entorno virtual podemos hacerlo mediante pip o con el instalador de anaconda.

Para ver todos los paqutes instalados podemos hacerlo con : pip list 

Instalación de otras librerías especializadas

En muchas ocasiones requerimos de la instalación de una serie de librerías es parte de Cómo instalar Anaconda 3 en Windows 1, 1 que no se instalan tan fácilmente cómo dar PIP o conda. Veamos la instalacion de NILMTK, una librería abierta especializada en la desagregación del consumo eléctrico.

Abra una ventana de terminal de conda, crearemos un nuevo entorno de Conda y lo activaremos con los comandos:

conda create --name nilmtk-env 
conda activate nilmtk-env

Si aún no está presente en su instalación de Conda, agregue el conda-forge a la lista de canales:

conda config --add channels conda-forge

Finalmente, instale la última versión de NILMTK de conda-forge :

conda install -c nilmtk nilmtk=0.4.3

Observe que el signo igual no lleva espacios(piense estamos usando Python). La ejecución del comando puede tardar un rato. Mientras tanto, consulte otros paquetes en Forge de NILMTK .

Observe que puede dar problemas si tiene instalado una version de python superior a 3.9:

En este caso esto nos obliga a eliminar el entrono y crear uno nuevo con python 3.8

Para ello lo podemos eliminar desde anaconda navigator opción Remove o bien desde consola (conda deactivate y conda env remove -n nilmtk-env), y crearemos uno nuevo desde anaconda navigator, con python 3.8

Como puede experimentar algunos problemas posteriores a la instalación con NILMTK y Matplotlib., para solucionarlos, aplique el comando:

conda install matplotlib 

Para verificar que Matplotlib está instalado, intente invocar la versión de Matplotlib en Python REPL. Use desde el interprete Python los comandos a continuación que incluyen llamar a .__ version__, un atributo común a la mayoría de los paquetes de Python.

>>> import matplotlib

>>> matplotlib.__version__

Ejemplo de salida:

(nilmtk-env) C:\Users\carlo>python
Python 3.6.13 (default, Sep 7 2021, 06:39:02) [MSC v.1916 64 bit (AMD64)] on win32
Type “help”, “copyright”, “credits” or “license” for more information.

import matplotlib
matplotlib.version
‘3.1.3’

Agregar un kernel de Jupyter

Básicamente, NILMTK ahora está instalado en su ordenador. El siguiente paso involucra los cuadernos de Jupyter. Trabajar con Jupyter abre muchas posibilidades y se dice que es una herramienta imprescindible. Por lo tanto, agregue el entorno NILMTK a Jupyter:

python -m ipykernel install --user --name nilmtk-env --display-name "Python (nilmtk-env)"

Prueba de la instalación

Ha llegado el momento de comprobar su instalación. Antes que nada, cree una nueva carpeta y descargue el conjunto de prueba aleatorio de Github:

md nilmtk_testcd nilmtk_test  wget https://raw.githubusercontent.com/nilmtk/nilmtk/master/data/random.h5

Como puede comprobar random.h5 es el fichero de de datos en en formato hdf5 .A continuación, levante Jupyter:

notebook jupyter

Para probar su instalación, intente importar el conjunto de datos aleatorio usando NILMTK y trazar todos los medidores:https://klemenjak.medium.com/media/9ba2be16d331653a7b4093a0fe412434

La salida debe ser:

1MeterGroup (metros =   ElecMeter (instancia = 1, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 2, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 3, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 4, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 5, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = []) )

¡Felicitaciones! Lo ha logrado. ¡NILMTK parece funcionar según lo previsto! 

Instalación de Anaconda en Ubuntu


Diseñado para los flujos de trabajo de ciencia de los datos y aprendizaje automático, Anaconda es un gestor de paquetes de código abierto, gestor de entornos y distribución de los lenguajes de programación Python y R.

En efecto Conda es un gestor de paquetes y un sistema de gestión de entornos de código abierto,multiplataforma y de lenguaje agnóstico publicado bajo la licencia BSD. Está escrito en el lenguaje de programación Python, pero puede gestionar proyectos que contengan código escrito en otros lenguajes, como R, así como proyecto multilenguaje. Conda puede instalar la versión de Python que se necesite en el entorno de desarrollo, al contrario que otros gestores de paquetes basados en Python, como pip o wheel.

Cuenta con «canales» (channels), que son las ubicaciones de los repositorios en los que Conda busca paquetes. Debido a que los canales se organizan jerárquicamente, al instalar un paquete Conda comprobará qué canal tiene el mayor índice de prioridad; este orden de prioridad se puede cambiar, así como también añadir nuevos canales. Los canales que se establecen por defecto son los repositorios de Continuum. Existen canales más generales, que ofrecen una amplia gama de paquetes, como conda-forge; y otros más específicos, como Bioconda, que proporciona paquetes especializados en bioinformática.

Conda está incluido en todas las versiones de Anaconda, Miniconda ​ y Anaconda Repository.

Obtención de la versión más reciente de Anaconda

Prerrequisitos

  • Una cuenta de usuario con  privilegios de sudo 
  • Acceso a una línea de comando / ventana de terminal (Ctrl-Alt-T)

Actualice el Administrador de paquetes local

Empiece por actualizar el administrador de paquetes local. Abra una ventana de terminal e ingrese lo siguiente:

sudo apt-get update

Si su sistema no tiene curl , instálelo ingresando:

sudo apt-get install curl

Descargue la última versión de Anaconda

En el momento en que se escribió este artículo, la última versión de Anaconda es 2020.02. Consulte la página de descarga del desarrollador para ver la versión más reciente.

  • Desde un navegador web, vaya a la página de la distribución Anaconda, disponible en el siguiente enlace:
https://www.anaconda.com/distribution/

Busque la versión más reciente para Linux y copie la secuencia de comandos bash del instalador.

Anote la URL y utilícela para descargar la versión correcta.

Cambie al directorio / tmp y use curl para descargar el instalador usando su terminal de comando:

cd /tmp
curl –O https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh

Esta versión está diseñada para Python 3.7. Si está utilizando Python 2.7, utilice la URL adecuada.

Verificar la suma de comprobación de descarga

Checksum es una herramienta de seguridad que se utiliza para verificar la autenticidad e integridad de un script descargado.

Introduzca la siguiente:

sha256sum Anaconda3–2020.02–Linux–x86_64.sh

Su sistema mostrará una serie de letras y números:

69581cf739365ec7fb95608eef694ba959d7d33b36eb961953f2b82cb25bdf5a Anaconda3-2019.07-Linux-x86_64.sh

Compárelos con la suma de comprobación apropiada (o hash ) en la documentación de Anaconda . Si ha elegido una versión diferente, asegúrese de consultar la documentación para ver la suma de comprobación de esa versión.

Ejecución de la secuencia de comandos de Anaconda

Una vez que acepte la licencia, se le pedirá que seleccione la ubicación de la instalación. Puede pulsar ENTER para aceptar la ubicación predeterminada o especificar una ubicación diferente.


bash Anaconda3-2019.03-Linux-x86_64.sh

Recibirá el siguiente resultado para revisar el acuerdo de licencia pulsando ENTER hasta llegar al final.

Output
Welcome to Anaconda3 2019.03

In order to continue the installation process, please review the license
agreement.
Please, press ENTER to continue
>>>
...
Do you approve the license terms? [yes|no]

Cuando llegue al final de la licencia, escriba yes, si acepta la licencia, para completar la instalación.

En este momento, se procederá con la instalación. Tenga en cuenta que el proceso puede tardar un tiempo.

Cuando se complete la instalación, recibirá el siguiente resultado:

Output...
installation finished.
Do you wish the installer to prepend the Anaconda3 install location
to PATH in your /home/sammy/.bashrc ? [yes|no]
[no] >>> 

Se recomienda que escriba yes para usar el comando conda.

Activación de la instalación

Ahora, puede activar la instalación con el siguiente comando:

source ~/.bashrc

Instalación de prueba

Utilice el comando conda para probar la instalación y la activación:

conda list

Recibirá el resultado de todos los paquetes que tiene disponibles a través de la instalación de Anaconda.

Configuración de los entornos de Anaconda

Puede crear entornos de Anaconda con el comando conda create. Por ejemplo, se puede crear un entorno de Python 3 llamado my_envcon el siguiente comando:

conda create --name my_env python=3

Active el nuevo entorno de esta manera:

conda activate my_env

El prefijo de instrucción de su comando cambiará para reflejar que está en un entorno de Anaconda activo, y que, ahora, está listo para empezar a trabajar en un proyecto.