Instalación de conda en windows


En este post vamos a explicar paso a paso cómo instalar Anaconda Navigator 3 para Windows 10 o 11  paso a paso

¿ Qué son las Jupyter Notebooks ?

Como primer paso para manejar nuestros conjuntos de datos (data sets)utilizaremos  la herramienta favorita de los científicos de datos el llamado  Jupyter Notebooks.

que funciona como un cuaderno de notas “interactivo” donde podremos ir haciendo paso a paso nuestros ejercicios y nuestros propios proyectos de Aprendizaje Automático  (Machine Learning)  e Inteligencia Artificial.

Júpiter notebook se puede utilizar de 2 formas diferentes:

  • Desde Google a través de una herramienta llamada Google colaboratory,  la cual permite ejecutar Júpiter notebook en un ambiente totalmente en la nube como sin la necesidad de estar instalando librerías no cambiará nada desde terceras fuentes.    Hay muchos tutoriales de cómo utilizar colaboratory.  Lo primero que hay que hacer es hacer una cuenta de correo en Gmail, con lo que tendremos acceso A Google Drive dónde guardaríamos nuestros modelos de datos.  Activarlo es tan simple como hacer un clic derecho y darle abrir A Google colaboratory, la primera vez que lo utilices se instalará coma y posteriormente no hace falta instalarlo nuevamente. Los archivos de Júpiter notebook tienen la extensión tipo “.ipynb” posteriormente Google reconocerá este tipo de extensión para seguir abriendo la Júpiter notebook de manera automática.
  • A través de una suite de datos muy utilizada también en el mundo de la ciencia de datos y que se conoce como Anaconda  Navigator.   Esta es la Suite más completa para la Ciencia de datos y que utiliza el lenguaje Python, y cuenta con más de 25 millones de usuarios alrededor del mundo   y que nos brinda una gran cantidad de funcionalidades que permitirán que desarrollemos aplicaciones de una manera más eficiente, rápida y sencilla.  Dentro de anaconda Navigator también se incluye el conocido paquete R muy utilizado en el mundo de la estadística y el procesamiento de datos.

Anaconda navigator la mejor suite para la ciencia de datos

Anaconda es una Suite de código abierto que abarca una serie de aplicaciones, librerías y conceptos diseñados para el desarrollo de la Ciencia de datos.   funciona como un gestor de entorno, un gestor de paquetes y que posee una colección de más de 720 paquetes de código abierto.  La instalación de anaconda es relativamente simple y tiene la ventaja de qué es interoperable o sea que puede instalarse ya sea en ambientes Linux,  Windows, iOS (Mac).

La ultima versión de Anaconda es la 3 y por defecto instala la versión de Python 3.11, lo cual es hasta cierto punto un problema, ya que muchas de las librerías que se pueden necesitar para nuestros modelos de datos todavía no han sido actualizadas a esa versión de Python,  por lo tanto utilizaremos una de las grandes funcionalidades que ofrece Anaconda que se conoce como “ambientes virtuales” en los cuales es posible instalar diferentes versiones de Python, y por tanto seguir utilizando las librerías anteriores que si funcionaban  por ejemplo la versión de Python 3.8 que necesitamos para NILMTK.

Pasos para la instalación

1) Lo primero es ingresar a esta dirección y descargar la versión ó distribución que corresponde a nuestro computador (Windows, Mac , o Linux ). OJO no hay disponibilidad de Anaconda para Smartphones ni tabletas.

https://www.anaconda.com/products/individual

El sistema de forma automática identificará su sistema operativo y le guiará hacia la mejor versión para usted, en caso contrario seleccione la mejor versión de acuerdo a su computador y su sistema operativo.

Anaconda navigator la suite para la ciencia de datos

Anaconda navigator la suite para la ciencia de datos

2.) Descargue la versión sugerida haciendo clic sobre el boton “Download”

Pantalla para la instalación de anaconda navigator 3

Pantalla de instalación para la versión de anaconda navigator 3

en este caso el sistema ha seleccionado para mí la versión 3 para Windows y procesadores de 64 bits.

Ingresando a Anaconda Navigator MENU PRINCIPAL

3.) continúe aceptando las opciones por defecto que le va mostrando la instalación y que finalmente lo llevará a la pantalla de inicio básica donde estarán instaladas las aplicaciones esenciales.  ( al inicio notará que varias pantallas de color negro se Irán apareciendo y desapareciendo hasta que finalmente llegará al menú principal.  En nuestro caso seleccione la opción Júpiter Notebooks,  (preste atención que también hay otra opción con un nombre similar llamada Júpiter Labs, que es un poco mas completa pero un tanto compleja al inicio)

Menú principal Júpyter notebook

seleccione el icono de la primera fila a la derecha. (jupyter Notebook)     el programa tarda unos segundos en arrancvar.  ESPERE !!!

4.) Una vez dentro de Jupyter , el primer paso es familiarizarse con los menús, e ir actualizando algunas de las versiones internas.  Para ello deberá localizar en primer término el boton par acceder a la ventana de terminal.

Localice en la parte superior derecha el botón New, haga clic, hasta la opción terminal y se abrirá una pantalla en negro, similar a la siguiente:

Júpiter notebook ventana terminal

Júpiter notebook ventana terminal

5.) paso seguido actualizaremos e instalaremos algunas de las librerías necesarias desde el inicio.  Ahora deberá ir escribiendo estos comandos (ponga especial cuidado en los espacios y en las mayúsculas /minúsculas) si obtiene un error, puede escribirlo de nuevo)    haga un enter después de cada línea para ir ejecutando los comandos uno por uno

conda update conda
conda update conda-build

conforme vaya instalando las diferentes librerías podrá ir obteniendo pantallas similares a esta,  observe que debe dar su aprobación (Proceed ( y / n) para la respectiva instalación con la tecla “Y” de yes aprobado .

Júpyter notebook instalando librerías

Júpyter notebook instalando librerías

Instalación de librerías en Jupyter Notebook

A lo largo del curso hablaremos de Cómo instalar Anaconda 3 en Windows 11 paso a paso, par ello les iré compartiendo algunas notebooks que posiblemente requieran alguna librería que no está instalada. En estos casos para instalar esas librerías se puede hacer de diversas maneras:

a.) la manera más simple de instalar una librería es con el comando PIP seguido del nombre de la librería. Veamos estos ejemplos:

Ej. pip install pandas  pip install numpy, pip install selenium, pip install xgboost, etc

b.) tambien se pueden instalar con sus dependencias dentro del ambiente “conda” de Anaconda  (con esta forma de instalación se instalan además algunas otras librerías que son dependientes de la librería principal y que en ocasiones son requeridas para realizar algunas funciones más específicas dentro de los modelos. Si ya tiene alguna experiencia puede utilizar preferiblemente el comando que a continuación se describe

Ej. conda install lightgbm   

b.1) las librerías de condá están en repositorios públicos que se conocen como canales,  muchas veces estos repositorios deben indicarse de manera explícita, lo que facilita su instalación de manera más expedita

Ej. conda install -c conda-forge lightgbm

c. )  otra forma simple de instalar las librerías con sus respectivas dependencias es directamente desde el menú principal de anaconda,  (ver tres pasos en la figura)  . Veamos la pantalla donde se accede a estas opciones

Júpiter notebook agregando librerías adicionales

Júpiter notebook agregando librerías adicionales

Instalación de los ambientes virtuales (vitual environments)

Debemos reconocer que una de las grandes ventajas que ofrece Anaconda es la posibilidad de instalar simultáneamente varios ambientes de trabajo. A estos ambientes se les conoce como ambientes virtuales o virtual environments.Para crear un ambiente virtual en anaconda debemos entrar al mismo menú que expusimos anteriormente en la opción environments y debemos seleccionar del menú inferior la opción crear.

El menú nos pregunta qué versión de Python queremos instalar y el nombre que queremos darle al nuevo ambiente de trabajo.

Podemos utilizar cualquier nombre por ejemplo Python37  y escogemos la versión de Python 3.7. x para arrancar.  Una vez que el proceso finaliza entramos utilizando el mismo menú a la opción de ventana terminal del nuevo ambiente de trabajo que recién acabamos de crear.

Júpyter notebook agregar ambiente de trabajo virtuales

Júpyter notebook añadiendo ambientes de trabajo virtuales

Instalar librerías dentro de ambientes virtuales

Si queremos instalar  librerías, siempre debe ser en algún ambiente determinado .  Para hacerlo  primero debemos seleccionarlo y abrir la ventana terminal respectiva.  ( la ventana terminal mostrará a la izquierda el nombre del ambiente de trabajo escogido)

una vez abierta la ventana terminal podemos utilizar las opciones de instalación antes mencionadas coma ya sea, PIP, conda, ó a través de anaconda los ambientes de trabajo deben activarse ya sea de forma manual o a través de anaconda.

Los comandos para instalar y activar los ambientes virtuales son los siguientes:  ( estos comando se escriben  en la ventana terminal del ambiente “Base ó root”

CREAR:  conda create -n v-env python=3.7   ( OJO: v-env es un nombre cualquiera escogido por mi )
ACTIVAR:  conda activate v-env

Para consultar comandos adicionales que se utilizan en los ambientes virtuales y el uso de los kernels consulte acá

Para ver todos los entornos que tenemos instalados se puede utilizar: conda env list

Para instalar paquetes dentro de nuestro entorno virtual podemos hacerlo mediante pip o con el instalador de anaconda.

Para ver todos los paqutes instalados podemos hacerlo con : pip list 

Instalación de otras librerías especializadas

En muchas ocasiones requerimos de la instalación de una serie de librerías es parte de Cómo instalar Anaconda 3 en Windows 1, 1 que no se instalan tan fácilmente cómo dar PIP o conda. Veamos la instalacion de NILMTK, una librería abierta especializada en la desagregación del consumo eléctrico.

Abra una ventana de terminal de conda, crearemos un nuevo entorno de Conda y lo activaremos con los comandos:

conda create --name nilmtk-env 
conda activate nilmtk-env

Si aún no está presente en su instalación de Conda, agregue el conda-forge a la lista de canales:

conda config --add channels conda-forge

Finalmente, instale la última versión de NILMTK de conda-forge :

conda install -c nilmtk nilmtk=0.4.3

Observe que el signo igual no lleva espacios(piense estamos usando Python). La ejecución del comando puede tardar un rato. Mientras tanto, consulte otros paquetes en Forge de NILMTK .

Observe que puede dar problemas si tiene instalado una version de python superior a 3.9:

En este caso esto nos obliga a eliminar el entrono y crear uno nuevo con python 3.8

Para ello lo podemos eliminar desde anaconda navigator opción Remove o bien desde consola (conda deactivate y conda env remove -n nilmtk-env), y crearemos uno nuevo desde anaconda navigator, con python 3.8

Como puede experimentar algunos problemas posteriores a la instalación con NILMTK y Matplotlib., para solucionarlos, aplique el comando:

conda install matplotlib 

Para verificar que Matplotlib está instalado, intente invocar la versión de Matplotlib en Python REPL. Use desde el interprete Python los comandos a continuación que incluyen llamar a .__ version__, un atributo común a la mayoría de los paquetes de Python.

>>> import matplotlib

>>> matplotlib.__version__

Ejemplo de salida:

(nilmtk-env) C:\Users\carlo>python
Python 3.6.13 (default, Sep 7 2021, 06:39:02) [MSC v.1916 64 bit (AMD64)] on win32
Type “help”, “copyright”, “credits” or “license” for more information.

import matplotlib
matplotlib.version
‘3.1.3’

Agregar un kernel de Jupyter

Básicamente, NILMTK ahora está instalado en su ordenador. El siguiente paso involucra los cuadernos de Jupyter. Trabajar con Jupyter abre muchas posibilidades y se dice que es una herramienta imprescindible. Por lo tanto, agregue el entorno NILMTK a Jupyter:

python -m ipykernel install --user --name nilmtk-env --display-name "Python (nilmtk-env)"

Prueba de la instalación

Ha llegado el momento de comprobar su instalación. Antes que nada, cree una nueva carpeta y descargue el conjunto de prueba aleatorio de Github:

md nilmtk_testcd nilmtk_test  wget https://raw.githubusercontent.com/nilmtk/nilmtk/master/data/random.h5

Como puede comprobar random.h5 es el fichero de de datos en en formato hdf5 .A continuación, levante Jupyter:

notebook jupyter

Para probar su instalación, intente importar el conjunto de datos aleatorio usando NILMTK y trazar todos los medidores:https://klemenjak.medium.com/media/9ba2be16d331653a7b4093a0fe412434

La salida debe ser:

1MeterGroup (metros =   ElecMeter (instancia = 1, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 2, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 3, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 4, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = [])   ElecMeter (instancia = 5, edificio = 1, conjunto de datos = Ninguno, electrodomésticos = []) )

¡Felicitaciones! Lo ha logrado. ¡NILMTK parece funcionar según lo previsto! 

Como eliminar ficheros repetidos en Windows 11



Las ventajas de eliminar archivos repetidos todos sabemos que puede ser beneficioso, y no solo por el ahorro innegable es espacio en disco, que pude conllevar eliminar los ficheros repetidos ( sobre todo si son de gran tamaño como videos, archivos comprimidos , etc. ), sino por algunos otros condicionantes como pueden ser los siguientes:

  • Liberar espacio de almacenamiento: Los archivos duplicados ocupan espacio innecesario en el disco duro del ordenador. Eliminarlos puede liberar una gran cantidad de espacio, lo que puede ser útil si su ordenador está empezando a quedarse sin espacio pues todos sabemos que parte del disco es reservado como espacio de swapping ( normalmente el doble de RAM) y también se necesita espacio para ficheros temporales, así que si se va justo es fácil que el ordenador vaya muy ralentizado.
  • Mejorar el rendimiento del ordenador: Los archivos duplicados pueden ralentizar el rendimiento del ordenador, ya que el sistema operativo tiene que trabajar más para acceder a ellos. Eliminarlos puede ayudar a mejorar el rendimiento del ordenador, especialmente si tiene muchos archivos.
  • Reducir el riesgo de pérdida de datos: Los archivos duplicados pueden ser una fuente de confusión y errores. Si eliminas uno de los duplicados, es posible que pierdas el archivo original sin saberlo. Eliminar todos los duplicados puede ayudar a reducir el riesgo de pérdida de datos.

Además de estas ventajas generales, eliminar archivos repetidos también puede tener beneficios específicos en función del tipo de archivos que se encuentren. Por ejemplo, eliminar archivos duplicados de imágenes puede ayudar a organizar tu biblioteca de fotos y a ahorrar espacio en su disco duro. Eliminar archivos duplicados de documentos puede ayudarle a encontrar la versión más reciente de un documento y a evitar perder trabajo.

Existen diferentes métodos para eliminar archivos repetidos en un ordenador. Puede hacerlo manualmente, utilizando una herramienta integrada en su sistema operativo o utilizando un programa de terceros especializado en la búsqueda y eliminación de archivos duplicados.

Si tiene muchos archivos repetidos, es recomendable utilizar un programa de terceros. Estos programas suelen ser más eficientes que los métodos manuales o integrados y pueden ofrecer funciones adicionales, como la posibilidad de comparar archivos por tamaño, fecha de creación o contenido.

ELIMINAR FICHEROS DESDE EL PROPIO SISTEMA OPERATIVO

Eliminar ficheros repetidos en Windows 11 se puede hacer de varias maneras, pero una opción común es utilizar la función de búsqueda para identificar y eliminar duplicados. Aquí tenemos algunos pasos generales que podemos seguir:

  1. Abra el Explorador de Archivos:
    • Podemos hacer esto presionando la tecla de Windows + E o haciendo clic en el ícono del Explorador de Archivos en la barra de tareas.
  2. Navegue a la carpeta donde quiera buscar duplicados:
    • Ingrese a la carpeta que contenga los archivos en la que desea buscar duplicados.
  3. Use la función de búsqueda:
    • En la esquina superior derecha del Explorador de Archivos, hay un cuadro de búsqueda. Haga clic en él y escriba lo siguiente para buscar duplicados: *.*.
    • Esto mostrará todos los archivos en la carpeta y sus subcarpetas.
  4. Ordene los archivos por nombre o tamaño:
    • Puede ordenar los archivos por nombre o tamaño para que sea más fácil identificar duplicados. Haga clic en el encabezado de la columna «Nombre» o «Tamaño» para ordenarlos.
  5. Revise y elimine los duplicados:
    • Busque archivos con el mismo nombre o tamaño y revise si son realmente duplicados.
    • Si encuentra duplicados, seleccione uno y presione la tecla Suprimir en su teclado para eliminarlo.

Tenga en cuenta que esta es una forma manual de eliminar duplicados y puede llevar tiempo si tiene muchos archivos, así que si quiere eliminar los ficheros lo mas optimo es usar una aplicación de terceros. Este método es más sencillo y rápido que el anterior, ya que la aplicación se encargará de buscar y eliminar los archivos duplicados por ti. Hay muchas aplicaciones de terceros disponibles, algunas gratuitas y otras de pago. Algunas de las más populares son:

  • Duplicates Cleaner (gratuita)
  • Anti-Twin (gratuita)
  • Duplicate File Finder (gratuita)
  • WinDirStat (gratuita)
  • CCleaner (de pago)
  • Auslogics Duplicate File Finder

Estos programas suelen tener funciones más avanzadas para identificar y manejar duplicados. Entre esta, hay dos opciones gratuitas : Anti-Twin y Duplicates Claner ( esta ultima con limitaciones) que vamos a ver a continuación.

Anti-Twin

La mejor manera de borrar archivos duplicados tal vez sea  utilizando el programa Anti-Twin, que aunque lleva sin actualizarse desde 2012, funciona para las nuevas versiones de Windows. Puede descargarlo en esta página web, ya sea con instalador (with installer, quizas la forma mas standard de instalarlo sin complicaciones) o sin instalador (without installer) para poder llevarlo en cualquier sitio dentro de un USB.

Una vez descargue y lanze la aplicación, su funcionamiento es sencillo pues sólo tiene que  seleccionar una carpeta base para realizar allí la búsqueda. También podrá añadir una segunda carpeta, con la opción de incluir todas o solo algunas subcarpetas si quieres, y puede decidir si comparar todos los archivos, sólo los que sean diferentes, o buscar copias de archivos concretos. Luego, tiene una sección en la que podrá elegir el método de comparación, que puede ser solo por el nombre o por el contenido que tienen los archivos.

Al comparar por contenido puede ser por sus bytes de información o por píxeles si buscas imágenes. Puede elegir ambos, y en cada uno tienes un índice de coincidencia mínima que ajustar por si quieres encontrar los que hayan sido ligeramente modificados.

Una vez lo haya configurado a su gusto, solo tiene que pulsar en Buscar archivos duplicados, y el programa empezará a buscar en las carpetas que le hayas dicho. Cuando termine de encontrar archivos, tendrá que elegir qué quieres hacer con los duplicados que encuentre. Tendrá varios métodos para seleccionarlos y moverlos de sitio, eliminarlos o conservarlos.

Duplicates Cleaner

La aplicación que puede encontrar directamente en la Microsoft Store, la tienda de aplicaciones nativa de Windows 11 ( o en su sitio web : https://www.duplicatecleaner.com/) . Es una herramienta gratis con funciones premium, pero que en su modo gratis ya tiene suficiente para hacer estas búsquedas, aunque sus tipos pueden ser un poco limitados ofrece varias herramientas en las pestañas superiores, algunas gratis y otras de la versión de pago. La versión de pago cuesta 6,99 euros de pago único.

 Estas son las opciones que puede usar gratuitamente sin tener que pagar:

  • Escaneo de ficheros de imágenes.
  • Escaneo de cortes de audio de múltiples formatos.
  • Escaneo de todo tipos de ficheros de vídeo.
  • Exploración de documentos.
  • Exploración de la biblioteca local.

La forma de usar la aplicación es sencilla. Primero tiene que elegir la opción que quieres usar, y luego añadir la carpeta donde vas a buscar duplicados. Una vez la elija, pulse en Escanear carpetas seleccionadas, y el programa se pondrá a funcionar. Cuando termine verá los archivos duplicados que ha encontrado, y tendrá las opciones para eliminarlos o guardarlos.

Consejos para eliminar archivos duplicados

  • Si tiene muchos archivos duplicados, es recomendable que escanee las carpetas más grandes primero.
  • Puede usar filtros para limitar la búsqueda de archivos duplicados. Por ejemplo, puede buscar solo archivos de un tamaño determinado o archivos creados en una fecha determinada.
  • Si no está seguro de qué archivos eliminar, puede moverlos a una carpeta temporal antes de eliminarlos.