Tutorial Anaconda: Python para Machine Learning y Data Science - Ikkaro

Tutorial Anaconda: Qué es, cómo instalarlo y cómo se usa

NUEVO PROYECTO: Recibe una curiosidad diaria con nuestra Newsletter. Pequeños asombros diarios para Personas Altamente Curiosas
Anaconda Data Science, big data y pytho, R disribución

En este artículo dejo una guía de instalación de Anaconda y guía de uso de su gestor de paquetes Conda. Con esto podremos crear entornos de desarrollo para python y R con las librerías que deseemos. Muy interesante para empezar a trastear con Machine Learning, análisis de datos y programación con Python.

Anaconda es una distribución libre y Open Source de los lenguajes de programación Python y R muy usada en computación científica (Data ScienceData Science, Machine Learning, Ciencia, Ingeniería, analítica predictiva,Big Data, etc).

Nos instala una gran cantidad de aplicaciones muy utilizadas en estas disciplinas todas de una vez, en lugar de tener que ir instalándolas una a una. . Más de 1400 y que son los más utilizados en estas disciplinas. Algunos ejemplos

  • Numpy
  • Pandas
  • Tensorflow
  • H20.ai
  • Scipy
  • Jupyter
  • Dask
  • OpenCV
  • MatplotLib

Hace un tiempo instalé Keras y TensorFlow a pelo pero La solución de Anaconda me parece mucho más sencilla y útil

También es una magnífica opción para instalar Phyton en nuestro sistema operativo con las librerías que necesitemos y tenerlo aislados los proyectos en diferentes entornos virtuales.

Paquetes y aplicaciones de la distribución Anaconda

Yo concretamente lo estoy probando por unos scripts para gestionar grandes csv para el trabajo y para los que necesito NumPy y Pandas. Y ya puestos probaré Tensorflow y alguna cosilla más ;-)

Lo que veo con la cantidad de paquetes que veo es que no se limita a análisis de datos porque podemos instalar cientos de plugins (librerías) dedicados al desarrollo web o al escrapeo como Scrappy. Así que vamos con el tutorial general de la instalación y creación de entornos e investigaremos las aplicaciones que podemos instalar.

NUEVO PROYECTO: Recibe una curiosidad diaria con nuestra Newsletter. Pequeños asombros diarios para Personas Altamente Curiosas

Anaconda vs Conda

Un inciso. No hay que confundir Anaconda que es la suite que nos permite usar muchas librerías y software de Data Analysis, Science Data y Machine Learning con Conda que es el gestor de paquetes de Anaconda y de entornos virtuales.

Cómo instalar Anaconda en Ubuntu

Se puede instalar Anaconda tanto en Microsoft, MacOs como en Linux. Yo te cuento mi experiencia en Ubuntu.

Hay diferentes forma para instalar Anaconda en Ubuntu, a mí la que más me gusta es ir a la web oficial y descargar el .sh. Busca tu sistema operativo y la versión que te interesa

Si empiezas te recomiendo que elijas la versión 3.7 que la 2.7 quedará obsoleta en unos años.

Si te descargas como yo el .sh para linux tienes que abrir la consola o terminal, e ir hasta el directorio donde está , en mi caso Descargas

Recuerda que el error más común por el que la gente tiene problemas es que no entra en la carpeta o directorio adecuado

cd Descargas
ls
sh nombre_del_archivo_que_has_descargado.sh

Con la primera línea vamos al directorio Descargas, con las segunda «ls» nos lista los archivos que hay y así podemos ver el nombre del .sh y con la tercera ejecutamos el .sh que digamos que es como el .exe de windows.

Y empezará a ejecutarse. Acepta los términos de la licencia del software y luego te preguntará si quieres instalar Visual Code Studio. Yo le he dicho que sí.

Pasos tras instalar Anaconda

Hay que salir de esa venta del terminal para que los cambios funcionen. Así que cerramos terminal, volvemos a abrir y tecleamos

anaconda-navigator

Con esto se nos abrirá una interfaz gráfica con formato navegador que nos permitirá instalar y activar diferentes paquetes, aunque todo podemos hacerlo también desde la consola.

Una vez instalado comprobaremos que esté todo correcto. para eso vamos a ver qué versión tenemos instalada

conda --version

Si está todo bien nos devolverá alto como conda 4.6.4 si sale algún error habrá que ver lo que nos dice para solucionarlo, reinstalarlo, etc.

Si acabas de instalar deberías de ver si hay alguna actualización en conda

conda update conda
conda update anaconda

Esto compara la versión que tenemos con la que hay disponible y si hay alguna novedad nos preguntará

Proceed ([y]/n)? y

Ponemos «y» el yes y enter

Crear entornos virtuales de trabajo con Conda

Cada proyecto que hagamos podemos tenerlo en un entorno separado, de esta forma evitamos problemas con dependencias de paquetes, etc.

Para crear un entorno virtual, le vamos a llamar comparador escribimos en la terminal:

conda create --name comparador python=3.7

Donde comparador es el nombre del entorno virtual y python=3.7 es el paquete que queremos que instale.

Lo activamos con

conda activate comparador

Y desactivamos con

conda deactivate

Verificamos los entornos virtuales on

conda info --envs

Esto nos mostrará los entornos que tenemos, nos devolverá algo como

# conda environments:
#
base                  *  /home/nacho/anaconda3
comparador               /home/nacho/anaconda3/envs/comparador

base es el root, y el asterisco nos muestra el que tenemos activado.

También hay una cosa a resaltar. Al activar un entorno en la consola nos antepone el nombre en paréntesis en el prompt, con lo que en todo momento sabemos donde estamos

Más comandos interesantes:

podemos buscar aplicaciones a instalar. Imagina que quiero instalar Keras, pues primero busco si la aplicación está disponible y que versines hay

conda search keras

Como veo que sí que está ya paso a instalarla

conda install keras

Y para ver todo lo que tenemos instalado en nuestro entorno de desarrollo usaremos

conda list

Manejar paquetes pkgs con conda

Aquí van unas cuantas opciones interesantes. Que nos ayudarán a dejar configurado nuestro entorno virtual con las aplicaciones que necesitamos para trabajar.

Instalar paquetes

Hay comandos muy específicos. Para instalar un paquete en un entorno determinado. Por ejemplo Keras, en mi entorno recién creado comparador

conda install --name comparador keras

Si no añadimos el –name comparador lo instalaría en el entorno que tengamos activo en ese momento.

Podemos instalar varios paquetes al mismo tiempo (keras y scrappy) con

conda install keras scrappy

Pero no se recomienda para evitar problemas con dependencias.

Por último podemos elegir la versión específica que queremos instalar si nos interesa por algún motivo

conda install keras=2.2.4

Instalar paquetes que no sean de Conda

En este caso echaremos mano de pip

pip install

Actualizar paquetes

Hay diferentes opciones. Actualizar un paquete específico con

conda update keras

Actualizar python

conda update python

Actualizar conda

conda update conda

Y para actualizar todo el meta paquete de Anaconda

conda update conda
conda update anaconda

Borrar paquetes

Borrar paquetes en un entorno determinado. Por ejemplo Keras del entorno comparador

conda remove -n comparador keras

Si queremos borrar del entorno en el que estamos

conda remove keras

Se pueden borrar varios paquetes a la vez

conda remove keras scrappy

Y es recomendado comprobar los paquetes para ver si se ha desinstalado correctamente con

conda list

Para mí esto es lo básico, si quieres profundizar más aquí tienes el manual oficial de conda (en inglés)

Dejamos una cheat sheet de Conda oficial, con los principales comandos para un uso rápido de la distribución.

Un paseo por el entorno gráfico de Anaconda

Todo esto que estamos haciendo con la terminal y conda podemos hacerlo gráficamente con la interfaz de Anaconda.

Para iniciar la distribución primero tendremos que tener el entorno base(root) conda activo

conda activate base

Y con esto ya podemos llamar a Anaconda. Si no, no se inicia

anaconda-navigator

Veis, aquí nos parece el proyecto base, que es el root y luego los entornos que vas creando y que en mi caso ha sido comparador.

Lo mejor es verlo en un vídeo

Y con los conocimientos adquiridos a lo largo del artículo ya podemos empezar a toquetear y trastear con muchas librerías y aplicaciones.

Si tienes alguna duda deja un comentario e intentaré ayudarte

Deja un comentario