Introdução
O Anaconda é um gerenciador de pacotes de código aberto, gerenciador de ambiente e distribuição das linguagens Python e R. Ele é usado geralmente para ciência de dados, aprendizagem de máquina, processamento de dados em grande escala, computação científica e análise preditiva.
Oferecendo uma coleção de mais de 1000 pacotes de ciência de dados, o Anaconda está disponível tanto em versões gratuitas quanto em versões empresariais pagas. A distribuição Anaconda vem com o utilitário de linha de comando conda
. Você pode aprender mais sobre o Anaconda e o conda
, lendo a Documentação oficial do Anaconda.
Este tutorial irá guiá-lo através da instalação da versão Python 3 do Anaconda em um servidor Ubuntu 20.04.
Pré-requisitos
Antes de iniciar este guia, você deve ter um non-root user com privilégios sudo configurado no seu servidor.
Você pode conseguir este pré-requisito completando nosso tutorial configuração de servidor inicial do Ubuntu 20.04.
Instalando o Anaconda
A melhor maneira de instalar o Anaconda é baixar o script bash de instalação do Anaconda, verificá-lo e, em seguida, executá-lo.
Encontre a versão mais recente do Anaconda para Python 3 na página Anaconda Downloads. No momento em que este artigo foi escrito, a versão mais recente é a 2020.02, mas você deve usar a última versão estável se ela estiver disponível.
Em seguida, mude para o diretório /tmp
, em seu servidor. Este é um bom diretório para baixar itens temporários como o script bash do Anaconda, que não vamos mais precisar depois de executá-lo.
Use o curl
para baixar o link que você copiou do site do Anaconda. Vamos usar a saída para enviar para um arquivo chamado anaconda.sh
para um uso mais rápido.
- curl https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh --output anaconda.sh
Agora, podemos verificar a integridade de dados do instalador com a verificação criptográfica de hash através do checksum SHA-256. Vamos usar o comando sha256sum
junto com o nome do arquivo do script:
Você receberá uma saída que se parece com esta:
Output
2b9f088b2022edb474915d9f69a803d6449d5fdb4c303041f60ac4aefcc208bb anaconda.sh
Você deve verificar a saída contra os hashes disponíveis na página Anaconda with Python 3 on 64-bit Linux para sua versão apropriada do Anaconda. Assim que sua saída corresponder ao hash exibido na linha sha2561
, você pode continuar.
Agora, podemos executar o script:
Você receberá o seguinte resultado:
Output
Welcome to Anaconda3 2020.02
In order to continue the installation process, please review the license
agreement.
Please, press ENTER to continue
>>>
Pressione ENTER
para continuar e, em seguida, pressione ENTER
para ler toda a licença. Assim que terminar de ler a licença, você será solicitado a aprovar os termos da mesma:
Output
Do you approve the license terms? [yes|no]
Assim que você concordar, digite yes
.
Neste ponto, você será solicitado a escolher a localização da instalação. Você pode pressionar ENTER
para aceitar a localização padrão ou especificar uma localização diferente para modificá-la.
Output
Anaconda3 will now be installed into this location:
/home/sammy/anaconda3
- Press ENTER to confirm the location
- Press CTRL-C to abort the installation
- Or specify a different location below
[/home/sammy/anaconda3] >>>
O processo de instalação irá continuar. Observe que isso pode levar algum tempo.
Quando a instalação for concluída, você receberá a seguinte saída:
Output
...
Preparing transaction: done
Executing transaction: done
installation finished.
Do you wish the installer to initialize Anaconda3
by running conda init? [yes|no]
[no] >>>
Digite yes
para que você possa inicializar o Anaconda3. Você receberá uma saída que informa as alterações feitas em vários diretórios. Uma das linhas que você receber o agradecerá por instalar o Anaconda.
Output
...
Thank you for installing Anaconda3!
...
Agora, você pode ativar a instalação, fazendo um source no arquivo ~/.bashrc
:
Assim que tiver feito isso, você será levado ao ambiente de programação padrão de base
do Anaconda, e seu prompt de comando mudará para o seguinte:
Embora o Anaconda venha com este ambiente de programação padrão de base
, você deve criar ambientes separados para seus programas e mantê-los isolados um do outro.
Você pode ainda verificar sua instalação fazendo o uso do comando conda
, por exemplo com list
:
Você receberá a saída de todos os pacotes que você tem disponível através da instalação do Anaconda.
Output
# packages in environment at /home/sammy/anaconda3:
#
# Name Version Build Channel
_ipyw_jlab_nb_ext_conf 0.1.0 py37_0
_libgcc_mutex 0.1 main
alabaster 0.7.12 py37_0
anaconda 2020.02 py37_0
...
Agora que o Anaconda está instalado, podemos seguir em frente para a configuração dos ambientes dele.
Configurando Ambientes do Anaconda
Os ambientes virtuais do Anaconda lhe permitem manter projetos organizados pelas versões do Python e pelos pacotes necessários. Para cada ambiente do Anaconda que você configurar, especifique qual versão do Python usar e mantenha todos os arquivos de programação relacionados dentro desse diretório.
Primeiro, podemos verificar para ver quais versões do Python estão disponíveis para que possamos usar:
Você receberá uma saída com as diferentes versões do Python que você pode focar, incluindo tanto versões do Python 3 quanto do Python 2. Como estamos usando o Anaconda com o Python 3 neste tutorial, você terá acesso apenas às versões de pacotes do Python.
Vamos criar um ambiente usando a versão mais recente do Python 3. Podemos conseguir isso atribuindo a versão 3 ao argumento python
. Vamos chamar o ambiente de my_env, mas você pode usar um nome mais descritivo para o ambiente, especialmente se você estiver usando ambientes para acessar mais de uma versão do Python.
- conda create --name my_env python=3
Você receberá uma saída com informações sobre o que está baixado e quais pacotes serão instalados, e, em seguida, será solicitado a prosseguir com y
ou n
. Assim que você concordar, digite y
.
A utilitário conda
agora irá obter os pacotes para o ambiente e informá-lo assim que estiver concluído.
Você pode ativar seu novo ambiente digitando o seguinte:
Com seu ambiente ativado, seu prefixo do prompt de comando irá refletir que você não está mais no ambiente base
, mas no novo ambiente que você acabou de criar.
Dentro do ambiente, você pode verificar se você está usando a versão do Python que você tinha intenção de usar:
Output
Python 3.8.2
Quando você estiver pronto para desativar seu ambiente do Anaconda, você pode fazer isso digitando:
Observe que você pode substituir a palavra source
por .
para obter os mesmos resultados.
Para focar em uma versão mais específica do Python, você pode passar uma versão específica para o argumento python
, como 3.5
, por exemplo:
- conda create -n my_env35 python=3.5
Você pode inspecionar todos os ambientes que você configurou com este comando:
Output
# conda environments:
#
base * /home/sammy/anaconda3
my_env /home/sammy/anaconda3/envs/my_env
my_env35 /home/sammy/anaconda3/envs/my_env35
O asterisco indica o ambiente ativo atual.
Cada ambiente que você criar com o conda create
virá com vários pacotes padrão:
_libgcc_mutex
ca-certificates
certifi
libedit
libffi
libgcc-ng
libstdcxx-ng
ncurses
openssl
pip
python
readline
setuptools
sqlite
tk
wheel
xz
zlib
Você pode acrescentar pacotes adicionais, como o numpy
por exemplo, com o seguinte comando:
- conda install --name my_env35 numpy
Se você já sabe que você gostaria de um ambiente numpy
após a criação, você pode focá-lo em seu comando conda create
:
- conda create --name my_env python=3 numpy
Se você não estiver mais trabalhando em um projeto específico e não tiver mais necessidade do ambiente associado, você pode removê-lo. Para fazer isso, digite o seguinte:
- conda remove --name my_env35 --all
Agora, quando você digitar o comando conda info --envs
, o ambiente que você removeu não será mais listado.
Atualizando o Anaconda
Você deve garantir regularmente que o Anaconda esteja atualizado para que você esteja trabalhando com todas as versões mais recentes do pacote.
Para fazer isso, você deve primeiro atualizar o utilitário conda
:
Quando solicitado a fazer isso, digite y
para continuar com a atualização.
Assim que a atualização do conda
estiver concluída, você pode atualizar a distribuição do Anaconda:
Novamente, quando solicitado a fazer isso, digite y
para continuar.
Isso garantirá que você esteja usando as versões mais recentes do conda
e do Anaconda.
Desinstalando o Anaconda
Se você não estiver mais usando o Anaconda e achar que você precisa desinstalá-lo, você deve começar com o módulo anaconda-clean
, que removerá arquivos de configuração para quando você desinstalar o Anaconda.
- conda install anaconda-clean
Digite y
quando solicitado a fazer isso.
Assim que ele estiver instalado, você pode executar o seguinte comando: Você será solicitado a responder y
antes de excluir cada um deles. Se você preferir não ser solicitado a confirmar, adicione --yes
ao final do seu comando:
Isso também criará uma pasta de backup chamada .anaconda_backup
em seu diretório home:
Output
Backup directory: /home/sammy/.anaconda_backup/2020-05-06T024432
Agora, remova o diretório do Anaconda inteiro digitando o seguinte comando:
Por fim, você pode remover a linha PATH do seu arquivo .bashrc
que o Anaconda adicionou. Para fazer isso, primeiro abra um editor de texto como o nano:
Em seguida, vá para o final do arquivo (se esta é uma instalação recente) ou digite CTRL + W
para procurar pelo Anaconda. Exclua ou comente este bloco do Anaconda:
/home/sammy/.bashrc
...
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/home/sammy/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
eval "$__conda_setup"
else
if [ -f "/home/sammy/anaconda3/etc/profile.d/conda.sh" ]; then
. "/home/sammy/anaconda3/etc/profile.d/conda.sh"
else
export PATH="/home/sammy/anaconda3/bin:$PATH"
fi
fi
unset __conda_setup
# <<< conda initialize <<<
Quando você terminar de editar o arquivo, digite CTRL + X
para sair e y
para salvar alterações.
O Anaconda está removido do seu servidor agora. Se você não desativou o ambiente de programação base
, você pode sair e entrar novamente no servidor para removê-lo.
Conclusão
Este tutorial o conduziu pela instalação do Anaconda, trabalhando com o utilitário de linha de comando conda
, configurando ambientes, atualizando o Anaconda e excluindo o Anaconda se você não precisar mais dele.
Você pode usar o Anaconda para ajudá-lo a gerenciar workloads para ciência de dados, computação científica, análise e processamento de dados em larga escala. A partir daqui, você pode verificar nossos tutoriais de análise de dados e aprendizado de máquina para aprender mais sobre várias ferramentas disponíveis para usar e projetos que você pode fazer.
Também temos um ebook de aprendizado de máquina gratuito disponível para download, Python Machine Learning Projects.