Ferramentas para Análise de Dados e Machine Learning
Linguagem de Programação
A linguagem de programação mais comum para a análise de dados é Python. De fácil aprendizado, versátil e com vasta diversidade de bibliotecas para as mais diversas aplicações.
A instalação pode ser realizada baixando o instalador diretamente do site oficial Python.org.
Outra forma de instalar o python é através do gerenciador de instalação winget via Powershell
:
No momento da elaboração deste material, a versão corrente do Python é a 3.13.
Python Installer Package - PIP
Instalador de pacotes python, geralmente já vem na instalação padrão do Python
e seu modo de uso será abordado superficialmente, apenas na aplicação do que for necessário;
Como o próprio nome descreve, a ferramenta pip
serve para realizar a instalação de pacotes indexados no repositório de software para python o Python Package Index - PyPI.
Como exemplo de utilização comum, para a instalação do framework Pandas
para manipulação de dataframes, temos:
Virtual Environment - venv
venv
é um módulo que suporta a criação de ambientes virtuais isolados, de forma simples e prática. O ambiente criado é para ser descartável e facilmente recriável em um outro local.
É criado sobre a instalação Python existente.
# Criando um ambiente virtual
python -m venv nome-venv
# Ativando o ambiente virtual
# Linux
source nome-venv/bin/activate
# Windows
nome-venv\Scripts\activate
Jupyter notebook
O Jupyter é um projeto de código aberto sem fins lucrativos, nascido em 2014, que busca oferecer suporte à ciência de dados de forma interativa e à computação científica em todas as linguagens de programação.
Existem algumas interfaces para o Jupyter, como o JupyterLab
, Voilà
e o clássico Jupyter Notebook
.
Instalando o Jupyter Notebook via pip:
Executando o Jupyter notebook:
Criando um Ambiente de Desenvolvimento
Para a criação de um ambiente de desenvolvimento é necessário que o Python esteja instalado no computador, bem como o Jupyter Notebook.
0) Criar/Acessar o diretório do projeto.
1) Criando o ambiente virtual
2) Acessando o ambiente virtual
Após o acesso ao ambiente virtual, no início do prompt aparece entre parênteses o nome da venv:
Obs: Para sair do ambiente de desenvolvimento (venv), basta executar o comando deactivate
:
3) Instalando kernel para Jupyter Notebook
4) Adicionando o ambiente virtual à lista de kernels do Jupyter Notebook
Obs: Quando o kernel não for mais necessário, pelo fim do desenvolvimento do projeto, por exemplo, pode-se excluir este kernel da lista no Jupyter Notebook:
5) Executando o Jupyter notebook
6) O Jupyter Notebook será aberto no navegador em localhost:8888\tree
7) Para criar um notebook
, clique em File
, New
e selecione Notebook
:
8) Selecione o kernel deste projeto, dentro da lista disponível:
9) Verifique no canto superior direito que o kernel selecinado foi carregado:
O ambiente está pronto para o projeto ser desenvolvido.