Aprendizado de Máquina - Machine Learning

O aprendizado de máquina (machine Learning) ou aprendizado automático, deriva da engenharia com a ciência da computação, evoluindo de estudos de reconhecimento de padrões e da teoria do aprendizado computacional em inteligência artificial.

A sua definição foi estabelecida por Arthur Samuel em 1959 como:

"campo de estudo que dá aos computadores a habilidade de aprender sem serem explicitamente programados".

O aprendizado de máquina é o estudo e a construção de algoritmos que, utilizando dados, realizam previsões e aprendem com os próprios erros. Estes algoritmos recebem amostras a partir das entradas do modelo, de modo a realizar previsões e tomadas de decisões guiadas pelos dados e não por instruções programadas.

O aprendizado de máquina, utiliza o raciocínio indutivo para produzir os seus resultados, diferenciando-se da inteligência artificial, que pode além disso, utilizar o raciocínio dedutivo.

Machine Learning é a arte de programar computadores que aprendem através de dados.

Modelos

Um modelo é uma representação de um objeto ou sistema. Pode ser físico (protótipo, maquete) ou abstrato (expressão matemática, diagrama, descrição).

Na engenharia ou na ciência de dados, os modelos simulam a mudança de comportamento mediante a variação de seus parâmetros de funcionamento.

Algoritmo

Um algoritmo é uma sequência finita de ações executáveis que tem como objetivo a solução de um determinado problema.

Programação tradicional X Aprendizado de máquina

Programação Tradicional	Aprendizado de Máquina
1. Seleciona exemplos 2. Encontra alguns padrões 3. Escreve as regras 4. Testa o algoritmo	1. Seleciona exemplos 2. Encontra alguns padrões 3. Extrai as características 4. Treina o algoritmo de ML 5. Testa o algoritmo de ML

Histórico de desenvolvimento

Década	Aprendizado	Altoritmo	Aplicação
60	Supervisionado	KNN - K Nearest Neighbors Linear Regression	Reconhecimento de padrões Análises preditivas
70	Não Supervisionado	K-means Redes Neurais Aritificiais	Aprende sem o uso de rótulos nos treinos
80	Ensemble learning	Decision Tree	Aumento significativo na precisão dos modelos de ML
00/10			Big Data Capacidade Computacional Redes neurais profundas Cloud Computing Processamento Paralelo

Aplicações de Aprendizado de Máquina

Identificação de defeitos em imagens de cameras.
Detecção de tumores em imagens médicas.
Deteção de objetos em imagens.
Classificação de notícias automaticamente.
Atribuição de sentimentos as notícias.
Remoção de comentários, artigos ou vídeos ofensivos.
Resumo de longos textos.
Criação de chatbot e assistentes pessoais.
Previsão de faturamento.
Elasticidade de preço.
Reconhecimento facial e de voz.
Detecção de fraude de cartão de crédito.
Segmentação de clientes
Recomendação de produtos

Tipos de Aprendizado

Os 4 principais tipos de aprendizagem são:

Aprendizado Supervisionado
Aprendizado Não-Supervisionado
Aprendizado Semi-Supervisionado
Aprendizado por Reforço

No aprendizado supervisionado, o conjunto de dados para treinamento utiliza um rótulo que identifica a característica observada, usada para o treinamento do algorítmo e separação dos dados em classes.

A aprendizagem supervisionada resolve, basicamente, problemas de Classificação e Regressão.

Tarefa de classificação

Quando o conjunto de treinamento possui o rótulo do fenômeno observado como uma variável discreta, dizemos que é um problema de classificação, ou seja, o algoritmo precisa aprender a classificar os exemplos do conjunto, através da interpretação de suas características, em rótulos ou classes.

Figura 1: Classificação

Fonte: Data Hackers - Medium

Variáveis discretas são usadas para medir características que podem assumir apenas um número finito contável de valores e, assim, somente fazem sentido valores inteiros. Por exemplo, número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia e etc.

Tarefa de regressão

Quando o conjunto de treinamento possui o rótulo do fenômeno observado como uma variável real ou contínua, como o salário e o peso, por exemplo. Nesse tipo de tarefa, o algoritmo tenta ajustar um novo ponto, ao conjunto de pontos do conjunto de dados, de modo que apresente a menor distância possível dos pontos do conjunto de dados. Por exemplo, peso, salário, número de vendas, preço do produto, propensão de compra, número de dias até a primeira venda acontecer, etc

Figura 2: Regressão linear

Fonte: Dicionário Financeiro

Algoritmos de Aprendizado de Máquina: Classificação

K-Nearest Neighbors
Naive Bayes
Light Gradient Boost Machine ( LGBM )
Categorical Boost ( CatBoost )
Logistic Regression
Support Vector Machine ( SVM )
Decision Tree
Random Forests
Neural Networks

Algoritmos de Aprendizado de Máquina: Regressão

Linear Regression
Polinomial Regression

Referências