Definição |
Algoritmos que aprendem relações entre atributos de entrada e de saída a partir de conjunto de exemplos rotulados |
Algoritmos que buscam encontrar padrões em agrupamentos de dados com características semelhantes, em busca de categorias e desfechos ainda não identificados ou não informados |
Vantagens |
Análise de múltiplos parâmetros. Solução rápida e automática para questões de grande escala e elevada acurácia |
Menor interferência humana na análise dos dados. Excelente excelente para fontes de dados multimodais ou multidimensionais. Permite identificação de novos desfechos |
Desvantagens |
Necessidade dos dados serem rotulados, o que para grandes volumes de dados pode ser impraticável. Tendência ao sobreajuste dos dados |
Custo elevado e técnicas complexas. Necessita grande quantidade de dados para elaboração do algoritmo. Interpretação dos resultados pode ser desafiadora |
Principais tarefas |
Regressão, classificação, modelo prognóstico e análise de sobrevivência |
Redução da dimensionalidade do problema e agrupamento |
Exemplos de algoritmos |
Regressão logística, árvores de decisão, random forests e redes neurais artificiais |
Análise das componentes principais, agrupamento hierárquico, autoencoders, análise linear de discriminantes |