Vejam também: https://medium.com/machina-sapiens/o-algoritmo-da-floresta-aleat%C3%B3ria-3545f6babdf8
Matéria original e direitos reservados ao autor.
Traduzida pelo Google Translate com uma pequena melhorada!
Highlights: Deseja usar algo mais interoperável, algo que treine mais rápido e tenha um desempenho tão bom quanto a antiga Regressão Logística ou mesmo as Redes Neurais? Você deve considerar as Árvores de Decisão (Decision Tree) para classificação e regressão. Parte 2 sobre florestas aleatórias (Random Forest) aqui.
- Treinamento muito mais rápido do que redes neurais simples para desempenho comparável (a complexidade do tempo das árvores de decisão é uma função de [número de recursos, número de linhas no conjunto de dados], enquanto nas redes neurais é uma função de [número de recursos, número de linhas no conjunto de dados, número de camadas ocultas, número de nós em cada camada oculta])
- Facilmente interpretável, adequado para seleção de variáveis
- Bastante robusto em conjuntos de dados menores
- Árvores de decisão e aprendizado de árvore de decisão são simples de entender
Continuar lendo Decision Trees e Random Forests para Classificação e Regressão