Encontre valores atípicos em dados numéricos
Dados atípicos (ou anomalias) podem ser definidos como pontos de dados que são muito mais raros do que a maioria dos outros pontos de dados. Este exemplo usa um conjunto de dados numéricos simples para mostrar como encontrar anomalias e relacionar a detecção de anomalias ao conceito de "probabilidade mais rara".
Carregue o conjunto de dados de Fisher Irises e selecione os atributos "PetalLength" e "SepalWidth".
Encontre dados atípicos no conjunto de dados.
Visualize a posição dos dados atípicos em comparação com o resto dos dados.
Uma função de detecção de anomalia também pode ser obtida com os dados.
Use a função de detecção para encontrar os dados atípicos.
Use a função de detecção em exemplos específicos.
Cada detector de anomalia contém uma LearnedDistribution treinada nos pontos de dados considerados não anômalos. Com esta distribuição, pode-se calcular a RarerProbability de novos exemplos.
A probabilidade mais rara é usada para definir quais exemplos são dados atípicos. De forma padrão, qualquer exemplo com uma probabilidade mais rara menor que 0,001 é considerado atípico. Visualize a função de probabilidade mais rara, o limite de decisão atípico e os dados.