Búsqueda de valores atípicos en datos numéricos
Los valores atípicos (o anomalías) pueden ser definidos como puntos de datos que son mucho más inusuales que muchos otros puntos de datos. Este ejemplo usa un conjunto de datos numéricos simple para mostrar cómo encontrar anomalías, y cómo relacionar la detección de anomalías con el concepto de la "probabilidad más inusual".
Cargue el conjunto de datos iris de Fisher y seleccione los atributos "PetalLength" y "SepalWidth".
Encuentre los valores atípicos en el conjunto de datos.
Visualice la posición de los valores atípicos comparados con el resto de los datos.
Una función de detección de anomalías también puede ser obtenido a partir de los datos.
Use la función de detección para encontrar los valores atípicos.
Use la función de detección en ejemplos específicos.
Cada detector de anomalías contiene una función LearnedDistribution entrenada en los puntos de datos que fueron considerados como no anómalos. A partir de esta distribución, uno puede calcular la RarerProbability de nuevos ejemplos.
La probabilidad más inusual es usada para definir qué ejemplos son valores atípicos. Cualquier ejemplo con una probabilidad más inusual menor a 0.001 se considera un valor atípico por defecto. Visualice la función de probabilidad más inusual, el límite de decisión del valor atípico y los datos.