Wolfram 언어

수치 데이터의 이상값 탐지

극단값(이상값)이란 다른 대부분의 데이터 점에서 동 떨어진 데이터 점이라 정의할 수 있습니다. 이 예는 간단한 수치 데이터 집합을 사용하여 이상을 찾는 방법 및 이상 검출과 "더 낮은 확률"이라는 개념을 관련짓는 방법을 설명합니다.

Fisher의 Iris(붓꽃) 데이터 집합을 가져와 속성 "PetalLength"(꽃잎의 길이)와 "SepalWidth"(꽃받침 조각의 폭)을 선택합니다.

데이터 집합의 이상값을 찾습니다.

데이터의 다른 부분과 비교한 이상값의 위치를 시각화합니다.

이상 검출기 함수는 데이터에서 얻을 수 있습니다.

검출 함수를 사용하여 이상값을 찾습니다.

특정 예에 검출기 함수를 사용합니다.

각각의 이상 검출기에 이상이 없다고 알려진 데이터 점에서 훈련된 LearnedDistribution이 포함되어 있습니다. 이 분포에서 새로운 예의 RarerProbability를 계산할 수 있습니다.

더 낮은 확률에는 모든 예가 이상값 인지를 정의하기 위해 사용됩니다. 기본적으로 0.001보다 작은 확률을 가진 예를 이상값으로 간주됩니다. 낮은 확률의 함수, 이상값 결정 경계선, 데이터를 시각화합니다.

관련 예제

de en es fr ja pt-br zh