음높이 인식하기: Wolfram 언어 12의 신기능

음높이 인식하기

신호의 음높이는 사람의 목소리와 악기와 같은 신호에 매우 중요한 기술자입니다. 최신 기계 학습 기술은 이러한 작업의 안정성이 끊임없이 개선되고 있습니다.

PitchRecognize를 사용하여 단일음 신호의 음높이를 인식합니다.

신경망 기반의 방법을 사용합니다.

Wolfram Neural Net Repository의 CREPE 음높이 인식 신경망을 가져와서 사용할 수도 있습니다. 네트워크의 출력 주파수 추정의 열 및 신뢰도로 변환하기 위해 HiddenMarkovProcess를 사용할 수 있습니다.

이 네트워크는 음높이의 추정치를 360의 로그 피치 클래스의 집합의 확률 분포로 예측하도록 훈련되어 있습니다. 네트워크에 의해 주어진 클래스 예상 사이를 보완하는 효용 함수로 인식된 주파수와 신뢰도를 출력하는 함수를 정의할 수 있습니다.

전체 Wolfram 언어 입력 표시하기

음높이를 인식하고 대응하는 신뢰도를 계산합니다.

신뢰도를 색상에 매핑하여 인식된 주파수를 플롯합니다.