토폴로지 유사성 검색하기
원자 쌍의 기술자는 유사 화합물 분자의 집합을 검색하는데 사용됩니다. 다음의 예는 기술자, 쌍 사이의 연상 및 쌍의 결합 거리를 계산하는 방법을 보여주고, 두 분자 사이의 거리를 계산합니다.
원자 쌍은 2개의 원자와 원자 사이의 최단 경로에 따른 결합의 수에 의해 정의되는 분자의 부분 구조입니다. 다음의 플롯은 3개의 원자 쌍(4개의 개재 결합을 가진 2개의 쌍과 7개의 개재 결합을 가진 1개의 쌍)을 나타냅니다.
모든 원자 쌍의 인스턴스를 계산하는 함수를 정의합니다. 함수는 3개의 값 {distance, atom1, atom2}인 키를 가진 Association을 반환하고 그 값은 원자 쌍의 발생 횟수를 줍니다.
분자의 모든 쌍을 계산합니다. 각각의 atomi는 형식 {"AtomicSymbol", "PiElectronCount", "HeavyAtomCoordinationNumber"}인 3가지의 값입니다.
두 분자의 유사성은 원자 대 연상 각각의 여러 집합 간에 중복되는 정도에 따라 측정됩니다. 여러 집합의 Dice 비유사성에 기초한 사용자 정의 거리 함수를 작성합니다.
PubChem의 중추 신경계(CNS) 약물 (2018년 11월 14일에 추출)의 목록에서 분자를 작성합니다. PubChem CID는 MetaInformation을 사용해 분자에 저장됩니다.
다양한 CNS 약물에 대한 NearestFunction을 분자 거리 함수를 사용하여 작성합니다.
디아제팜이 인간의 신경계에 작용하는 것으로 알려져 있기 때문에 유사한 분자를 찾습니다.
디아제팜에 가장 가까운 집합의 10개의 분자를 구합니다.
MoleculePlot을 사용하여 디아제팜과 가장 유사한 10개의 화합물을 시각화합니다.