유전자의 일반적인 DNA 부분 배열: Wolfram Language 11의 신기능

유전자의 일반적인 DNA 부분 배열

버전 7에 소개되었된 LongestCommonSequence와 LongestCommonSubsequence에 위치적 카운터파트를 가미하여 LongestCommonSequencePositions과 LongestCommonSubsequencePositions으로 새롭게 단장하였습니다.

Y 염색체의 랜덤 유전자의 DNA 염기 서열을 비교합니다.

In[1]:=

genes = RandomSample[GenomeData["ChromosomeYGenes"], 4]

Out[1]=

유전자를 쌍으로 그룹화합니다.

In[2]:=

With[{subsets = Subsets[genes, {2}]},
  Table[pair[i] = subsets[[i]], {i, 1, Length[subsets]}]];

각 쌍에 공통으로 적용하는 가장 긴 연속적인 DNA 서열의 위치를 배열 자체와 함께 구하는 함수를 정의합니다

In[3]:=

commonDNASubequence[{g1_, g2_}] := 
 With[{d1 = GenomeData[g1], d2 = GenomeData[g2]}, {{g1, g2}, 
   LongestCommonSubsequencePositions[d1, d2], 
   LongestCommonSubsequence[d1, d2]}]

첫번째 쌍의 최장 공통 부분열을 알아봅니다.

In[4]:=

commonDNASubequence[pair[1]]

Out[4]=

두번째 쌍의 최장 공통 부분열을 살펴봅니다.

In[5]:=

commonDNASubequence[pair[2]]

Out[5]=

세번째 쌍의 최장 공통 부분열을 살펴봅니다.

In[6]:=

commonDNASubequence[pair[3]]

Out[6]=

네번째 쌍의 최장 공통 부분열을 살펴봅니다.

In[7]:=

commonDNASubequence[pair[4]]

Out[7]=

다섯번째 쌍의 최장 공통 부분열을 살펴봅니다.

In[8]:=

commonDNASubequence[pair[5]]

Out[8]=

여섯번째 쌍의 최장 공통 부분열을 살펴봅니다.

In[9]:=

commonDNASubequence[pair[6]]

Out[9]=

Wolfram 언어™

유전자의 일반적인 DNA 부분 배열

관련 예제