Wolfram Language

Langage de base

Sous-séquence commune d'ADN de gènes

Les fonctions LongestCommonSequence et LongestCommonSubsequence de la version 7 sont maintenant complétées par leurs homologues LongestCommonSequencePositions et LongestCommonSubsequencePositions.

Comparez les séquences d'ADN de gènes aléatoires du chromosome Y.

In[1]:=
Click for copyable input
genes = RandomSample[GenomeData["ChromosomeYGenes"], 4]
Out[1]=

Groupez ces gènes par paires.

In[2]:=
Click for copyable input
With[{subsets = Subsets[genes, {2}]}, Table[pair[i] = subsets[[i]], {i, 1, Length[subsets]}]];

Définissez une fonction qui obtiendra les positions de la plus longue séquence continue d'ADN commune à chaque paire, ainsi que la séquence elle-même.

In[3]:=
Click for copyable input
commonDNASubequence[{g1_, g2_}] := With[{d1 = GenomeData[g1], d2 = GenomeData[g2]}, {{g1, g2}, LongestCommonSubsequencePositions[d1, d2], LongestCommonSubsequence[d1, d2]}]

La plus longue séquence commune de la première paire.

In[4]:=
Click for copyable input
commonDNASubequence[pair[1]]
Out[4]=

La plus longue séquence commune de la seconde paire.

In[5]:=
Click for copyable input
commonDNASubequence[pair[2]]
Out[5]=

La plus longue séquence commune de la troisième paire.

In[6]:=
Click for copyable input
commonDNASubequence[pair[3]]
Out[6]=

La plus longue séquence commune de la quatrième paire.

In[7]:=
Click for copyable input
commonDNASubequence[pair[4]]
Out[7]=

La plus longue séquence commune de la cinquième paire.

In[8]:=
Click for copyable input
commonDNASubequence[pair[5]]
Out[8]=

La plus longue séquence commune de la sixième paire.

In[9]:=
Click for copyable input
commonDNASubequence[pair[6]]
Out[9]=

Exemples connexes

de en es ja ko pt-br ru zh