Wolfram Language

Traitement de texte et de langues

Décomposition des chaînes de caractères

Examinez les fréquences de codons (groupes de trois nucléotides consécutifs) dans la liste des nucléotides d'un gène.

Obtenez la séquence d'ADN du gène humain "SCNN1A".

In[1]:=
Click for copyable input
dnasequence = GenomeData["SCNN1A", "FullSequence"];

Utilisez StringPartition pour construire la liste correspondante de codons.

In[2]:=
Click for copyable input
codons = StringPartition[dnasequence, 3];
In[3]:=
Click for copyable input
Take[codons, 10]
Out[3]=

Calculez la fréquence relative de chaque codon dans ce gène.

In[4]:=
Click for copyable input
frequencies = N[Counts[codons]/Length[codons]];

Il existe 64 codons possibles formés à partir des nucléotides A, C, G, T et ils apparaissent tous dans le gène choisi.

In[5]:=
Click for copyable input
frequencies // Length
Out[5]=

Trouvez les trois codons avec les fréquences les plus élevées.

In[6]:=
Click for copyable input
TakeLargest[frequencies, 3]
Out[6]=

Trouvez les trois codons avec les fréquences les plus basses.

In[7]:=
Click for copyable input
TakeSmallest[frequencies, 3]
Out[7]=

Visualisez toutes les fréquences dans une Grid.

Afficher l'entrée complète de Wolfram Language
In[8]:=
Click for copyable input
background = Thread[Rule[ Flatten[{ Outer[List, Range[1, 15, 2], {3, 4, 7, 8}], Outer[List, Range[2, 16, 2], {1, 2, 5, 6}] }, 2], GrayLevel[0.9]]]; Grid[Partition[Sequence @@@ Normal[KeySort@frequencies], 8], Spacings -> {1, 1}, Dividers -> All, Background -> {None, None, background}]
Out[8]=

Exemples connexes

de en es ja ko pt-br ru zh