Zerlegung von Strings: Neu in Wolfram Language 11

Zerlegung von Strings

Untersuchen Sie die relative Häufigkeit von Codonen (eine Sequenz von drei Nukleobasen) in der Nucleotidenfolge eines Gens.

Ermitteln Sie die DNA-Sequenz des menschlichen Gens "SCNN1A".

In[1]:=

dnasequence = GenomeData["SCNN1A", "FullSequence"];

Erstellen Sie mit StringPartition die entsprechende Liste der Codone.

In[2]:=

codons = StringPartition[dnasequence, 3];

In[3]:=

Take[codons, 10]

Out[3]=

Berechnen Sie die relative Häufigkeit jedes Codons in diesem Gen.

In[4]:=

frequencies = N[Counts[codons]/Length[codons]];

64 mögliche Codone können aus den Nucleotiden A, C, G, T gebildet werden, und alle von ihnen kommen im ausgewählten Gen vor.

In[5]:=

frequencies // Length

Out[5]=

Finden Sie die drei häufigsten Codone.

In[6]:=

TakeLargest[frequencies, 3]

Out[6]=

Finden Sie die drei am wenigsten häufigen Codone.

In[7]:=

TakeSmallest[frequencies, 3]

Out[7]=

Visualisieren Sie alle relativen Häufigkeiten in einem Grid.

Den kompletten Wolfram Language-Input zeigen

In[8]:=

background = Thread[Rule[
    Flatten[{
      Outer[List, Range[1, 15, 2], {3, 4, 7, 8}], 
      Outer[List, Range[2, 16, 2], {1, 2, 5, 6}]
      }, 2],
    GrayLevel[0.9]]];
Grid[Partition[Sequence @@@ Normal[KeySort@frequencies], 8],
 Spacings -> {1, 1},
 Dividers -> All,
 Background -> {None, None, background}]

Out[8]=

Wolfram Language™

Zerlegung von Strings

Verwandte Beispiele