Wolfram Language

Procesamiento de texto y lenguaje

Descomposición de cadenas de caracteres

Examine las frecuencias de codones (grupos de nucleótidos consecutivos) en la lista de nucleótidos de un gen.

Obtenga la secuencia de ADN de un gen humano "SCNN1A".

In[1]:=
Click for copyable input
dnasequence = GenomeData["SCNN1A", "FullSequence"];

Use StringPartition para construir la correspondiente lista de codones.

In[2]:=
Click for copyable input
codons = StringPartition[dnasequence, 3];
In[3]:=
Click for copyable input
Take[codons, 10]
Out[3]=

Calcule la frecuencia relativa de cada codón en este gen.

In[4]:=
Click for copyable input
frequencies = N[Counts[codons]/Length[codons]];

Existen 64 posibles codones formados a partir de los nucleótidos A, C, G, T, y aparecen en el gen seleccionado.

In[5]:=
Click for copyable input
frequencies // Length
Out[5]=

Encuentre los tres codones con las frecuencias más altas.

In[6]:=
Click for copyable input
TakeLargest[frequencies, 3]
Out[6]=

Encuentre los tres codones con las frecuencias más bajas.

In[7]:=
Click for copyable input
TakeSmallest[frequencies, 3]
Out[7]=

Visualice todas las frecuencias en un Grid.

muestre la entrada completa de Wolfram Language
In[8]:=
Click for copyable input
background = Thread[Rule[ Flatten[{ Outer[List, Range[1, 15, 2], {3, 4, 7, 8}], Outer[List, Range[2, 16, 2], {1, 2, 5, 6}] }, 2], GrayLevel[0.9]]]; Grid[Partition[Sequence @@@ Normal[KeySort@frequencies], 8], Spacings -> {1, 1}, Dividers -> All, Background -> {None, None, background}]
Out[8]=

Ejemplos relacionados

de en fr ja ko pt-br ru zh