Wolfram言語

配列アラインメントとクラスタリング

この例では,さまざまな生命体の進化的に保存された(相同)遺伝子の配列を配列アラインメントとクラスタリングを使って比較する.

EME1遺伝子は多数の種で相同体がある.Wolfram Knowledgebaseはヒト,チンパンジー,マウス,ラットのEME1配列データをWolfram|AlphaとWolfram言語の両方に提供する.

例えば,次はマウスのEME1遺伝子配列である.

選んだ生命体それぞれについてのEME1遺伝子実体を解釈する.

ここから,選んだそれぞれの遺伝子の遺伝子配列を抽出する.

配列アラインメントの最初を見ると,ヒトとチンパンジーのEME1遺伝子配列は,ラットとマウスの遺伝子配列よりも類似性がずっと高いことが分かる.ヒトとマウスのEME1配列はほとんど類似していない.

シーケンスクラスタリングを使うと,実際に配列全体がどの程度類似しているかが分かる.まずすべての配列の間の類似性を計算する.

ヒトとチンパンジーの染色体は強い類似性を示し,マウスとラットの染色体は中程度の類似性を示す.

系統樹を使うと,この類似性によって生成されたクラスタの相対的な密集度が分かる.

全体のアラインメントを見えると,ヒトのEME1配列はチンパンジーのEME1配列とほぼ完全に並んでいるのに対して,マウスとヒトのEME1アラインメントはほぼランダムといえる.

音楽でシーケンスが揃っているところと揃っていないところを聴くとき,強いアラインメントと弱いアラインメントの間の違いを聞き分けることができる.

完全なWolfram言語入力を表示する

EME1のチンパンジー/ヒトのアラインメントがどのように聞こえるかを聞いてみる.

ラットとマウスのEME1 アラインメントのサウンドと比べる.

関連する例

de en es fr ko pt-br zh