序列比对和聚类
该范例使用序列匹配和聚类比较不同生物之间的进化保存的(同源的)基因序列。
EME1 基因具有许多物种的同源物。Wolfram Knowledgebase 为 Wolfram|Alpha 和 Wolfram 语言提供人类、黑猩猩、小鼠和大鼠的 EME1 序列数据。
例如,以下是小鼠的 EME1 基因序列。
现在解释每个选定生物的 EME1 基因实体。
由此检索每个所选基因的基因序列。
查看序列比对的起始部分,人类和黑猩猩的 EME1 基因序列似乎比大鼠和小鼠更相似。人和小鼠 EME1 序列看起来更不相似。
通过序列聚类,您将能够看到整个序列实际上有多相似。首先,计算所有序列之间的所有相似性比率。
可以看出人类和黑猩猩染色体之间的强烈相似性以及大鼠和小鼠染色体之间的中等相似性。
通过树状图,可以看出由此相似性产生的聚类的相对紧密度。
纵观整体对比,可以看到人类 EME1 序列与黑猩猩 EME1 序列几乎完全一致,而小鼠与人类之间的 EME1 对比接近随机。
通过音乐,可以听到强对齐与弱对齐之间的区别,清楚地展现了序列的对齐与不同。
显示完整的 Wolfram 语言输入
播放音频,了解对于 EME1 声音的黑猩猩/人类是如何比对的。
将其与大鼠和小鼠之间 EME1 比对的声音进行比较。