泛基因组中核心序列和可变序列
001、基本分类
01、为什么核心基因不是100%?
核心基因从概念上讲是所有个体中都存在的基因,但是实际的测序过程中难以保证所有个体的每个DNA片段都有很好的测序质量,
为了避免这种少部分个体部分片段未测出,遗漏核心基因的统计和分类,使用一个比例范围更可取。
02、为什么要有cloud 这个分类?
cloud 则可能是个别个体基因组意外获得的外源基因,或者是来自于该个体基因组异常装配或者是外源污染。(这类基因不可靠,shell才能代表可靠的可变基因?)
03、核心基因和可变基因的功能?
核心基因通常是:与生物基本的生物功能相关,主要是持家基因。
可变基因通常是:与生物特定的环境适应和生物学特性相关。
04、可变基因(序列)的来源:
原核生物:序列重复、近缘物种渗入、基因从头诞生、水平基因转移等。
真核生物: 基因或者序列的丢失、渗入、水平基因转移。
reference:
[1]边培培,张禹,姜雨.泛基因组:高质量参考基因组的新标准[J].遗传, 2021, 43(11):15.DOI:10.16288/j.yczz.21-214.