scaffold 在基因中是什么? 希望能清楚点解释

关注者
9
被浏览
76,671

1 个回答

scaffold其实是基因组组装时的概念。涉及到的相关概念如下:

  • reads:就是我们测序产生的短读序列,通常一代和三代的reads读长在几千到几万bp之间,二代的相对较短,平均是几十到几百bp。
  • contig:中文叫做重叠群,就是不同reads之间的overlap交叠区,拼接成的序列就是contig
  • scaffold: 是比contig还要长的序列,获得contig之后还需要构建paired-end或者mate-pair库,从而获得一定片段的两端序列,这些序列可以确定contig的顺序关系和位置关系,最后contig按照一定顺序和方向组成scaffold,其中形成scaffold过程中还需要填补contig之间的空缺。