使用可逆终结剂化学精确的整个人类基因组测序

  我们的X染色体研究使我们能够开发一组综合方法,用于快速测序和分析整个人类基因组。我们对来自尼日利亚伊巴丹的男性约鲁巴人的基因组进行了测序(YRI,样本NA18507)。该样...

  我们的X染色体研究使我们能够开发一组综合方法,用于快速测序和分析整个人类基因组。我们对来自尼日利亚伊巴丹的男性约鲁巴人的基因组进行了测序(YRI ,样本NA18507) 。该样本最初是通过社区参与过程为HAPMAP Project17,18收集的,并获得了知情同意,也已在其他项目中进行了研究。20,21。因此 ,我们能够将结果与来自同一样本的公开数据进行比较 。我们构建了两个库:一个简短插入(200 bp) ,具有与先前的X染色体库相似的特性,一个来自长片段(2 kb)的属性(2 kb)提供了较长范围的读取对信息(有关尺寸分布,请参见补充图11) 。我们在8周(2007年12月至2008年1月)的六种GA1仪器中 ,平均每次生产3.3 GB(例如,请参见补充表1),在8周(2007年12月至2008年1月)的时间内生成了135 GB的序列(40亿配对35台读数;请参见补充表6)。大约消耗品成本(基于试剂的全额价格)为250,000美元。我们使用MAQ将97%的读数对齐 ,发现99.9%的人参考(NCBI Build 36.1)覆盖了一个或多个读数,平均深度为40.6倍 。使用Eland,我们将91%的读数与参考序列的93%的读数保持在足够的深度 ,以调用较强的共识(>三个Q30碱基)。映射的读取深度的分布接近随机,对于X染色体数据所见,略有过度分散。我们观察到在广泛的G+C含量上的综合表示 ,仅在极端的末端下降,但是与X染色体相比,分布模式不同(参见补充图12) 。   我们确定了400万个SNP ,其中74%匹配了DBSNP的先前条目(图3)。我们发现了SNP调用与基因分型结果的极好的一致性:基于序列的SNP调用涵盖了HM550的几乎所有552,710个基因座 ,测序与基因分型调用的一致性> 99.5%(表1和补充表7a)。少数分歧主要是低序列深度区域的杂合位置(GT> seq)的呼声,为我们提供了假阴性的率<0.35% from the ELAND analysis (see Table 1). The other disagreements (0.09% of all genotypes) included errors in genotyping plus apparent tri-allelic SNPs (Supplementary Table 7a). The main cause of genotype error (0.05% of all genotypes) is the existence of a second ‘hidden’ SNP close to the assayed locus that disrupts the genotyping assay, leading to loss of one allele and an erroneous homozygous genotype (Supplementary Figs 13 and 14).   To examine the accuracy of SNP calling in more detail, we compared our sequence-based SNP calls with 3.7 million genotypes (HM-All) generated for this sample during the HapMap project (Table 1 and Supplementary Table 7b)18 and found excellent concordance between the data sets. Disagreements included sequence-based under-calls of heterozygous positions in regions of low read depth. The slightly higher level of other disagreements (0.76%) seen in this analysis compared to that of the HM550 data (0.09%) is in line with the higher level of underlying genotype error rate of 0.7% for the HapMap data18. To refine this analysis further, we generated a set of 530,750 very high confidence reference genotypes comprising concordant calls in both the HM550 and HM-All genotype data sets. Comparing the results of the MAQ analysis to this high confidence set (see Table 1), we found 130 heterozygote under-calls GT>SEQ(即假阴性率为0.025%) 。还有130个杂合子过度呼叫seq> gt,但是其中大多数可能是基因型错误 ,因为82个附近的“隐藏” SNP和3个附近的Indel。另外41个是三平台基因座,通过测序最多可以留下4个潜在的错误调用(即,假阳性速率为每529,589个位置4)。最后 ,我们从序列数据中选择了新的SNP调用子集,并通过基因分型进行了测试 。我们发现序列和基因型调用之间的一致性为96.1%(补充表8)。但是,这47个分歧包括10个正确的测序调用(由于隐藏的SNP而导致的基因分型呼叫)和7种测序下接来的呼叫。因此 ,在此基础上,一百万个新型SNP的假阳性发现率为2.5%(1,206个中的30个) 。对于本分析中检测到的四百万个SNP的整个数据集,假阳性和负率均平均<1%.   This genome from a Yoruba individual contains significantly more polymorphism than a genome of European descent. The autosomal heterozygosity (π) of NA18507 is 9.94 × 10-4 (1 SNP per 1,006 bp), higher than previous values for Caucasians (7.6 × 10-4, ref. 12). Heterozygosity in the pseudoautosomal region 1 (PAR1) is substantially higher (1.92 × 10-3) than the autosomal value. PAR1 (2.7 Mb) at the tip of the short arm of chromosomes X and Y undergoes obligatory recombination in male meiosis, which is equivalent to 20× the autosome average. This illustrates a clear correlation between recombination and nucleotide diversity. By contrast, the 0.33-Mb PAR2 region has a much lower recombination rate than PAR1; we observed that heterozygosity in PAR2 is identical to that of the autosomes in NA18507. Heterozygosity in coding regions is lower (0.54 × 10-3) than the total autosome average, consistent with the model that some coding changes are deleterious and are lost as the result of natural selection22. Nevertheless, the 26,140 coding SNPs (Supplementary Fig. 15) include 5,361 non-conservative amino acid substitutions plus 153 premature termination codons (Supplementary Table 9), many of which are expected to affect protein function.   We performed a genome-wide survey of structural variation in this individual and found excellent correlation with variants that had been reported in previous studies, as well as detecting many new variants. We found 0.4 million short indels (1–16 bp; Supplementary Fig. 16), most of which are length polymorphisms in homopolymeric tracts of A or T. Half of these events are corroborated by entries in dbSNP, and 95 of 100 examined were present in amplicons sequenced from this individual in ENCODE regions, confirming the high specificity of this method of short indel detection. For larger structural variants (detected by anomalously spaced paired ends) we found that some were detected by both long and short insert data sets (Supplementary Fig. 17a), but most were unique to one or other data set. We observed two reasons for this: first, small events (<400 bp) are within the normal size variance of the long insert data; second, nearby repetitive structures can prevent unique alignment of read pairs (see Supplementary Fig. 17b, c). In some cases, the high resolution of the short insert data permits detection of additional complexity in a structural rearrangement that is not revealed by the long insert data. For example, where the long insert data indicate a 1.3-kb deletion in NA18507 relative to the reference, the short insert data reveal an inversion accompanied by deletions at both breakpoints (Fig. 4). We carried out de novo assembly of reads in this region and constructed a single contig that defines the exact structure of the rearrangement (data not shown).   We discovered 5,704 structural variants ranging from 50 bp to >与参考基因组相比 ,Na18507基因组缺乏序列的35 kb 。我们观察到这种类型的事件数量稳步减少,大小增加,除了两个峰(补充图18)。在300–350 bp处的大峰代表的大多数事件都包含一系列Aluy家族。这与参考基因组中存在但NA18507基因组中缺少的短散布核元件(SIN)的插入一致 。同样 ,在6-7 kb处的第二个较小的峰是在许多情况下插入长插入式核元件(线)L1 HOMO SAPIEN(L1HS)的结果。我们发现结果与参考数据之间的良好对应关系。23 ,根据异常的fosmid配对端间距,该人在该个体中报告了148个<100 kb的缺失 。我们发现了其中111个事件的支持证据。我们在60-160 bp的范围内检测到另外2​​,345个插入,这是NA18507基因组中存在的序列 ,并且参考基因组中没有(补充图19)。一个示例显示在补充图20中 。事件的任一侧读取的“单身人士 ”读取,其伴侣与参考的伙伴不符,构成了从头组装的一部分 ,这些组件的一部分精确地定义了新的序列和断点(补充图21)。
http://http://www.0517kq.com/news/show-8128.html/sitemaps.xml http://http://www.o-press.com/news/show-272.html/sitemaps.xml http://http://www.o-press.com/news/show-47.html/sitemaps.xml http://http://www.o-press.com/news/show-117.html/sitemaps.xml http://http://www.o-press.com/news/show-375.html/sitemaps.xml http://http://www.0517kq.com/news/show-8381.html/sitemaps.xml http://http://www.o-press.com/news/show-274.html/sitemaps.xml http://http://www.0517kq.com/news/show-8270.html/sitemaps.xml http://http://www.o-press.com/news/show-330.html/sitemaps.xml http://http://www.0517kq.com/news/show-8316.html/sitemaps.xml

本文来自作者[qingdaomobile]投稿,不代表青鸟号立场,如若转载,请注明出处:https://qingdaomobile.com/life/202506-27290.html

(6)

文章推荐

  • 郑州调整主城区疫情防控措施(郑州疫情控制措施)

    离开郑州最新规定1、为了保障市民群众的健康安全,郑州市政府发布了最新的出行规定,倡导非必要不离郑。确需离开郑州市的市民,必须持有24小时内有效的核酸检测阴性证明,并确保健康码显示为绿色。对于市域外的人员,如果计划进入郑州市,必须提前3天通过官方渠道进行行程信息的报备。2、提前报备郑州市域外来(返

    2025年02月26日
    78
  • 【新疆新增病例22例,新疆新增病例112例】

    我国31省区市新增22例确诊,你觉得我们该如何做好疫情防控?那么关于我国31个省区市新增22例确诊,我们该如何做好疫情防控?其中的方式有以下几个。我们居民的话,肯定日常出行要进行佩戴口罩。首先第1点就是对于我们日常的居民来说,日常出行还是要必须戴口罩,戴口罩则是一个非常好的措施,保护自己也是保护他

    2025年03月05日
    69
  • 【蔚来es6价格及图片,蔚来es6价格及图片参数】

    蔚来ES62020款落地价多少钱?1、蔚来ES62020款430KM性能版的全款落地价为435388元。具体费用构成如下:官方指导价:398000元。市场优惠价:386480元(广州市市场行情,比指导价节省11520元)。必要费用:上牌费、交强险等共计35802元。商业保险:13106元。2、在

    2025年03月05日
    63
  • 新款卡罗拉大灯怎么关闭/卡罗拉大灯怎么关掉

    卡罗拉精英版自动大灯怎么关闭踩下丰田卡罗拉的刹车踏板。按下丰田卡罗拉的一键启动键。丰田卡罗拉的仪表板亮起,全车电源接通。拧动方向盘左侧的大灯开关至AUTO挡位,开启自动大灯模式。此时丰田卡罗拉的自动大灯,会根据日光传感器来决定是否达到设定的光线黑暗程度,来打开前大灯。卡罗拉自动大灯可以通过将灯光开

    2025年03月22日
    49
  • 精装修复式楼房出租房(精装修房子出租)

    70平米复式楼装修大约要多少钱复式楼的装修费用因多种因素而异,包括装修风格、材料选择、施工难度等。根据以往的数据,复式楼装修价格大致可以分为以下几个档次:【品质整装选沪佳装饰】经济型:如果选择较为简单的装修方案,这种类型的装修通常适用于那些对设计感要求不高,但希望有一个干净整洁居住环境的家庭。复式

    2025年04月16日
    46
  • 【惠州毛坯房有玻璃吗,毛坯房的玻璃要全换嘛】

    惠州中洲中央公园项目详情1、惠州中洲中央公园项目详情如下:项目定位:该项目是一个定位为住宅的高层建筑项目。地理位置:位于惠城区的金山湖片区,具体地址是金山大道与三环路的交汇处。房产状态:目前处于待售状态,房产证年限为70年。开发时间:开发始于2012年8月,开盘时间与交房时间均为同年。2、惠州中洲

    2025年04月30日
    41
  • 精灵盛典装备进阶/精灵盛典装备榜

    精灵盛典官网下载地址:http://类型:安卓游戏-角色扮演版本:v2大小:3194M语言:中文平台:安卓APK推荐星级(评分):★★★游戏标签:精灵盛典奇迹手游搜狗手游精灵盛典三星版是一款可以三星智能手机设备上登录的传奇手游。下载地址:http://类型:安卓游

    2025年05月06日
    37
  • 使用召唤14攻略(召唤使命14)

    使命召唤14里被刺刀杀怎么过的在《使命召唤14》中,要想通过被刺刀杀的挑战,只需不断按F键即可。如果这一方法不奏效,请首先检查是否更改了绑定设置。如果有更改,请恢复默认设置,并在完成剧情后自行修改。默认按键为F。在出现按键提示时,不要急于连续按动,而应逐一按压。使命召唤14里被刺刀杀只需要一直按

    2025年05月17日
    52
  • 4日浙江疫情速报/浙江疫情消息今天

    三亚疫情实时动态怎么查1、想要了解三亚的疫情实时动态,首先可以通过微信搜索“三亚发布”公众号,并点击进入。找到并关注这个公众号,可以及时获得最新的疫情信息。在公众号页面下方,可以看到一个菜单栏,点击“疫情速报”-“疫情实时动态”选项,就可以查看三亚的疫情最新情况。2、可以在搜狐网上查询。根据搜狐网

    2025年05月25日
    36
  • 【本科生国奖奖学金多少钱,本科国奖多少人民币】

    国家奖学金的标准本科国家奖学金的金额设定较为丰厚,对于本科生而言,每年大约可以拿到8000元人民币左右,而硕士生和博士生则能够获得的奖学金金额在2万到3万元人民币之间。这样的资金支持对学生来说无疑是一笔重要的收入,不仅仅意味着物质上的帮助,也象征着一种荣誉。曲阜师范大学奖学金标准如下:国家奖学金

    2025年05月28日
    35

发表回复

本站作者后才能评论

评论列表(4条)

  • qingdaomobile
    qingdaomobile 2025年06月17日

    我是青鸟号的签约作者“qingdaomobile”!

  • qingdaomobile
    qingdaomobile 2025年06月17日

    希望本篇文章《使用可逆终结剂化学精确的整个人类基因组测序》能对你有所帮助!

  • qingdaomobile
    qingdaomobile 2025年06月17日

    本站[青鸟号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • qingdaomobile
    qingdaomobile 2025年06月17日

    本文概览:  我们的X染色体研究使我们能够开发一组综合方法,用于快速测序和分析整个人类基因组。我们对来自尼日利亚伊巴丹的男性约鲁巴人的基因组进行了测序(YRI,样本NA18507)。该样...

    联系我们

    邮件:青鸟号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们