论文逐年发布
论文类
·
·
广度学院
一号
TL;DR:GATK编程框架使开发者和分析者能够快速易写高效强NGS工具,其中许多工具已经融入大规模排序项目中,如千基因组项目和癌症基因组图集
抽象性 :下一代脱氧核糖核酸排序项目,如千基因组项目,已经在改变我们对个体基因变异的理解NGS生成大规模数据集-千位基因组实验单包括近5兆位-使写法特征丰富、高效和强健分析工具难以实现甚至计算精密个人多位专业人士在广度和易解科学题方面受限, 复杂存取并操作这些机器生成的数据并使用MapReduce功能编程原理开发高效强分析工具GATK提供小而丰富的数据存取模式,覆盖分析工具的大部分需求分离数据管理公共基础架构的具体分析计算使我们能够优化GATK框架,实现正确性、稳定性和CPU和存储效率,并实现分布式共享存储并行化GATK能力突出显示,描述强力容度工具的实现和应用,如覆盖计算器和单核多态调用GATK编程框架使开发师和分析师快速易写高效强NGS工具,其中许多工具已经融入大规模排序项目中,如千组工程和癌症基因组图集
20557引用
·
·
[.]
TL;DR:千基因组项目综合描述人类常见基因变异,对多群化个体应用全基因变序,并使用低覆盖全代序列、深异组序列和稠密微数组组合重构26个群2 504人的基因组
抽象性 :千基因组项目综合描述人类常见基因变异,对多群化的多元化个人群应用全基因序列重构26组2 504人的基因组 使用低覆盖全基因排序 深片测序 稠密微数组演算八千八百多万变异物(8 470万单核多态化物(SNPssssssssssssssssssssssss)360万短插入/删除(indelssssssssssssss)和60万结构变异物sssse资源中包含>99%sNP变异,频率为>1%我们描述基因变异分布全局样本 并讨论对常见疾病研究的影响
12 661引用
·
·
[.]
TL;DR:VCF工具套件执行各种工具处理VCF文件,包括验证、合并、比较和提供通用 PerlAPI
抽象性 :摘要:变式调用格式是一种通用格式,存储dg数据,如SNPs、插入器、删除器和结构变异器,加丰富的注解VCF通常以压缩方式存储,可编索引快速从参考基因组各种位置检索变量格式为千基因组项目开发,并被UK10K、dbSNP和NHLBIExome项目等其他项目采纳VCF工具套件执行各种工具处理VCF文件,包括验证、合并、比较和提供通用 PerlAPI可用性:http://vcftools.sourceforge.net联系人
10 164引用
·
·
TL;DR:必威体育BW统一分析框架同时发现多样样本并变基因型,通过五序技术实现敏感和具体结果,并展示三种截然不同的剖面实验设计
抽象性 :最近测序技术的进步使得有可能综合编目人口样本中的遗传变异,为理解人类疾病、祖先和进化打下基础生成的原数据量庞大,需要多步计算才能将输出转换为高质量变异调用必威体育BW并发多样本并发和基因型变异统一分析框架,通过五大排序技术与三种截然不同的卡通实验设计实现敏感和具体结果进程包括(1)初始阅读映射2)局部整顿因代尔斯基质评分重校准必威体育BWsNP发现和基因组化查找所有潜在变异5机器学习从机器文物常见到下一代排序技术分离实分异基因组分析工具集即时应用全基因全捕集多样低通m4xmmm
10 056引用
·
·
广度学院
一号,
哈佛大学
2,
波士顿儿童医院
3,
华盛顿大学
4,
亚利桑那大学
5,
卡地夫大学
6,
谷歌
7,
Icahn西奈山医学院
8,
三星医疗中心
九九,
顶点药厂
10,
密歇根大学
11,
剑桥大学
12,
纽约州立大学前台医科大学
13,
卡洛林斯卡学院
14,
东芬兰大学
15,
Wellcome人类遗传学信托中心
16,
牛津大学
17,
西奈医疗中心
18号,
渥太华大学
19号,
宾夕法尼亚大学
20码,
北卡罗来纳大学
21号,
赫尔辛基大学
22号,
加利福尼亚大学圣地亚哥
23号,
密西西比大学医疗中心
24码
TL;DR:集合分析60 706名个人高品质Exome聚合库脱氧核糖核酸序列数据,直接证明广度突变复发
抽象性 :大规模参考数据集人类基因变异对DNA序列变换的医学和功能解释至关重要在此描述60 706位个人高质量Exome聚合式脱氧核糖核酸序列数据汇总分析人类遗传多样性目录平均包含八分之一基数,并直接证明广度突变复发并识别各种变异类型需严格选择的基因3 230基因接近完全耗尽预测蛋白调试变异,72%的基因目前没有确定人类病pheno类型必威体育BW最后,我们证明这些数据可用于高效过滤候选致病变异物,并用于发现蛋白质编码基因中的人体'knockout'变异
8758引用
引用
·
·
[.]
TL;DR:宝捷2组合全文索引的长处和硬件加速动态算法的灵活性和速度实现高速、敏感度和精度组合
抽象性 :测序速率提高后,读对齐者要求增加吞吐量全文分钟索引常用于快速和内存高效对齐,但方法并不适合查找长差对齐宝捷2组合全文索引的长处和硬件加速动态算法的灵活性和速度实现高速、敏感度和精度组合
37898引用
[.]
TL;DR:PfPMP1)与感染红细胞、树突状组胞以及胎盘的单个或多个受体作用,在黏附及免疫逃避中起关键的作�ly.
抽象性 :抗原变异可使得多种致病微生物易于逃避宿主免疫应答。表达在感染红细胞表面的恶性疟原虫红细胞表面蛋白1(PfPMP1)与感染红细胞、内皮细胞、树突状细胞以及胎盘的单个或多个受体作用,在黏附及免疫逃避中起关键的作用。每个单倍体基因组var基因家族编码约60种成员,通过启动转录不同的var基因变异体为抗原变异提供了分子基础。
18940引用
·
·
[.]
TL;DR:千基因组项目综合描述人类常见基因变异,对多群化个体应用全基因变序,并使用低覆盖全代序列、深异组序列和稠密微数组组合重构26个群2 504人的基因组
抽象性 :千基因组项目综合描述人类常见基因变异,对多群化的多元化个人群应用全基因序列重构26组2 504人的基因组 使用低覆盖全基因排序 深片测序 稠密微数组演算八千八百多万变异物(8 470万单核多态化物(SNPssssssssssssssssssssssss)360万短插入/删除(indelssssssssssssss)和60万结构变异物sssse资源中包含>99%sNP变异,频率为>1%我们描述基因变异分布全局样本 并讨论对常见疾病研究的影响
12 661引用
·
[.]
九州大学
一号
TL;DR:表示自然选择大插入/删除太弱,以致大量变异保留在人群中
抽象性 :两种基因变异估计关系即分离点数和核素变差平均数对比估计值调查发现当样本规模小时,这两个估计之间的关联性很大,而随着样本规模的增加缓慢下降。使用所获关系开发统计方法测试中性变异假设这种方法只需要脱氧核糖核酸多态化数据,即脱氧核糖核酸层群内部遗传变异并展示简单计算机仿真法,用于分发开发的新统计将统计法应用到Droophila melanogaster五大区脱氧核糖核酸序列中,发现大插入/删除(大于100bp)有害表示自然选择大插入/删除太弱,以致大量变异保留在人群中
11521引用
·
·
[.]
TL;DR:CCP4软件套件概述宏分子晶学
抽象性 :CCP4(协同计算项目4号)软件套件集合程序和相关数据库套件设计灵活化,允许用户用多种方法实现目标程序来源繁多,但通过标准文件格式、数据对象和图形界面提供的共同基础设施连接大型分子晶体阵列结构解决方案正日益自动化,CCP4套件包括数条自动化管道简单描述CCP4过去30年进化后,将概述当前套件细节描述见随附文章,此处显示单个程序对完整软件包的贡献
11 023引用