论文逐年发布
论文类
·
·
TL;DR:这项工作介绍开源C/C++WGAS工具集PLINK并描述五大功能领域:数据管理、汇总统计、人口分层化、关联分析以及逐世身份估计,重点是估计和使用基于人口的全基因研究中的特征逐州和特征/世系信息
抽象性 :betway亚洲整体关联研究给研究人员带来了新的计算和分析挑战许多现有基因分析工具设计不方便处理大数据集,不一定利用全基因数据带来的新机会为了解决这些问题,我们开发开源C/C++WGAS工具集PLINKPLINK大数据集由数以十万计的千人基因类型组成,可快速操作并全数分析并提供工具提高基本分析步骤计算效率, PLINK还支持利用全基因覆盖的全基因数据新法PLINK并描述五大功能领域:数据管理、汇总统计、人口分层化、关联分析以及逐级识别估计具体地说,我们在全基因基于人口的研究中注重逐州和逐族特征信息估计使用信息可用以检测并纠正人口分层并识别相距关系极远个人通过下降共享的扩展染色体段分片共享模式分析有可能绘制疾病局部图,该局部图包含基于人口的关联分析中多稀有变异
26280引用
·
·
哈佛大学
一号,
广度学院
2,
波士顿儿童医院
3,
华盛顿大学
4,
亚利桑那大学
5,
卡地夫大学
6,
谷歌
7,
Icahn西奈山医学院
8,
三星医疗中心
九九,
顶点药厂
10,
密歇根大学
11,
剑桥大学
12,
纽约州立大学前台医科大学
13,
卡洛林斯卡学院
14,
东芬兰大学
15,
Wellcome人类遗传学信托中心
16,
牛津大学
17,
西奈医疗中心
18号,
渥太华大学
19号,
宾夕法尼亚大学
20码,
北卡罗来纳大学
21号,
赫尔辛基大学
22号,
加利福尼亚大学圣地亚哥
23号,
密西西比大学医疗中心
24码
TL;DR:集合分析60 706名个人高品质Exome聚合库脱氧核糖核酸序列数据,直接证明广度突变复发
抽象性 :大规模参考数据集人类基因变异对DNA序列变换的医学和功能解释至关重要在此描述60 706位个人高质量Exome聚合式脱氧核糖核酸序列数据汇总分析人类遗传多样性目录平均包含八分之一基数,并直接证明广度突变复发并识别各种变异类型需严格选择的基因3 230基因接近完全耗尽预测蛋白调试变异,72%的基因目前没有确定人类病pheno类型必威体育BW最后,我们证明这些数据可用于高效过滤候选致病变异物,并用于发现蛋白质编码基因中的人体'knockout'变异
8758引用
·
·
[.]
TL;DR:二代PLINK版本将显著提高性能和兼容性,无法访问高端计算资源用户首次能对使用中特征丰富和大型遗传数据集进行数项基本分析
抽象性 :betway亚洲背景:PLINK1是广用开源C/C++工具集,用于全基因组关联研究(GWAS)和人口遗传学研究持续累积估计和全元排序研究数据暴露出快速可缩放实现关键函数的强烈需求,如后勤回归、链性偏差估计和基因组距离评价此外,GWAS和人口遗传数据现在常包含基因类型概率、相位资料和/或多片变异,均非PLINK1初级数据格式表示发现:为解决这些问题,我们正在开发PLINK第二代代码库代码库第一大发布程序PLINK1.9介绍广泛使用比特级并行性,ONN-time/cent-spaceHardyWeinberg均衡和Fisher精度测试以及其他多项算法改进组合中,这些变化加速多数运算除以1至4级量级,并允许程序处理大到无法适应内存的数据集数据格式扩展后增加低端支持基因类型概率、相位、多allic变异交替数列,这是基础 我们计划第二次发布(PLINK2.0)二代PLINK将显著提高性能和兼容性无法访问高端计算资源用户首次对使用中地物丰富和大型遗传数据集进行数项基本分析
7 038引用
·
·
[.]
TL;DR:DRD2协会和数个基因都与浮质神经传输聚焦分子相关联,这些分子已知并潜在治疗性与精神分裂症相关联,并符合主病理假设
抽象性 :分裂症是一种高度遗传性失序遗传风险由多异灵产生,包括全基因组关联研究可能检测到的微效常见异灵多级精神分裂症全基因组研究 多达36989例和113 075控件128个独立协会分布于108个保守定义地段,切合全基因组意义,其中83个协会以前未曾报告过协会丰富脑中表达的基因,为发现提供生物可信性多项发现有可能提供全新对生态学的洞察力,但DRD2和数个基因关联与浮质神经传输聚焦分子相关联,这些分子已知并潜在对精神分裂症具有治疗意义,并符合主要病理假设独立于脑部表达的基因外,关联丰富组织表达的基因中在豁免中起重要作用,支持免疫系统与精神分裂之间的假设联系
6809引用
·
·
[.]
TL;DR:人类基因组常见变异公共数据库:100万多单核化多态学,从四大类中269个脱氧核糖核酸样本中获取精全基因型
抽象性 :继承遗传变异在人类疾病中具有关键作用,但在很大程度上尚非特征作用公有数据库人类基因组常见变异性报告:100万多单核多态学(SNPs),从四大类中269个脱氧核糖核酸样本中获取精全基因型数据,包括10 500千兆赫区域基本提取所有常见脱氧核糖核酸变异信息这些数据记录重编热点的泛泛性,即块式链式结构不均匀和低随机式多样性,导致SNP与多邻有实质关联显示HapMap资源如何指导基因关联研究的设计和分析,说明结构变异和重组,并识别人类进化期间自然选择的移位
5 479引用
引用
·
·
TL;DR:这项工作介绍开源C/C++WGAS工具集PLINK并描述五大功能领域:数据管理、汇总统计、人口分层化、关联分析以及逐世身份估计,重点是估计和使用基于人口的全基因研究中的特征逐州和特征/世系信息
抽象性 :betway亚洲整体关联研究给研究人员带来了新的计算和分析挑战许多现有基因分析工具设计不方便处理大数据集,不一定利用全基因数据带来的新机会为了解决这些问题,我们开发开源C/C++WGAS工具集PLINKPLINK大数据集由数以十万计的千人基因类型组成,可快速操作并全数分析并提供工具提高基本分析步骤计算效率, PLINK还支持利用全基因覆盖的全基因数据新法PLINK并描述五大功能领域:数据管理、汇总统计、人口分层化、关联分析以及逐级识别估计具体地说,我们在全基因基于人口的研究中注重逐州和逐族特征信息估计使用信息可用以检测并纠正人口分层并识别相距关系极远个人通过下降共享的扩展染色体段分片共享模式分析有可能绘制疾病局部图,该局部图包含基于人口的关联分析中多稀有变异
26280引用
·
·
广度学院
一号
TL;DR:GATK编程框架使开发者和分析者能够快速易写高效强NGS工具,其中许多工具已经融入大规模排序项目中,如千基因组项目和癌症基因组图集
抽象性 :下一代脱氧核糖核酸排序项目,如千基因组项目,已经在改变我们对个体基因变异的理解NGS生成大规模数据集-千位基因组实验单包括近5兆位-使写法特征丰富、高效和强健分析工具难以实现甚至计算精密个人多位专业人士在广度和易解科学题方面受限, 复杂存取并操作这些机器生成的数据并使用MapReduce功能编程原理开发高效强分析工具GATK提供小而丰富的数据存取模式,覆盖分析工具的大部分需求分离数据管理公共基础架构的具体分析计算使我们能够优化GATK框架,实现正确性、稳定性和CPU和存储效率,并实现分布式共享存储并行化GATK能力突出显示,描述强力容度工具的实现和应用,如覆盖计算器和单核多态调用GATK编程框架使开发师和分析师快速易写高效强NGS工具,其中许多工具已经融入大规模排序项目中,如千组工程和癌症基因组图集
20557引用
[.]
TL;DR:PfPMP1)与感染红细胞、树突状组胞以及胎盘的单个或多个受体作用,在黏附及免疫逃避中起关键的作�ly.
抽象性 :抗原变异可使得多种致病微生物易于逃避宿主免疫应答。表达在感染红细胞表面的恶性疟原虫红细胞表面蛋白1(PfPMP1)与感染红细胞、内皮细胞、树突状细胞以及胎盘的单个或多个受体作用,在黏附及免疫逃避中起关键的作用。每个单倍体基因组var基因家族编码约60种成员,通过启动转录不同的var基因变异体为抗原变异提供了分子基础。
18940引用
·
·
瑞士生物信息学学院
一号
TL;DR:新版Arlequin程序的主要创新包括提高XML格式输出量,有可能直接将图形显示计算结果嵌入输出文件,以及实施新方法检测从基因组扫描中选择的loci
抽象性 :Arlequin程序新版可用三种形式:Windows图形版(Winarl35),Arlequin主机版(arlecore)和计算汇总统计特殊主机版(arsumstat)。Linux和Windows下运行命令行版本新版主要创新内容包括 XML格式增强输出量,将图形显示计算结果直接嵌入输出文件的可能性,以及实施新方法检测从基因组扫描中选择的loci命令行版本设计处理大串文件,arsumstat可用ApriewBayesian计算框架模拟数据集生成汇总统计
13 581引用
·
·
[.]
TL;DR:千基因组项目综合描述人类常见基因变异,对多群化个体应用全基因变序,并使用低覆盖全代序列、深异组序列和稠密微数组组合重构26个群2 504人的基因组
抽象性 :千基因组项目综合描述人类常见基因变异,对多群化的多元化个人群应用全基因序列重构26组2 504人的基因组 使用低覆盖全基因排序 深片测序 稠密微数组演算八千八百多万变异物(8 470万单核多态化物(SNPssssssssssssssssssssssss)360万短插入/删除(indelssssssssssssss)和60万结构变异物sssse资源中包含>99%sNP变异,频率为>1%我们描述基因变异分布全局样本 并讨论对常见疾病研究的影响
12 661引用