使用ADMIXTURE估计个体的祖先成分

生物信息 0条评论 2020-7-26 53 views
ADMIXTURE 是常用的群体遗传学分析工具,可以估计个体的祖先成分。与 STRUCTURE 相比,它的速度更快。下面介绍一下它的使用。STRUCTURE 可以输入 Plink 或者 EIGENSTRAT 格式的数据,这里以 plink 格式的文件为例。筛选SNPSNP 数量太多,计算会非常慢。可

使用Hapbin基于EHH、iHS、XP-EHH方法检测基因组中的选择信号

生物信息 0条评论 2020-7-19 97 views
EHH(Extended Haplotype Homozygosity)、iHS(Integrated Haplotype Score) 和 XP-EHH(Cross Population Extended Haplotype Homozogysity)是常用的基于 haplotype 分析基因组受

预算有限怎么办?来看看这篇千元级别的生信服务器搭建指南

技术笔记 0条评论 2020-7-11 108 views
做生信分析的人越来越多,但并不是每个人都有足够的计算资源。云计算是个好东西,但它的成本优势更多体现在大数据处理上,每天需要处理几十几百 TB 甚至 PB 级别的数据时,云计算才会比自建维护机房要划算得多。如果处理的数据不大,自己组装个服务器要划算得多。之前在《年轻人的第一台服务器:最低不到五千,捡垃

FINEMAP:使用GWAS摘要数据进行无功能注释数据的精细定位(Fine-mapping)

生物信息 4条评论 2020-7-9 144 views
介绍全基因组关联分析(GWAS)是非常流行的定位表型或疾病遗传位点方法。不过很多情况下,GWAS 发现的最显著的 SNP(top SNP 或者 index SNP)并不是真正造成影响的causal SNP(因果SNP),而是因为跟 causal SNP 之间存在的 LD 而变得显著。因而,后续还需要

CAUSALdb:涵盖数千个GWAS研究和Fine-mapping结果的可视化数据库

生物信息 0条评论 2020-7-7 105 views
现在 GWAS 研究越来越多。要查询以往的 GWAS 研究结果,可以使用 GWAS Catalog。GWAS Catalog 包含的信息非常多,不过有时可能满足不了需要。这里,推荐一个叫 CAUSALdb 的数据库。CAUSALdb(http://mulinlab.tmu.edu.cn/causal

嫌Python太慢但又不想学C/C++?来了解下JIT技术

技术笔记 0条评论 2020-7-5 89 views
什么是 JITPython 是门多才多艺的语言,既可以写后端,也可以做数据分析,既可以智能化运维,也可以搞渗透,既可以写爬虫,又可以做机器学习深度学习。然而,Python 的缺点也很明显,它的速度有点慢。我们从官方网站下载到的版本,默认是采用了 CPython 解释器,它也是用得最广的解释器。以 C

GWAS_Flow:使用GPU加速大规模数据的全基因组关联分析

生物信息 0条评论 2020-6-20 127 views
21世纪是生物的世纪,生物数据的增长速度越来越快。很多分析工具在开发时并没有考虑到大规模数据的应用场景。在数据量不大的时候,这些工具的计算时间并不会太长,可以让人接受。但在数据规模庞大时,可能就 hold 不住,等待时间让人发指。加速大规模生物数据的分析速度有很多方法,其中利用 GPU 加速基因组研

一键查看后端程序语言,分析网站技术栈

分享发现 0条评论 2020-6-10 177 views
当看到一个网站,想要了解它用了什么技术开发,可以通过开发者工具去看,但这样的效率很低。下面推荐两个方便的工具:W3techhttps://w3techs.comBuidWithhttps://builtwith.com/这两个网站可以方便了解网站的技术栈,输入网址一点就能得到结果,发现网站是采用什么

日本人群的大规模GWAS发现多种疾病的新型易感基因座

文献速读 0条评论 2020-6-9 181 views
文献信息标题: Large-scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases中文标题: 日本人群的大规

使用Python版XP-CLR检测基因组中的选择信号

生物信息 0条评论 2020-6-7 200 views
上一篇文章 《使用XP-CLR检测基因组中的选择信号》 介绍了 XP-CLR。XP-CLR 是一种是基于选择扫荡(selective sweeep)的似然方法。选择扫荡可以增加群体之间的遗传分化,导致等位基因频率偏离中性条件下的预期值。XP-CLR 利用了两个群体之间的多基因座等位基因频率差异(mu