Conversion between chr:pos and rsID
rsID, SNP, (in Chinese)
rsID与染色体位置信息的匹配或转换是生物信息学研究中必不可少的,但却又是十分繁琐的一项步骤,很多同学都在纠结这个问题,本文将总结常用的转换方法,以供参考:
转换前需要考虑的问题:
变异的标准化 :Variant Normalization 变异的标准化
参考基因组的版本 :人类参考基因组 Human reference genome hg19/hg38/GRCh37/GRCh38/b37/hs375d
Web版本:适合个别SNP的转换
dbsnp: 可以搜rsID(比如:rs671)获得chr:pos,也可以搜chr:pos(比如:12:112241766)获得rsID;
SNPnexus: 首先输入用户信息,学术用途是免费的,使用自己的edu邮箱即可;之后选择assembly的版本;选择后可以通过多种方式提交自己要查询的SNP;
- 输入文件对rsID进行注释或位点转换为rsID
- 对rsID进行注释:输入文件 snp.txt , 格式如< “dbsnp” rs# > (其他格式的具体描述详见:https://www.snp-nexus.org/v4/guide/),因为我们只查询位置信息,就不勾选其他数据库,只使用默认的Ensembl;点击submit query后,稍作等待,结果就会显示出来,可以导出为VCF或txt文本格式。
- 位点转换为rsID:格式为:< Type Name Position Allele1 Allele2 Strand > # Genomic position data for novel SNPs
- 输入文件对rsID进行注释或位点转换为rsID
VEP网页版: 点击launch VEP
- 可以在input data处直接粘贴要查询的rsID,或是上传文件(点击输入框下方的example,可以查看可用的输入格式);选择合适数据库,提交后可以看到查询状态;完成后点击View results
- 位点转换rsID时,使用如下Ensembl默认的输入格式即可:
代码工具:除BioMart,其它工具适合大量SNP转换
- BioMart
- VEP command lines
- ANNOVAR