Conversion between chr:pos and rsID

rsID, SNP, (in Chinese)

Published

November 6, 2023

Source: GWASLab

rsID与染色体位置信息的匹配或转换是生物信息学研究中必不可少的,但却又是十分繁琐的一项步骤,很多同学都在纠结这个问题,本文将总结常用的转换方法,以供参考:

转换前需要考虑的问题:


Web版本:适合个别SNP的转换

  • dbsnp: 可以搜rsID(比如:rs671)获得chr:pos,也可以搜chr:pos(比如:12:112241766)获得rsID;

  • SNPnexus: 首先输入用户信息,学术用途是免费的,使用自己的edu邮箱即可;之后选择assembly的版本;选择后可以通过多种方式提交自己要查询的SNP;

    • 输入文件对rsID进行注释或位点转换为rsID
      • 对rsID进行注释:输入文件 snp.txt , 格式如< “dbsnp” rs# > (其他格式的具体描述详见:https://www.snp-nexus.org/v4/guide/),因为我们只查询位置信息,就不勾选其他数据库,只使用默认的Ensembl;点击submit query后,稍作等待,结果就会显示出来,可以导出为VCF或txt文本格式。
      • 位点转换为rsID:格式为:< Type Name Position Allele1 Allele2 Strand > # Genomic position data for novel SNPs
  • VEP网页版: 点击launch VEP

    • 可以在input data处直接粘贴要查询的rsID,或是上传文件(点击输入框下方的example,可以查看可用的输入格式);选择合适数据库,提交后可以看到查询状态;完成后点击View results
    • 位点转换rsID时,使用如下Ensembl默认的输入格式即可:

代码工具:除BioMart,其它工具适合大量SNP转换

  • BioMart
  • VEP command lines
  • ANNOVAR