通过寄居某人体内的微生物DNA可识别出此人的身份。
研究人员发现,通过寄居人体的微生物集成DNA,能够特异性地识别出个人的身份,这就产生了个人隐私问题。
这项发现刊登于5月11日的《美国国家科学院期刊》(Proceedings of the National Academy of Sciences)上。文章指出,在一项匿名试验研究中,通过寄生于人体的微生物(即其微生物组),很有可能识别出个人身份,从而泄露某人的健康状况、饮食以及种族等细节信息。无独有偶,4月29日发表于《基因组研究》(Genome Research)的一项研究也声称,在由NIH维护的公开性微生物组DNA数据中,也含有具备潜在辨识性的人类DNA。
当然,两篇论文均未依据微生物组的信息披露出受试者的姓名——估计目前这么做也会很困难——但他们有提出,这种具有引导性的微生物组研究应该得到备案。
来自马萨诸塞州波斯顿哈佛陈曾熙公共卫生学院(Harvard T. H. Chan School of Public Health)的计算生物学家Curtis Huttenhower牵头了这项最新出炉的研究。他表示,目前,微生物组的数据管理还带着点儿西部荒原的意思。但随着整个领域的发展,人们需要切实地意识到,他们的微生物组具有高度的特异性。
其实这事并不新鲜,人类基因组研究早就因为隐私问题受到了数年的关注。2013年,有科学家宣布,他们能在一项国际性的千人基因组项目(1,000 Genomes project)中,确定出5位匿名受试者的姓名,这是通过参照其DNA以及宗族谱系数据库(包含年龄、居住地和姓氏)获知的。
近年来,微生物组对人类的健康与行为的影响已逐渐成为研究的热点。而人类微生物组研究所得的数据往往都以公开贮存库作为最后的归宿,但随着时间的推移,这些微生物组是否能够永久性地识别出所属特定的人,目前尚未清楚。
Huttenhower的团队利用源自NIH人类微生物组计划(HMP)的公开数据,搜索采自人体各个部位的样本(包括肠道、口腔、皮肤和阴道),以将这些同时具有特定识别性和时间稳定性的微生物遗传标记组合起来(尽管HMP无法识别出个人姓名,但分辨出样本的捐献先后顺序(数周前或数月前)还是可能的。)。
值得一提的是,粪便样本能提供最佳的微生物识别标志:在86%的情况下,一个人的首次样本能与其二次样本相关联。而皮肤样本能获得精确匹配的几率只有大约四分之一。研究者还指出,在识别个人方面,基于个体微生物菌株的DNA标记能起到最佳作用,它比那些基于微生物种类的识别方法要好得多。
对于团队的成果,Huttenhower总结道,这应该就是“利用微生物组数据,通过单一试验,即可非凡性地挑战所有问题”。他认为,可能发生的隐私风险漏洞恐怕在于研究方案上,比如某人参加了两项不同的微生物组研究,若每一组都含有相异的补充信息(诸如年龄及健康状况),那就可能出现泄露。
不过,微生物组本身就可能产生隐私风险,因为它们不可避免地与人类DNA纠缠不休。尽管NIH早已竭力思考如何去除人类DNA的方法,以防其进入HMP数据库,但结果不容乐观。据加利福尼亚州劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的一位计算生物学家、团队带头人Jonathan Allen发现,样本的污染问题仍普遍存在。该团队了解到,短串联重复序列(short tandem repeats)一般在不同的人中会发生变化,因此在法医学中用于DNA匹配。但这种序列若是出现在微生物组样本中,是否能构成一个精确的DNA标记呢?Allen表示目前还无法确定,但它在公众适用性DNA数据库的出现率的提高增加了这种可能性。《基因组研究》表示,只要NIH能从其数据库中除去已知的人类基因序列,那么他们就同意刊登Allen及其团队的论文。
纽约基因组中心(New York Genome Center)的计算遗传学家Yaniv Erlich所带领的团队正是在千人基因组研究中识别出了受试者。他表示,虽然仅基于微生物组来识别出某人的几率很低,但研究者们应当采取适当的措施来保护个人隐私。而德克萨斯州休斯顿贝勒医学院(Baylor College of Medicine)的生物伦理学家Amy McGuire表示,由于参加HMP的受试者都已被告知风险存在,所以他认为,不应该会出现针对此事的非理性恐慌。
但是,反应过度却可能会减缓人们对微生物组的了解步伐。位于马里兰州贝塞斯达的NIH附属国立人类基因组研究所(National Human Genome Research Institute)的政策负责人Laura Rodriguez表示,只要保护措施到位,比如尽可能地将人类DNA从HMP数据库中去除,那么“我们将希望保持其大门开放,毕竟它能为科学增添价值。”