携手健康网携手健康网

开发用于检测和调整遗传汇总数据中的种群结构的新方法

在今天发表在《美国人类遗传学杂志》上的一项新研究中,研究人员宣布开发出一种新方法来提高大型遗传数据库的实用性和公平性。该研究由科罗拉多大学丹佛分校 (CU Denver) 统计学副教授奥黛丽·亨德里克斯 (Audrey Hendricks) 进行。

Summix 是 Hendricks 和她的 CU Denver 本科生和研究生团队开发的新方法,它估计数据库中的遗传祖先并调整信息以匹配一个人或人的样本的祖先。这种方法导致大型遗传数据库对非裔美国人或拉丁裔等不同血统的人变得更有用,因为他们在遗传数据库和研究中的代表性不足。Hendricks 将这种方法比作将一本书从英语翻译成另一种语言。

“将 DNA 视为我们身体的语言,”亨德里克斯说。“我们身体的所有单词构成了构成我们每个人的说明书。现在,就像 DNA 书籍只用英文写的一样,所以图书馆中的信息对于不会说英语的人来说没有那么有用. 我们正在努力在图书馆中创作更通用的书籍。”

根据 Hendricks 的说法,来自非裔美国人和 Latnix 等未充分研究人群的个人和样本最有可能缺乏大量具有精确匹配的祖先数据的公共资源。因此,与这些人群一起工作的研究人员通常会求助于最近但仍然不匹配的祖先群体。这导致在最需要高质量研究的人群中产生有偏见的结果。

该团队在 5,000 多个模拟场景和广泛使用的基因组聚合数据库 (gnomAD)(一种公开可用的遗传资源)中展示了 Summix 的有效性。他们发现 Summix 对血统比例的估计非常准确(在 0.001% 以内),并且血统调整后的遗传信息偏差较小。Summix 方法在开放访问软件中可用,增加了该方法及其应用程序的实用性。

“大多数人是多个大陆(例如非洲和欧洲)或更小规模(例如意大利和德国)血统的组合,”亨德里克斯说。“随着医疗保健向精准医学发展,匹配每个人独特的祖先构成将变得越来越重要。Summix 更新遗传资源以匹配个体祖先的能力是朝着这个方向迈出的重要一步,有助于增加遗传汇总数据的效用和公平性。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。