soword科技言
永久公益免费API接口
提供永久免费的API接口,查看更多API接口,如果您有其他免费API资源,请联系我们,造福人类。
提供商务开发:小程序,系统,APP
定制开发,免费评估,免费咨询,价格便宜,售后保障,前往开发服务中心联系开发客服中心
哈佛大学Nvidia的研究人员利用人工智能在细胞DNA中寻找活跃区域

Nvidia和哈佛大学的研究人员本周发表了一项新的研究成果,他们将深度学习应用于表观基因组学——细胞遗传物质修饰的研究。利用最初为计算机视觉开发的神经网络,研究人员开发了一个深度学习工具包,可以帮助科学家研究稀有细胞类型,并可能识别使人更容易患疾病的突变。

新的深度学习工具包,称为AtacWorks,“这使我们能够研究疾病和基因组变异如何影响人体特定类型的细胞,”该论文的主要作者、Nvidia研究员Avantika Lal上周告诉记者这将使以前不可能的生物发现成为可能,我们希望这也将有助于发现新的药物靶点,与ATAC-seq(一种寻找人类基因组中可在细胞中找到的部分的流行方法)一起工作。

几乎你身体中的每个细胞都携带一份你的基因组序列——一个大约30亿碱基长的DNA序列。然而,只有基因组序列的某些部分可以被某些细胞获得。每种细胞类型——不管是肝细胞、血细胞还是皮肤细胞——都只能进入它们各自功能所需的DNA区域。这使我们能够理解是什么使每一种细胞彼此不同,或者每一种细胞在疾病或其他生物变化中是如何受到影响的,“拉尔说。

ATAC seq通过为基因组中的每个碱基产生一个信号来找到那些可接近的部分。信号中的峰值表示DNA的可触及区域。这种方法通常需要数以万计的特定类型的细胞才能获得清晰的信号。这使得研究罕见的细胞类型,如产生血细胞和血小板的干细胞变得很有挑战性。

然而,通过将AtacWorks应用于ATAC-seq数据,研究人员发现他们只能依赖几十个细胞,而不是几万个。在他们的新论文中描述的研究中,Nvidia和哈佛大学的科学家将AtacWorks应用于产生红细胞和白细胞的干细胞数据集。他们使用了一个只有50个细胞的样本集来识别与发育成白细胞的细胞相关的不同DNA区域,以及与红细胞相关的独立序列。

AtacWorks是一个基于Pytork的卷积神经网络,它是在匹配的ATAC-seq数据集的标记对上训练的——一个高质量的一个是“嘈杂”。该模型学会了预测数据集的准确、高质量版本,并识别信号中的峰值。

在Nvidia Tensor Core GPU上运行,该模型对整个基因组的推断需要不到30分钟,而在一个拥有32个CPU核的系统上,这一过程通常需要15个小时。

Lal指出,研究人员在能够在任何类型的细胞上训练模型,然后将其应用于任何不同类型的细胞。

“这是一件非常美妙的事情,因为这意味着我们可以使用我们现有的任何数据训练模型,然后将其应用于全新的生物样本,”她说。

该模型可以帮助我们深入了解一系列疾病,包括心血管疾病、老年痴呆症、糖尿病或神经系统疾病。在NGC软件中心,Nvidia的GPU优化软件中心,任何研究人员都可以访问它。

“我们希望,一旦我们的论文发表,其他研究不同疾病的科学家也会学习这项技术,并对使用它感兴趣,”Lal说我们很高兴看到有什么新的研究和新的发展可以使“

Okta以65亿美元收购Auth0

new york,IBM开始测试Covid-19 digital health pass

通过注册,您同意https://redventures.com/CMG-terms-of-use.html“target=”\u blank“rel=”noopener noreferrer nofollow


2023-03-22 10:04:29

新人小程序+APP定制199元起


发放福利,助力中小企业发展,真正在互联网中受益

点击询问定制

广告服务展示