当前位置: 首页 > news >正文

织梦自动生成手机网站温岭网站设计

织梦自动生成手机网站,温岭网站设计,怎么自己建设一个网站,外贸公司怎么找客户的利用scATAC-seq技术进行单细胞分析#xff0c;可以在单细胞分辨率下深入了解基因调控和表观遗传异质性#xff0c;但由于数据的高维性和极端稀疏性#xff0c;scATAC-seq的细胞注释仍然具有挑战性。现有的细胞注释方法大多集中在细胞峰矩阵上#xff0c;没有充分利用潜在的…利用scATAC-seq技术进行单细胞分析可以在单细胞分辨率下深入了解基因调控和表观遗传异质性但由于数据的高维性和极端稀疏性scATAC-seq的细胞注释仍然具有挑战性。现有的细胞注释方法大多集中在细胞峰矩阵上没有充分利用潜在的基因组序列。因此SANGO通过整合scATAC数据中可及性峰周围的基因组序列来进行精确的单细胞注释。将峰的基因组序列编码成低维嵌入然后通过全连通网络重建细胞的峰统计。将学习到的权重作为表示细胞的调控模式并通过Graph Transformer将查询细胞与参考数据中标注的细胞对齐。 在55个scATAC-seq数据集上SANGO在样本、平台和组织上的表现始终优于比较方法。SANGO还被证明能够通过Graph Transformer检测未知的肿瘤细胞。此外通过基因表达富集分析、顺式调控染色质相互作用分析和基序富集分析作者从注释细胞中发现了细胞类型特异性峰这些峰提供了功能见解生物信号。 来自Deciphering cell types by integrating scATAC-seq data with genome sequences 目录 背景概述结果SANGO的概述细胞类型注释性能揭示正常组织的生物学意义肿瘤微环境中的多水平细胞类型识别 背景概述 scATAC-seq为许多生物学应用提供了巨大的机会包括检测细胞异质性和调控元件重建分化轨迹和鉴定复杂疾病的生物学机制。scATAC-seq数据分析中最基本的问题之一是细胞类型鉴定这对于理解复杂组织的组成和发现未知的细胞类型至关重要。目前一种流行的策略是将细胞聚类然后通过与特征基因对应的峰对细胞簇进行注释。这一过程繁琐而复杂涉及专业专家。随着具有良好特征的公共scATAC-seq数据集的迅速增加利用标记良好的细胞对新生成的数据集进行自动标注是有希望的。 由于scATAC数据固有地涉及可访问峰的高维性和每个细胞reads的稀疏性因此已经开发了许多方法将scATAC-seq数据转换为合成的scRNA-seq数据方法是估计“基因活性矩阵”这些转换后的数据类似于scRNA-seq数据并通过scRNA-seq注释工具进行处理。考虑到scRNA-seq数据与合成scRNA-seq数据的不同一些方法已经通过神经网络专门针对scRNA-seq数据进行了优化。然而这些方法只是简单地总结了基因周围峰的数量从而忽略了峰的特异性。 为了解决这个问题有一些方法直接使用逐细胞矩阵数据来注释细胞类型。例如EpiAnno保留频繁的峰值并将其输入到非线性贝叶斯神经网络中以捕获潜在空间。scATAnno强调通过估计不确定性分数来检测参考数据中不存在的未知细胞类型。虽然成功了但这两种方法独立地考虑这些峰而不考虑它们的相对位置。更重要的是他们没有考虑基因组序列信息。 事实上scATAC-seq数据中的峰值可以通过包含细胞类型特异性增强子的可及性和转录因子结合基序的潜在基因组序列来区分这些基序可以提供有关发育状态和细胞身份的信息。基因组序列信息已被广泛用于预测基因表达、预测染色质可及性、提取embedding和预测增强子-启动子相互作用。然而基因组信息尚未用于scATAC数据的细胞注释。 为此作者提出了SANGO这是一种精确且可扩展的基于图的方法通过整合DNA序列信息来注释scATAC-seq数据中的细胞。SANGO首先通过通道注意力卷积神经网络(CA-CNN)从底层峰值的DNA序列信息中学习scATAC数据的低维信息表示。学习到的参考和查询数据的低维表示随后被输入到graph transformer中通过在相似的细胞之间传播共享消息来消除批次效应。最后通过参考数据中的细胞标签对graph transformer进行微调并用于预测查询的细胞类型。研究证明在55个scATAC-seq数据集上SANGO在跨样本、跨平台和跨组织上的预测表现始终优于比较方法。它还被证明能够检测未知的肿瘤细胞。此外从注释的细胞中细胞类型特异性峰可用于下游分析以提供功能见解。 结果 SANGO的概述 如图1所示SANGO是一种基于深度学习的方法用于注释scATAC-seq数据中的细胞。SANGO首先通过预测单细胞染色质可达性从可达性峰下的DNA序列信息中提取细胞低维表示(阶段1)然后利用学习到的细胞表示根据参考数据集注释查询数据集的细胞类型(阶段2)。 图1SANGO的架构。SANGO包括序列信息提取和细胞类型预测两个阶段。在第1阶段在第 i i i个峰附近提取输入的 L L L-bp长度的DNA序列并将其编码为 L × 4 L × 4 L×4矩阵one-hot编码4种碱基。矩阵经过 C C C个卷积滤波器的初始处理生成维数为 C × F C × F C×F的特征矩阵。随后将该矩阵输入到具有sigmoid和通道方向乘法的通道注意力一维卷积神经网络中。然后是瓶颈层来学习峰的 d d d维嵌入。这些嵌入随后被用于预测所有 N c e l l N_{cell} Ncell​细胞的二元可达性通过一个dense线性网络变换其权重矩阵 W c W_{c} Wc​的大小为 d × N c e l l d × N_{cell} d×Ncell​。阶段1中所有可学习的参数通过所有峰上的二元交叉熵损失进行迭代优化。最后在dense网络中学习到的权重作为 N c e l l N_{cell} Ncell​细胞的 d d d维表示。第二阶段利用学习到的参考数据和查询数据的表示通过相似度构建细胞图并利用graph transformer去除批效应根据参考数据中 N r c e l l N_{rcell} Nrcell​细胞的真值标签 Y Y Y和预测的细胞标签 Y ^ \widehat{Y} Y 。然后训练后的graph transformer用于预测查询数据集上的标签。 细胞类型注释性能 数据集内部的注释 SANGO首先在14个intra-data上进行评估每个数据集包含有注释的细胞类型作为参考数据未注释的细胞类型作为查询数据。 跨平台和跨组织的注释 由于可用的参考数据集主要来自其他平台或组织因此有必要评估跨平台和组织数据集的方法。在这里作者首先比较了来自不同测序平台10x Genomics, snATAC-seq和sciATAC-seq)的数据集实验使用了19个配对的跨平台和组织的数据集结果见图3a。 图3a跨平台和跨组织的注释比较。 额外的实验比较了更广泛的跨组织场景对于跨7个组织(骨髓、肝、肾、肺、心、肠和小鼠脑)的22个跨组织数据集见图3c。 图3c更广泛的跨组织注释。 上面实验没有跨物种都是鼠类上的注释。 数据集说明 数据集 BoneMarrowA、BoneMarrowB、LungA、LungB、Kidney、Liver、Heart、LargeIntestineA、LargeIntestineB、SmallIntestine、WholeBrainA、WholeBrainB、Cerebellum 和 PreFrontalCortex 源自成年小鼠图谱数据这些数据集使用 sciATAC-seq 技术进行测序。 前部数据集MosA1MosA2中间数据集MosM1MosM2和后部数据集MosP1MosP2来自小鼠大脑次级运动皮层的不同部分这些数据集使用 snATAC-seq 技术进行测序。 Mouse Brain (10x) dataset和normal cortex dataset使用10x进行测序。 更多其他数据集参考https://www.nature.com/articles/s43588-024-00622-7#data-availability 多参考-单查询的注释 为了评估SANGO在多源数据或图谱数据上的价值作者采用了来自小鼠组织的多源数据集(由四个数据集组成)和肠道(由三个数据集组成)组成多源数据集。对于每个源作者迭代地使用一个数据集作为查询数据其余数据集作为多源参考数据得到七个成对的多参考-单查询数据集。注释结果见图4a 图4a多源参考注释。 另外可以用标记基因周围的峰值信号来验证SANGO的注释比如图4d 图4d预测Memory B细胞和Naive B细胞中重要或高表达基因的染色质可及性coverage plotsNaive细胞为TCL1AMemory B细胞为FCGR2B和TEX9。每个子图中的术语“region”表示染色体的一个基因组区域。 注释的Naive B细胞在报道的标记基因TCL1A上显示富集峰而注释的Memory B细胞在标记基因FCGR2B和特异性表达的TEX9基因上显示富集峰。 揭示正常组织的生物学意义 为了证明SANGO的生物学机制揭示能力作者用前额叶皮层作为参考数据来注释来自成年小鼠大脑的正常皮层数据。由于查询数据没有提供标签作者首先通过coverage plot检查了预测细胞类型中特征基因的染色质可及性。如图5a所示对于每种细胞类型特异性基因的基因组区域±3千碱基的峰值信号scATAC-seq谱中的表观遗传特征在SANGO预测的细胞类型中表现出明显的峰值富集。这些标记基因丰富的表观遗传特征支持SANGO预测的细胞类型注释。 图5a特征基因对应的峰表达。 为了研究预测细胞群的功能见解作者从三个方面分析了细胞类型特异性峰。首先通过Signac进行的基序富集分析结果显示大多数基序是被注释的细胞类型所特有的。其中兴奋性神经元细胞类型获得了最高的值达到82%(在前50个基序中有41个细胞类型特异性基序)内皮细胞类型获得了最低的值只有52%的细胞类型特异性基序。前10个细胞类型特异性基序在相应的细胞类型中富集(补充图14b)。 补充图14b每种细胞类型的前10个重要motifs。 如图5b所示每种细胞类型的结合基序也得到了先前文献的支持。现有文献已经有结论兴奋性神经元细胞(Ex.neurons)被发现富含TBX20、NEUROG2和NEUROD1。发现小胶质细胞富含ETV6、ELF3和SPIB。发现少突胶质细胞富含Sox6、Sox3和SOX13。 图5b过度表达的DNA基序分别通过兴奋性神经元excitatory neurons、小胶质细胞microglia和少突胶质细胞oligodendrocytes的细胞类型特异性可及性峰来鉴定。 其次通过SNPsea分析细胞类型特异性峰组和背景峰组中的单核苷酸多态性(SNPs)计算组织特异性表达富集。背景峰是通过从完整峰中省略这些细胞类型特异性峰的结合而得到的。分析量化了79个组织中组织特异性表达谱的富集程度揭示了前30个兴奋性神经元显著富集的组织如图5c所示发现更多和脑组织相关 图5c在SNPsea分析中考虑SANGO识别的兴奋性神经元特异性峰和背景峰确定了前30个表现出大量富集的组织。 最后SANGO可以揭示特定于细胞类型的可共同访问的位点。通过Cicero预测顺式调节染色质相互作用(图5d)观察到每种细胞类型特有的顺式调节相互作用。值得注意的是细胞类型特异性峰(青色峰)与细胞类型特异性相互作用的模式很好地对齐有效地减少了缺乏细胞类型特异性相互作用的基因组区域的假阳性鉴定。这些结果突出了这些细胞类型特异性峰在破译顺式调控规则和相互作用方面的潜力。 图5dCicero利用来自兴奋性神经元细胞、小胶质细胞和少突胶质细胞的scATAC-seq数据来预测顺式调节染色质相互作用。由SANGO识别的细胞类型特异性峰以青色突出显示。 肿瘤微环境中的多水平细胞类型识别 为了研究SANGO在多水平细胞类型预测中的能力作者在肿瘤微环境中对由不同免疫亚型细胞和肿瘤细胞组成的样本数据进行了评估。通过参考具有合并免疫细胞类型的健康成人大图谱(HHLA)进行注释。 如图6a-c所示SANGO将肿瘤细胞识别为“未知”。对于已知的细胞类型大多数免疫细胞和内皮细胞被正确预测正如river plot所示(图6d)。相反成纤维细胞被预测为壁细胞(通常称为周细胞)可能是由于肿瘤微环境内周细胞和成纤维细胞之间的紧密联系。结果表明该方法能有效区分肿瘤细胞和免疫细胞并能识别未知类型的肿瘤细胞。 图6a-da.细胞按实际的细胞类型着色。b.每个细胞的unkown概率分数的UMAP可视化。c为SANGO预测的细胞类型。d.由SANGO标注的粗粒度细胞类型(左)映射到实际细胞类型(右)的River plot。 为了测试注释亚型的能力使用基底细胞癌(BCC-TIL)的肿瘤浸润性淋巴细胞图谱来注释合并的免疫细胞该图谱包含多种亚型的免疫细胞。SANGO识别免疫亚型的准确率达到90%(图6e,f)。 图6e和f更换参考数据集再注释可以实现准确的亚型分类。这也是2阶段学习的优势。
http://www.zqtcl.cn/news/175731/

相关文章:

  • 中石化第四建设公司 网站电商app开发价格表
  • dhru商城网站建设免费英文网站建设
  • 公司建设网站的 计划书深圳华强北电子商城
  • 宁波网站建设有限公司大圣网站建设
  • wish网站应该怎么做网站的html代码在哪
  • 哪个网站可以做体育主播站长工具seo综合查询怎么去掉
  • 哪个网站做logo设计师公司做网站需要什么资料
  • 想自己做衣服上哪个网站学网站设计网上培训学校
  • 做餐饮的网站云匠网可能会遇到哪些问题
  • 制作网页网站的软件是网络科技公司怎么注册
  • 如何做百度推广网站价格网如何查产品价格
  • 织梦移动网站后缀找生意项目
  • 深圳高端网站建设美工步骤图
  • 指数网站网站用ps下拉效果怎么做
  • 李沧网站建设电话从化企业网站建设
  • 北京电商网站建设公司新康家园网站建设
  • 广西注册公司网站企业高端网站制作
  • 国安中建建设集团网站南京网页设计培训班
  • 网站如何制作建设内容社交电商平台
  • 无法连接到wordpress站点网站建设两个方面
  • 广东官网网站建设品牌未来做啥网站能致富
  • 网站建设合同副本珠海微网站建设
  • wordpress 多语言 站点数据分析师报名入口
  • 做网站长尾词品牌设计模板
  • 企业建立网站的优势阿里云做网站号码
  • 江苏住房城乡建设厅网站一千块钱能注册公司吗
  • 山东兴华建设集团有限公司网站分类信息网站怎么做
  • 怎么用手机网站做软件西安网站建设开发熊掌号
  • asp.net做网站的流程杭州vi设计广告公司
  • 微信网站主题网络建设解决方案