当前位置: 首页 > news >正文

兰州网站建设索王道下拉怎么制作属于自己的网址

兰州网站建设索王道下拉,怎么制作属于自己的网址,网站排名优化化快排优化,淘宝seo排名优化的方法基因调控网络GRN是包含转录因子TFs与其下游靶基因之间的调控相互作用的可解释图模型。了解GRN的拓扑结构和动力学是解释疾病病因机制和将相应发现转化为新疗法的基础。单细胞多组学技术的最新进展促使从单细胞转录组学和表观基因组学数据中以前所未有的分辨率推断GRN。在这里作者提出scGRN一个全面的单细胞多组学GRN平台包含人类和小鼠。目前版本的scGRN收录了237,051个细胞类型特异性GRN62,999,692个TF-靶基因对涵盖160个组织/细胞系。scGRN是第一个记录从单细胞多组学数据推断的不同人类和小鼠条件下大规模细胞类型特异性GRN信息的资源。作者已经实现了多种有效的GRN分析在线工具包括差异TF-target网络分析TF富集分析和pathway下游分析。作者还详细介绍了TF与GRN中靶基因的启动子promoters、超增强子super-enhancers和典型增强子typical enhancers的结合情况。综上所述scGRN是一个搜索、浏览、分析、可视化和下载感兴趣GRN的综合平台使人们能够深入了解不同条件下调控机制的差异。 来自scGRN: a comprehensive single-cell gene regulatory network platform of human and mouse 在线网页https://bio.liclab.net/scGRN/ 目录 背景概述数据和方法数据收集与管理数据预处理scRNA和scATAC数据的细胞聚类和注释GRN重建基本知识从RNA模态中重建从ATAC模态中重建 GRN中target genes的注释 平台使用和访问整体概述检索scGRN数据集的接口GRN在线分析工具 局限Reference 背景概述 复杂的基因表达模式在很大程度上是由转录因子TFs的调控所控制和塑造的转录因子是位于顺式调控元件CREscis-regulatory elements内部或周围的序列特异性DNA结合蛋白[1]。TFs丰度或活性的变化可导致其下游target转录的增加或减少[2,3]。TFs的基因调控不是一个线性过程而是发生在复杂网络的背景下该网络包括多个TFs与其下游靶基因之间的调控相互作用[4]称为基因调控网络GRN可以控制基因表达的时间、条件和数量。揭示GRN的拓扑结构和动力学是理解细胞身份的建立和重编程以及细胞命运的基础[5,6]。这些网络也可以用来模拟不同条件下基因表达的变化从而深入了解差异基因表达的机制[4]。 重建GRN是生物学中一个长期存在的目标并且已经创建了各种方法来挖掘TF-target调控关系并将其映射到graph上。早期重建GRN的研究利用了数据库中经过实验验证的调控事件。下一代测序技术的出现促进了从大量TF-binding或转录组学数据中推断出GRN。然而由于这些高通量数据的bulk性质组织样本中跨细胞类型混合测量引起的限制尚未被克服。 在过去的十年中单细胞技术引起了一场革命使用单细胞组学数据的GRN重建方法已逐渐应用于推断细胞类型特异性TF-gene相互作用。scRNAseq是目前最常用的推断单细胞GRNscGRNs的方法。例如SCENIC将scRNA-seq共表达网络与motif binding信息整合以推断GRN[12]。单细胞转座酶可及染色质测序scATACseq的出现使得在单细胞分辨率和全基因组范围内分析开放染色质成为可能使用scATACseq数据生成的大规模表观基因组信息进行GRN重建成为完善TF-gene调控关系推断的补充选择。最近Zhang等人[19]提出了DIRECTNET其中仅使用scATAC数据就可以重构GRN。 构建GRN是系统生物学的一个主要研究热点因为它可以为药物设计和医学研究提供重要的信息。例如kragsteen等人通过基因调控分析确定了Norn TFs的靶基因发现Tcf21是Norn细胞的关键转录调控因子[20]。Jain等通过研究SSc_ILD和健康对照肺样本的GRN发现了治疗SScILD的几个新靶点[21]。 在过去的几年中为了描述全基因组调控事件已经创建了多个致力于提供TF-gene关系的资源。然而预测的TF-target gene调控关系来自bulk omics data因此无法表征特定于细胞类型的全基因组调控事件。TRRUST[22,25]是第一个使用基于句子的文本挖掘构建的基于文献的TF-target interactions数据库使其成为GRN计算推理和重建的有用基准。基因调控网络数据库GRAND的开发是为了提供特定样本的GRN资源其中考虑了患者之间的表型差异如性别、年龄和种族。hTFtarget数据库通过整合ChIP-seq数据和TF binding site prediction提供了人类的TF-target gene调控关系。 虽然上述数据库为检索TF-target gene关系提供了全面的资源但由于数据来自bulk组学数据因此无法在单细胞分辨率下对GRN进行深入分析。GRNdb已经部分解决了这一限制[24]GRNdb使用从公共数据库收集的不同人类和小鼠条件的scRNA-seq数据重建了GRN。然而单细胞转录组数据的不断积累促使我们创建一个更全面的资源来记录scGRNscGRN与GRNdb的比较见补充表S1。此外在推断TFs和它们的target genes的调控关系时单独使用单细胞转录组数据可能会忽略表观基因组信息的影响例如开放的染色质区域。 因此作者开发了scGRN这是一个跨越多种人类和小鼠条件的综合单细胞多组学基因调控网络平台旨在记录从scRNA-seq和scATACseq数据中计算推断的大量GRN信息并提供target genes的详细表观遗传学注释。目前scGRN共收录了62,999,692对细胞类型特异性TF-target gene对涵盖160个组织/细胞系。这些样本来自NCBI GEO/SRA、ENCODE、Arrayexpress数据库包括多个单细胞测序平台。为了提供更好的用户体验scGRN提供了多种GRN相关信息的可视化方法并对TF结合区域的启动子、超级增强子和典型增强子进行了详细的功能标注。作者还开发了三种在线分析工具包括差异GRN分析、TF富集分析和pathway下游分析。 数据和方法 数据收集与管理 作者从NCBI GEO、ENCODE和ArrayExpress等多个公共数据库中收集scRNA-seq样本。GEO数据库中的scRNA-seq数据集通过基于文本挖掘的pipeline自动抓取和下载其中用于query数据的关键字包括“scRNA-seq”、“single cell RNA sequencing”、“single-cell RNA-seq”、“Homo sapiens”和“Mus musculus”。在手动审核收集到的每个记录后过滤掉那些没有原始基因表达谱的样本。作者还从ENCODE和ArrayExpress下载了人和小鼠的scRNA-seq样本。对于scATAC-seq数据作者从NCBI GEO/SRA中收集了原始fastq文件其获取方式与从GEO数据库中获取的方式相似。此外手工整理和校对了每个scRNA-seq和scATAC-seq的元信息包括物种、数据类型、组织类型、测序平台、细胞数和相关出版文献。 数据预处理 为了克服技术差异和噪声的影响作者分别对scRNA-seq和scATAC-seq数据采用统一的质量控制流水线进行预处理。首先使用Seurat软件包(4.3.0)对scRNA-seq样品的原始基因表达谱进行质量控制。然后使用带有默认比例因子的全局缩放的归一化方法“LogNormalize”对表达进行归一化并采用PCA线性降维。对于scATAC-seq数据首先使用cellranger-atac处理原始fastq文件然后使用Signac (1.9.0) 进行严格的质量控制以去除低质量的细胞。此外作者还基于TF-IDF方法对cell-peak矩阵进行了归一化。最后对变换后的ATAC矩阵进行奇异值分解提取每个细胞的低维表示。 scRNA和scATAC数据的细胞聚类和注释 数据预处理后使用Seurat对scRNA-seq数据进行细胞聚类。随后使用自动标注方法SingleR (2.2.0) 识别每个簇的细胞类型。对于scATACseq数据使用Signac R包进行细胞聚类。还使用MAESTRO R包(1.5.1) 中的“ATACCalculateGenescore”函数将peak矩阵转换为基因活性评分矩阵并使用SingleR进行细胞类型注释。scRNA-seq和scATAC-seq的聚类结果使用UMAP降维方法进行可视化。 GRN重建 基本知识 TF-motif注释 TF-motif注释的目的是识别和预测这些转录因子的结合位点。TF代表转录因子而motif代表转录因子结合位点的序列模式。因此TF-motif注释数据包含了转录因子结合位点的位置信息以及与之对应的基序。 从基因共表达网络到TF 首先利用基因共表达网络的模块化分析方法将基因分组成共表达模块。然后通过TF基因的信息如基因的注释或数据库中已知的TF信息检查每个模块中的基因是否富集有TF。如果某个模块中的基因富集有TF则可以将这些TF视为调控该模块的候选TF。TF结合位点预测利用已知的TF结合位点信息可以在基因组中预测TF的结合位点。然后将这些结合位点与共表达网络中的基因进行比较以确定哪些TF可能直接调控这些基因的表达。这需要结合TF-motif注释数据。基于TF-基因共表达模式的预测利用机器学习方法例如基于深度学习的方法从基因共表达网络中学习TF与其调控基因之间的共表达模式。这种方法可以帮助识别TF与其调控基因之间的潜在关系并预测新的TF-基因调控关系。实验验证最终为了验证预测的TF-基因调控关系可以进行实验验证例如染色质免疫沉淀ChIP实验以确定TF是否真正调控共表达网络中的基因表达。 补充图1GRN重建管道。 从RNA模态中重建 作者采用pySCENIC pipeline (version 0.11.2)利用scRNA-seq数据集的基因表达矩阵和已知的TF-motif注释推断GRN (补充图1A)。首先使用GENIE3和GRNBOOST2分别基于TF-gene共表达模块识别潜在的TF targets。然而单独使用共表达预测的GRN含有许多假阳性和间接的targets。为了克服这一限制作者使用Rcistarget对每个共表达模块进行修剪以确定具有motif支持的直接targets (regulons调控子)。这些motif来自两个数据库位于转录起始位点TSS周围10 kb和TSS上游500 bp作者保留了那些注释了相应TFs且标准化富集分数(NES) 3.0的motif。最后利用AUCell对每个细胞中这些调控子的活性进行量化并利用调控子活性评分(RAS)矩阵和细胞类型条形码信息计算每个调控子的细胞类型特异性评分。细胞类型特异性调控子定义为RSS 0.1且在每种细胞类型中排名前10位的调控子。 从ATAC模态中重建 作者使用DIRECT-NET(1.0.0)从单细胞染色质可及性数据(即scATAC数据)(补充图1B)。首先使用MAESTRO将每个scATAC样本的细胞峰矩阵转化为基因活性评分矩阵从该矩阵中检测到每个细胞型簇的差异表达基因(DEGs)。对于每个DEG转录起始位点(TSS)上游500bp被视为启动子TSS上游和下游250kb内的peak被定义为候选功能区。然后作者构建了一个新的特征矩阵其中行表示相似的细胞列表示启动子和候选调节区域聚合来自KNN graph (默认k 50) 的相似细胞的信号。第三通过远端候选功能区域的可达性对启动子表达水平的可达性进行回归发现重要度得分高于重要度得分中位数最大值且值为0.001的区域为高置信度CREsHC CREs。最后利用ChromVAR软件包(1.20.2)中的motifmatchr函数通过基序富集分析鉴定与启动子和HC CREs结合的TF重构细胞类型特异性GRNs。此外还计算了TF与靶基因之间的Spearman相关评分以提供参考。 GRN中target genes的注释 作者首先从SEdb 2.0中获得了1739个人和931个小鼠 H3K27ac ChIP-seq样本中鉴定的1,717,744个超级增强子 (SE) 区域和79,709,120个典型增强子 (TE) 区域。然后利用最近的活性基因、重叠基因、近端基因和最近基因四种连接策略绘制了这些SE和TE区域的靶基因图谱。作者将TSS上游和下游2kb的基域定义为靶基因的启动子区域。 为了鉴定与靶基因启动子、SE和TE结合的TFs作者从ReMap 2022中收集了817个人和648个小鼠TFs的51,616,973个和32,985,444个非冗余结合区这些TFs来自不同细胞系和组织类型。使用BEDTools (2.25.0) 鉴定了所有GRNs中与靶基因的启动子、SE或TE区域重叠的TF结合峰。 平台使用和访问 整体概述 scGRN的主要框架和功能如图1所示。scGRN目前包含1324份来自10X Genomics、Drop-seq、Microwell-seq、inDrop、Smart-seq、HyDrop、sciATAC-seq等多个测序平台的scRNAseq和scATAC-seq数据。这些数据包括来自160个组织/细胞系的6,808,724个细胞包括疾病和健康状况的样本。作者分别从scRNA-seq和scATAC-seq数据中使用统一的管道和软件参数进行GRN推断。scGRN提供可视化如聚类、细胞类型注释、转录因子活性热图以及推断每个样本的细胞类型特异性GRN。此外scGRN还提供了TF结合区启动子、超级增强子和典型增强子的详细功能注释。此外scGRN还为用户提供了三种在线分析工具包括TF富集分析、差异网络分析和通路下游分析。总的来说scGRN是一个用户友好的平台可以查询、分析和可视化与scGRN相关的信息。 图1scGRN收集了大量的人和小鼠单细胞多组学数据并使用统一的流水线来推断GRNs。scGRN支持多种浏览、搜索、分析、可视化和下载GRNs相关信息。 图2scGRN的主要功能和使用方法。A. scGRN导航条。B. 浏览scGRN页面。C. 提供四种查询模式包括“按TF搜索”、“按靶基因搜索”、“按组织类型搜索”和“按细胞类型搜索”。D. 每个样本的详细信息包括“样本概述”、“可视化”和“TF-target网络”。E. 每个靶基因的详细信息。F. 提供了三种在线分析工具包括“差异TF-target网络分析”、“TF富集分析”和“Pathway downstream分析”。G. scGRN允许用户下载TF-target list和注释信息。 检索scGRN数据集的接口 scGRN使用户能够搜索、浏览、分析、可视化和下载感兴趣的GRN图2A。作者在“Search”页面上提供了四种不同的查询方法来搜索scGRN相关信息包括“按TFs搜索”、“按靶基因搜索”、“按组织类型搜索”和“按细胞类型搜索”图2C。比如第一种查询模式“按TFs搜索”是为对某些特定TFs感兴趣的生物学家设计的。按target基因搜索是专门为对scGRN中特定target基因感兴趣的用户设计的。唯一的区别是用户应该输入感兴趣的靶基因名称而不是TF名称。当用户对特定组织类型或细胞类型感兴趣时“按组织类型搜索”和“按细胞类型搜索”应该是最佳查询模式。最后点击“搜索”按钮将用户引导到所搜索的组织类型或细胞类型的相应数据集。 结果页面给出了相关样本的总结表并在该表中显示了每个样本的简要信息比如样本ID物种和平台。在点击特定的样本ID后用户被引导至详细页面图2D包括“样本概述”、“可视化”和“TF -target网络”。作者在“样本概述”面板的左侧部分提供了所选样本的基本描述而详细信息如细胞分布、网络统计数据和质量控制结果在右侧部分表示。对于可视化面板中的scRNA-seq样本分别为SCENIC (GENIE3)和SCENIC (GRNBOOST2)提供了多种可视化方法包括“Cell cluster and TF activity”、“Regulon module”、“Regulon特异性”和“Regulon activity”。GRN信息在TF-target网络面板中显示。 GRN在线分析工具 作者已经实现了三种有效的基因调控网络分析在线工具包括“差异TF-target网络分析”、“TF富集分析”和“Pathway downstream分析” (图2F)。“差异TF-target网络分析”用于比较任意两个网络的差异。首先用户确定种类、数据类型和网络推理方法。然后用户应该选择两个样本进行分析。最后点击“Analyze”将返回差异网络分析结果包括“Sample Overview”、“Global differential network”和“cell types之间的差异网络”。使用“TF富集分析”用户首先需要提供基因列表或上传包含基因名称的文件然后设置测试使用的参数。同时也要选择富集TF的样本。运行分析将返回用户提交的所有基因的富集结果这些结果被组织成一个汇总表其中包含了这些基因的详细TF富集信息。为了提高直观性还提供了浓缩结果的气泡图和条形图。“通路下游分析”的功能是在选定的样本中识别TF或靶基因的富集通路。点击“Analyze”将返回所选通路数据库中的富集通路。 局限 局限性是scGRN目前只记录了使用scRNA-seq或scATACseq数据预测的scGRN由于现阶段可用样本有限不包括同时使用scRNA-seq和scATACseq数据推断的scGRN。然而单细胞多组学技术的不断进步导致了使用多模态分析样本进行更可靠的scGRN推断的新型计算方法的发展例如ANANSE CellOracle [67] DeepMAPS [68]和SCENIC[69]。 Reference [1]The evolution of gene regulation by transcription factors and microRNAs [2]Gene regulation by transcription factors and microRNAs [3]KnockTF: a comprehensive human gene expression profile database with knockdown/knockout of transcription factors [4]Gene regulatory networks and the role of robustness and stochasticity in the control of gene expression [5]Gene regulatory networks in the evolution and development of the heart [6]Gene regulatory networks and the evolution of animal body plans [12]SCENIC: single-cell regulatory network inference and clustering [19]DIRECT-NET: an efficient method to discover cis-regulatory elements and construct regulatory networks from single-cell multiomics data [20]The transcriptional and regulatory identity of erythropoietin producing cells [21]Epigenetic regulation of profibrotic macrophages in systemic sclerosis-associated interstitial lung disease [22]TRRUST v2: an expanded reference database of human and mouse transcriptional regulatory interactions [24]GRNdb: decoding the gene regulatory networks in diverse human and mouse conditions [25]TRRUST: a reference database of human transcriptional regulatory interactions [67]Dissecting cell identity via network inference and in silico gene perturbation [68]Single-cell biological network inference using a heterogeneous graph transformer [69]SCENIC: single-cell multiomic inference of enhancers and gene regulatory networks
http://www.zqtcl.cn/news/792709/

相关文章:

  • 企业网站申请流程北京网站建设北京
  • 响应式网站导航栏模板python开发wordpress
  • 大学生创新创业大赛一个网站做两个优化可以做吗
  • 网站设计建设铁总建设函网站
  • 做期货都看哪个网站什么是网络营销的综合工具
  • 专做袜子的网站北京学设计去哪个网站好
  • 一搜网站制作网站支付怎么做
  • 广州 科技网站建设公司国外酷炫flash网站
  • 焦作网站建设焦作wordpress怎么进行301 htaccess
  • 那个网站能找到人做品牌文化的网站
  • 家里做网站买什么服务器好网站建设报价单 文库
  • 网站百度建设银行广西分行招聘网站
  • 打开网站显示404北京公司请做网站工资
  • 网站开发验收流程图app开发制作的图片
  • 网站流量的作用app定制开发和模板开发的区别
  • 如何做分公司网站网站建设与设计开题报告
  • 易语言怎么做网站网络推广客户渠道
  • 唐山哪里有做网站的网站服务器在
  • 网络服务机构的网站广东省住房及建设厅官方网站
  • 工业设计灵感网站商务网页设计与制作微课版答案
  • 如何引用网站上的资料做文献学历提升的正规机构
  • 如何上传wordpress程序聊城网站优化案例
  • 婚纱网站设计目标无代码制作网页
  • 温州网站提升排名打开搜索引擎
  • 企业市场网络推广方案优化方案答案
  • 茂名网站建设咨询wordpress官网上的主题收费吗
  • 如何自己开发网站WordPress修改前端
  • 哪些网站用黑体做的谁给个网站啊急急急2021
  • aspnet网站开发选择题怎样建设网站是什么样的
  • 专业建站公司电话咨询做暧小视频免费视频在线观看网站