3 Molo 函数

在本节中,我们将详细介绍Molo包中的各函数的功能和对应的参数设置

3.1 Molo_Create

3.1.1 功能

从标准格式的原始数据文件创建Molo对象。

3.1.2 参数及含义

  • data_type:平台类型(如 "Visium",默认值)
  • folder_path:包含输入文件的目录路径(默认当前目录 "./"
  • n_cells:可选参数,指定子集化的细胞数量(默认不限制)
  • n_features:可选参数,指定特征选择数量(默认不限制)
  • ATAC_dataset:ATAC-seq参考基因组物种(可选 "mouse""human",默认 "mouse"
  • CODEX_type:多重成像平台类型(默认 "processor"
  • softmax:是否应用softmax标准化(逻辑值,默认 FALSE
  • custom_index:自定义索引列标识符(默认 "__index_level_0__"

3.1.3 返回值

构造完成的Molo对象。

3.1.4 基础示例

molo_obj <- Molo_Create(data_type = "Visium", 
                        folder_path = "./Visium/",
                        n_cells = 2000, 
                        n_features = 3000)

3.2 Molo_reduction_cluster

3.2.1 功能

对Molo对象执行降维与聚类分析。

3.2.2 参数及含义

  • obj:输入的Molo对象
  • only_QC:是否仅执行质量控制过滤步骤(逻辑值)
  • nFeature_range:有效基因数范围(向量格式,如 c(200, 2500)
  • nCount_range:有效UMI数范围(向量格式,如 c(500, 15000)
  • molo_env:运行时配置参数(环境变量对象)
  • labeled_ref:参考标注数据集的文件路径(推荐使用rds格式的seurat对象)
  • molo_plot_path:结果图像输出目录路径(默认根据环境变量生成)
  • save_type:结果保存格式(如静态图像"png"/交互式图像"echarts"
  • run_Banksy:是否启用Banksy空间聚类(逻辑值)
  • image_alpha:空间图像透明度(数值范围0-1)
  • pt_size:可视化点大小(数值,默认根据数据规模自动调整)
  • atac_steps:ATAC-seq数据处理流程步骤标识符(字符向量)
  • show_progress:是否显示进度信息(逻辑值)

3.2.3 返回值

包含降维嵌入结果和聚类标签的Molo对象。

3.2.4 基础示例

molo_obj <- Molo_reduction_cluster(obj = molo_obj,
                                   only_QC = FALSE,
                                   nFeature_range = c(200, 2500),
                                   nCount_range = c(500, 15000),
                                   molo_plot_path = "./plots/")

3.3 Molo_var_features

3.3.1 功能

识别Molo对象中的空间可变特征和标记基因。

3.3.2 参数及含义

  • obj:输入的Molo对象
  • features:预定义分析特征集合(可选,默认分析全部特征)
  • sp_var_features:需筛选的顶级空间可变特征数量(数值)
  • molo_plot_path:可视化结果存储目录(默认根据环境变量生成)
  • save_type:输出图像文件格式(如静态图像"png"/交互式图像"echarts"
  • font_size:可视化图表文字大小(数值,默认 12
  • image_alpha:空间图层透明度(数值范围 0-1,默认 0.6
  • pt_size:特征表达点的可视化尺寸(数值,默认 1.0
  • show_progress:是否显示处理进度(逻辑值,默认 TRUE

3.3.3 返回值

包含空间可变特征分析结果的Molo对象。

3.3.4 基础示例

molo_obj <- Molo_var_features(obj = molo_obj,
                              sp_var_features = 20,
                              molo_plot_path = "./plots/")

3.4 Molo_top_GO_terms

3.4.1 功能

执行GO富集分析并可视化各聚类核心通路。

3.4.2 参数及含义

  • obj:包含聚类注释的Molo对象
  • dataset:基因注释的物种数据库(可选 "mouse""human"
  • plot_cols:可视化自定义调色板(可选,默认使用内置配色)
  • molo_plot_path:GO结果图像存储目录路径(默认根据环境变量生成)
  • font_size:可视化图表标签文字大小(数值,默认 12
  • show_progress:是否显示处理进度(逻辑值,默认 TRUE

3.4.3 返回值

包含GO富集分析结果的Molo对象。

3.4.4 基础示例

molo_obj <- Molo_top_GO_terms(obj = molo_obj,
                              dataset = "mouse",
                              molo_plot_path = "./plots/")

3.5 Molo_cell_chat

3.5.1 功能

使用CellChat进行细胞间通讯分析。

3.5.2 参数及含义

  • obj:包含细胞类型注释的Molo对象
  • plot_cols:细胞群组的自定义颜色映射(可选,默认使用内置配色)
  • dataset:配体-受体对的物种数据库(可选 "mouse""human"
  • molo_plot_path:细胞通讯分析结果图像输出目录路径(默认根据环境变量生成)
  • font_size:可视化图表标签文字大小(数值,默认 12
  • show_progress:是否显示处理进度(逻辑值,默认 TRUE

3.5.3 返回值

包含CellChat分析结果的Molo对象。

3.5.4 基础示例

molo_obj <- Molo_cell_chat(obj = molo_obj,
                           dataset = "mouse",
                           molo_plot_path = "./plots/")

3.6 Molo_traj

3.6.1 功能

使用Monocle3进行细胞轨迹推断。

3.6.2 参数及含义

  • obj:包含降维结果的Molo对象
  • plot_cols:轨迹自定义颜色映射(可选,默认使用内置配色)
  • molo_plot_path:轨迹分析结果图像存储目录路径(默认根据环境变量生成)
  • show_progress:是否显示处理进度(逻辑值,默认 TRUE

3.6.3 返回值

包含轨迹推断元数据的Molo对象。

3.6.4 基础示例

molo_obj <- Molo_traj(obj = molo_obj, molo_plot_path = "./plots/")

3.7 Molo_Integrate

3.7.1 功能

使用Molo框架进行空间数据整合。

3.7.2 参数及含义

  • obj_list:输入Molo对象的列表
  • var_features:高变特征筛选数量(整数,默认 3000
  • py_path:Python解释器可执行文件路径(默认 "home/user/anaconda3/envs/Molo/bin/python"
  • device:模型训练计算设备(可选 "cuda:0"/"cpu",默认 "cuda:0"
  • save_path:整合结果存储目录路径(默认 "./molo_save/"
  • pretrain_epoch:预训练迭代次数(整数,默认 100
  • train_epoch:主训练迭代次数(整数,默认 300
  • tmp:中间文件临时存储目录(默认 "./_molo_tmp/"
  • edge:边构建策略(字符,默认 "together"
  • sp_alignment:空间对齐方法(字符,默认 "Molo"
  • plot_3D_width:3D可视化图像宽度(数值,默认 8.0
  • plot_3D_height:3D可视化图像高度(数值,默认 6.0
  • plot_3D_spot_size:3D图中点尺寸(数值,默认 0.5
  • dist_threshold:空间匹配最大距离阈值(数值,默认 5.0
  • pis_path:预计算对齐概率文件路径(可选,默认 NULL
  • sp_alignment_s:空间对齐正则化强度(数值,默认 0.7
  • use_harmony:是否启用Harmony整合校正(逻辑值,默认 FALSE
  • compute_iLISI:是否计算整合质量指标(逻辑值,默认 TRUE
  • edge_type:边连接类型(字符,默认 "together"
  • edge_sp:空间邻域边数量(整数,默认 10
  • edge_mtx:特征相似性边数量(整数,默认 10
  • hidden_dims:神经网络隐藏层维度(整数,默认 250
  • reduction_dims:潜在空间维度(整数,默认 30
  • mse_loss:均方误差损失权重(数值,默认 1.0
  • tri_loss:三元组损失权重(数值,默认 1.0
  • ggae_loss:图自编码器损失权重(数值,默认 1.0
  • cos_loss:余弦相似度损失权重(数值,默认 1.0
  • bce_loss:二值交叉熵损失权重(数值,默认 1.0
  • kl_loss:KL散度损失权重(数值,默认 1.0
  • K_h:相似性缩放超参数(数值,默认 5.0
  • verbose:是否显示进度信息(逻辑值,默认 TRUE

3.7.3 返回值

整合后的Molo对象。

3.7.4 基础示例

integrated_obj <- Molo_Integrate(obj_list = list(molo1, molo2),
                                 var_features = 3000)