3 Molo 函数
在本节中,我们将详细介绍Molo包中的各函数的功能和对应的参数设置。
3.1 Molo_Create
3.1.2 参数及含义
-
data_type:平台类型(如
"Visium"
,默认值) -
folder_path:包含输入文件的目录路径(默认当前目录
"./"
) - n_cells:可选参数,指定子集化的细胞数量(默认不限制)
- n_features:可选参数,指定特征选择数量(默认不限制)
-
ATAC_dataset:ATAC-seq参考基因组物种(可选
"mouse"
或"human"
,默认"mouse"
) -
CODEX_type:多重成像平台类型(默认
"processor"
) -
softmax:是否应用softmax标准化(逻辑值,默认
FALSE
) -
custom_index:自定义索引列标识符(默认
"__index_level_0__"
)
3.2 Molo_reduction_cluster
3.2.2 参数及含义
- obj:输入的Molo对象
- only_QC:是否仅执行质量控制过滤步骤(逻辑值)
-
nFeature_range:有效基因数范围(向量格式,如
c(200, 2500)
) -
nCount_range:有效UMI数范围(向量格式,如
c(500, 15000)
) - molo_env:运行时配置参数(环境变量对象)
- labeled_ref:参考标注数据集的文件路径(推荐使用rds格式的seurat对象)
- molo_plot_path:结果图像输出目录路径(默认根据环境变量生成)
-
save_type:结果保存格式(如静态图像
"png"
/交互式图像"echarts"
) - run_Banksy:是否启用Banksy空间聚类(逻辑值)
- image_alpha:空间图像透明度(数值范围0-1)
- pt_size:可视化点大小(数值,默认根据数据规模自动调整)
- atac_steps:ATAC-seq数据处理流程步骤标识符(字符向量)
- show_progress:是否显示进度信息(逻辑值)
3.3 Molo_var_features
3.3.2 参数及含义
- obj:输入的Molo对象
- features:预定义分析特征集合(可选,默认分析全部特征)
- sp_var_features:需筛选的顶级空间可变特征数量(数值)
- molo_plot_path:可视化结果存储目录(默认根据环境变量生成)
-
save_type:输出图像文件格式(如静态图像
"png"
/交互式图像"echarts"
) -
font_size:可视化图表文字大小(数值,默认
12
) -
image_alpha:空间图层透明度(数值范围
0-1
,默认0.6
) -
pt_size:特征表达点的可视化尺寸(数值,默认
1.0
) -
show_progress:是否显示处理进度(逻辑值,默认
TRUE
)
3.4 Molo_top_GO_terms
3.5 Molo_cell_chat
3.6 Molo_traj
3.7 Molo_Integrate
3.7.2 参数及含义
- obj_list:输入Molo对象的列表
-
var_features:高变特征筛选数量(整数,默认
3000
) -
py_path:Python解释器可执行文件路径(默认
"home/user/anaconda3/envs/Molo/bin/python"
) -
device:模型训练计算设备(可选
"cuda:0"
/"cpu"
,默认"cuda:0"
) -
save_path:整合结果存储目录路径(默认
"./molo_save/"
) -
pretrain_epoch:预训练迭代次数(整数,默认
100
) -
train_epoch:主训练迭代次数(整数,默认
300
) -
tmp:中间文件临时存储目录(默认
"./_molo_tmp/"
) -
edge:边构建策略(字符,默认
"together"
) -
sp_alignment:空间对齐方法(字符,默认
"Molo"
) -
plot_3D_width:3D可视化图像宽度(数值,默认
8.0
) -
plot_3D_height:3D可视化图像高度(数值,默认
6.0
) -
plot_3D_spot_size:3D图中点尺寸(数值,默认
0.5
) -
dist_threshold:空间匹配最大距离阈值(数值,默认
5.0
) -
pis_path:预计算对齐概率文件路径(可选,默认
NULL
) -
sp_alignment_s:空间对齐正则化强度(数值,默认
0.7
) -
use_harmony:是否启用Harmony整合校正(逻辑值,默认
FALSE
) -
compute_iLISI:是否计算整合质量指标(逻辑值,默认
TRUE
) -
edge_type:边连接类型(字符,默认
"together"
) -
edge_sp:空间邻域边数量(整数,默认
10
) -
edge_mtx:特征相似性边数量(整数,默认
10
) -
hidden_dims:神经网络隐藏层维度(整数,默认
250
) -
reduction_dims:潜在空间维度(整数,默认
30
) -
mse_loss:均方误差损失权重(数值,默认
1.0
) -
tri_loss:三元组损失权重(数值,默认
1.0
) -
ggae_loss:图自编码器损失权重(数值,默认
1.0
) -
cos_loss:余弦相似度损失权重(数值,默认
1.0
) -
bce_loss:二值交叉熵损失权重(数值,默认
1.0
) -
kl_loss:KL散度损失权重(数值,默认
1.0
) -
K_h:相似性缩放超参数(数值,默认
5.0
) -
verbose:是否显示进度信息(逻辑值,默认
TRUE
)
3.7.4 基础示例
integrated_obj <- Molo_Integrate(obj_list = list(molo1, molo2),
var_features = 3000)