帮助文档与用户指南

欢迎来到 Synthetic Data Generator 的官方文档中心。本手册旨在为您配置各类统计学模块的参数提供全面指导，从而生成稳健且具备学术严谨性的虚拟数据集。

1. 总览与通用界面

主仪表板是各个模块选择的核心枢纽。用户可以在此处定义全局样本量、组别名称（如：控制组、实验组）以及跨学科的变量类型（数值型或分类变量）。

专为比较两个不同组别均值的横断面研究设计。广泛应用于临床试验（例如治疗组与安慰剂组间的疗效差异）以及社会学调查中。

用于对同一对象进行两次测量的纵向研究或交叉研究（例如：前测与后测比较）。该模块侧重于模拟配对观测值之间的均值差。

适用于比较三个或更多独立组别的均值。底层算法通过控制组内方差与组间差异的比例，精确匹配目标 F 值。

考察两个自变量（因子）对一个连续型因变量的影响。是析因设计实验中评估主效应与交互效应的必备工具。

配对 T 检验在三个及以上时间节点上的延伸拓展。极其适合长期随访的纵向研究（例如：基线、第1个月、第3个月的指标追踪）。

核心预测模型工具。它模拟一个受多个自变量 (X) 影响的连续型因变量 (Y)，自变量支持连续、分类或有序类型。

处理结局变量为二分类（如发病/未发病，存活/死亡）分类问题的核心工具。在流行病学中广泛用于危险因素筛查与识别。

生存分析领域的“金标准”。在模拟至事件发生时间 (Time-to-Event) 数据的同时纳入右删失考量，帮助研究人员评估各类协变量对生存时间的复合影响。

当数据严重偏态或不满足正态分布假设时的理想替代方案（如 Mann-Whitney U 检验）。通过秩次逻辑有效评估两组间的分布中位数差异。

作为 Kruskal-Wallis H 检验的对应模块。为三个或更多独立组别快速生成偏态的连续变量或有序分类数据。

判断两个离散型分类变量之间是否存在显著关联。是人口统计学交叉表（Cross-tabulation）分析和频率研究的最基础工具。

通过强制设定目标相关系数（r 值）和双侧显著性，模拟双变量之间的线性或单调关系（支持 Pearson 及 Spearman 算法）。

用于评估连续型检验变量在区分两种状态（如阳性 vs. 阴性诊断）时的诊断效能与准确度。