免费医学统计软件——医统无忧智能统计软件（两组间比较：两独立样本t检验

Good · 发表于 2022-10-24 07:00:55

医统无忧智能统计软件（两组间比较）操作说明和结果解读
刘青梅、张志侨研究团队

复制代码

“医统无忧智能统计软件”是一个免费医学统计分析软件，主要用于完成两组间基线数据t检验、非参数比较和卡方检验。
在临床科研中，两组间基线数据的比较是最常见的统计分析需求。绝大部分的科研文章中的第一个表格往往就是两组间基线数据比较分析表。两组间基线数据比较分析的常见方法包括t检验、非参数比较和卡方检验等统计分析方法。上述统计方法对于数据的正态性和方差齐性有着不同的要求。
我们的研究团队基于以下几个原因开发了“医统无忧智能统计软件”：（1）对于部分基层医院的科研人员来说，正确理解这些统计方法的应用场景要求并规范完成统计分析并不是一个容易的事情。错误应用统计方法可能严重影响研究的质量，并导致研究者花费时间精力来反复修改文章；（2）两组间基线数据统计分析虽然可以通过R语言、STATA或Python程序完成，但这些程序语言需要使用者对编程语言（R语言、STATA或Python）有一定程度的了解，且需要花一定的时间撰写程序语言才能够完成两组间基线数据比较分析；（3）对于探索性研究来说，研究者往往需要更换不同的分组变量，或更换不同的研究数据集，或采用不同的截断值将连续变量转换为二分类分组变量。对于普通研究者来说，花费5-10个小时完成两组间基线数据的比较分析是一个很常见的状态；（4）在科研诚信、数据溯源和研究可重复验证的大背景下，研究者可能会被要求在数年后重新验证多年前的统计分析过程。没有标准化的操作和完成的数据资料保存将无法达到数据溯源和研究可重复验证的要求。综上，我们的研究团队为科研人员开发了“医统无忧智能统计软件”。
“医统无忧智能统计软件”具有下列优点：（1）高效省时：预计可为研究者节省5-10个小时。“医统无忧智能统计软件”仅需30秒就能够完成常规5-10小时的统计分析工作，能够帮助研究者节省大量的宝贵研究时间；（2）有效溯源和可重复验证。本软件采用“一站式集成、模块化运行、标准化操作、路径式保存”四大理念，操作功能齐全，操作功能简易，操作结果易于编辑，操作过程透明可回溯，能够有效帮助研究者应对数据溯源和研究可重复验证的检查；（3）为探索性研究提供助力。本软件可将连续变量根据设定的截断值转换为二分类分组变量并自动保存修改后数据集，对于探索性研究来说具有很好的应用价值，能够有效帮助研究者开展深入的探索研究。
医统无忧智能统计软件操作说明和结果解读如下：
1、采用医统无忧智能统计软件执行两组间比较分析时，首先需要界定某一列数据的属性是“分类变量（或字符型变量）”还是“连续变量（或数值型变量）”。
2、当一列变量中含有字符（如汉字/英文字母/符号）时，该变量会被医统无忧智能统计软件默认为分类变量，并默认采用卡方列联表进行两组间比较。
3、当一列变量只有数字（即不包含任何汉字/英文字母/符号）时，此变量可以由用户自行界定其属性（即定义为分类变量或连续变量）。对于连续变量（或数值型变量），高级功能版本还可以设定不同的截断值，从而将该变量转变为二分类变量（即大于等于截断值的数值转换为1，小于截断值的数值转换为0）。
4、对于分类变量，医统无忧智能统计软件常规采用卡方列联表进行两组间比较，并采用频数（百分比）对分类变量的分布进行描述。P < 0.05提示两组间该分类变量的差异有统计学意义。
5、采用卡方列联表比较时，各格中的理论频数不应小于1，且1≤理论频数≤5的格子数不应超过格子总数的20%（含20%）。如果不符合上述应用条件，可以考虑采用下列方法解决问题：（1）增加样本总量，从而使每一个格子的理论频数符合上述条件；（2）根据专业知识，考虑是否能够删去理论频数太小的行或列，或合并临近的行或列；（3）采用SAS软件执行双向无序R*C表资料的Fisher确切概率法[1]。
6、对于连续变量，医统无忧智能统计软件首先会分析连续变量的正态性和方差齐性的情况。当连续变量符合正态分布（P > 0.05）且方差齐性（P > 0.05）的要求时，医统无忧智能统计软件采用两独立样本t检验进行两组间比较，并采用均数±标准差对连续变量的分布进行描述；当连续变量不符合上述条件时，医统无忧智能统计软件将采用Mann-Whitney U test非参数检验法进行两组间比较，并采用中位值（第1百分位数，第3百分位数）对连续变量的分布进行描述。
7、两组间比较结果解读：P < 0.05提示两组间该连续变量的差异有统计学意义。
参考文献：
[1]孙振球，徐勇勇.医学统计学（第3版）.人民卫生出版社
数据录入、清洗和基线数据信息汇总表解读
1、医统无忧智能统计软件遵循可溯源、可验证的科研原则，对每一步分析的输入数据和输出结果都会保存以备用户满足不同部门的溯源查验要求。
2、数据输入格式要求病人ID为行（即每一行代表一个病人），自变量为列（即每一列代表一个自变量）。
3、点击导入数据后，医统无忧智能统计软件会自动对所有的列数据进行分析，并计算下列结果：“数据类型”、“初始变量属性”、“有无缺失值”、“缺失值个数”、“缺失值百分率(%)”、“有效样本个数”、“单纯数值的个数”、“单纯非数值的个数”、“唯一值个数”、“第75百分位数加1.5倍IQR”、“最大值”、“第99百分位数”、“第75百分位数”、“平均值”、“中位值”、“四分位数间距”、“第25百分位数”、“第1百分位数”、“最小值”、“第25百分位数减1.5倍IQR”、“最终变量属性”、“频次排名倒数第一的变量次数”、“频次排名倒数第二的变量次数”、“频次排名倒数第一的变量值”、“频次排名倒数第二的变量值”。
4、请注意“最大值”、“第75百分位数加1.5倍IQR”、“最小值”和“第25百分位数减1.5倍IQR”，并考虑连续变量中是否存在离群值？是否需要对离群值进行处理？医统无忧智能统计软件支持用户在数据输入框中直接对离群值进行处理，并会自动保存用户修改后的数据集，以备将来进行数据的溯源和统计过程的重复验证。
5、请注意“频次排名倒数第一的变量次数”、“频次排名倒数第二的变量次数”、“频次排名倒数第一的变量值”和“频次排名倒数第二的变量值”。这四列结果出现异常往往提示原始数据的输入过程中可能误输了异常值（比如在连续性数值变量中输入了汉字/英文字母/符号等），此时往往需要用户进行手工校正。医统无忧智能统计软件支持用户在数据输入框中直接对异常值进行处理，并会自动保存用户修改后的数据集，以备将来进行数据的溯源和统计过程的重复验证。
6、当缺失值比例超过10%时，用户应认真检查原始数据并进行处理。医统无忧智能统计软件可以对缺失值进行填补，分类变量采用最高频数的值进行填补，连续变量采用均值进行填补。
7、下载软件、报告程序bug及更多问题请扫描下方二维码联系开发团队

来源：https://blog.csdn.net/weixin_44057357/article/details/121501237
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			注册[Register]

免费医学统计软件——医统无忧智能统计软件（两组间比较：两独立样本t检验

个人中心