news 2026/5/30 19:47:52

统计学中“in sample test”与“out of sample”有何区别?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
统计学中“in sample test”与“out of sample”有何区别?

源自风暴统计网:一键统计分析与绘图的网站

今天在一篇因果推断SCI论文中,看到一个词out of sample,翻译为各模型在所有处理和结局变量下的样本外 AUC 和 MSE。这是何意?“in sample test”与“out of sample”有何区别?

在统计学和数据分析中,“in sample”测试和“out of sample”测试是两种重要的测试方法,它们用于评估模型的性能和预测能力。

“In sample”测试使用模型训练时所用的相同数据集来进行测试,这意味着它使用那些已被用来创建模型的数据来评估模型的性能。

然而,这种测试方法可能导致模型过度拟合,即模型在训练数据上的表现很好,但在实际应用中可能表现不佳。过度拟合的一个原因是,模型可能已经“记住”了数据集中的噪声和异常值,这使得评估结果过于乐观。

相比之下,“Out of sample”测试使用与模型训练时不同的数据集来进行测试。通常,这个新的数据集在模型创建时是不可用的,因此也被称作“独立”或“验证”集。

这种测试方法可以更好地评估模型的泛化能力,即模型对新数据的预测能力。由于使用了独立的数据集,模型没有机会“记住”这些数据,因此评估结果更能反映模型的泛化能力。

在实际应用中,为了确保模型的稳定性和可靠性,通常会同时进行“in sample”和“out of sample”测试。这样可以更全面地了解模型的性能。然而,由于“out of sample”测试使用了独立的数据集,它被认为是一种更准确的评估方法,因为它能更准确地预测模型在实际使用中的表现。

讲到这里,是不是又觉得很熟悉,其实就是内部验证集和外部验证集的区别,换了个说法。

总之,“in sample”测试和“out of sample”测试都是评估模型性能的重要方法。尽管它们在使用和评估准确性方面存在差异,但“out of sample”测试因其使用独立数据集而被认为是更准确的方法。


关于郑老师团队及公众号

学统计就找郑老师团队,我们有全面的医学统计课程!

1.医院临床数据分析课程

临床试验(RCT)研究设计与数据分析;临床预测模型和基于R语言/Python的机器学习方法在临床预测模型中的应用(附赠全套代码);医院回顾性数据与真实世界临床研究,涵盖目标模拟试验(模拟RCT)、缺失数据填补下真实世界研究、倾向性评分方法(包括倾向性得分匹配、逆概率加权,重叠加权)等

2.纵向数据分析课程

重复测量资料分析方法培训;轨迹模型在纵向数据分析中的深度应用(全套R代码奉送)

3.公共数据库挖掘与分析课程

NHANES(美国国家健康和营养检查)公共数据库、GBD(全球疾病负担)公共数据库、七大老年健康数据库挖掘与分析课程;孟德尔随机化方法快速发表SCI初级班、高级班以及进阶攻略:整合网络药理学&单细胞测序

4.其他课程

零基础两天学会R语言;Meta分析培训课程,包含网状Meta内容;量表与中介研究数据分析培训班

26年预开课程:

剂量反应网状Meta分析(DR-NMA)、缺失数据预测模型、时依协变量模型与多状态模型在纵向数据中的应用、高级倾向性评分课程、机器学习在医学影像图片数据中的应用、HRS数据库应用与分析

需以上统计课程,请联系郑老师团队(微信:aq566665)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 16:19:23

ThinkPad风扇控制终极指南:5步实现静音与性能完美平衡

ThinkPad风扇控制终极指南:5步实现静音与性能完美平衡 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 ThinkPad用户经常会遇到这样的困扰:在需要…

作者头像 李华
网站建设 2026/5/30 16:19:11

基于YOLO系列的人脸表情识别系统:从原理到实现的完整指南

摘要 人脸表情识别是计算机视觉领域的重要研究方向,在情感计算、人机交互、心理健康评估等领域具有广泛应用。本文详细介绍了基于YOLOv5、YOLOv6、YOLOv7和YOLOv8架构的人脸表情识别系统的完整实现方案。我们将深入探讨系统架构设计、数据集处理、模型训练优化以及PySide6图形…

作者头像 李华
网站建设 2026/5/28 4:51:09

HuggingFace镜像网站部署IndexTTS 2.0全流程操作手册

HuggingFace镜像网站部署IndexTTS 2.0全流程操作手册 在短视频、虚拟主播和AIGC内容爆发的今天,语音合成已不再是“能说话就行”的基础功能,而是需要精准对齐画面节奏、表达细腻情绪、复现真实声线的关键生产环节。然而,大多数开源TTS模型仍…

作者头像 李华
网站建设 2026/5/24 22:13:52

在Windows系统中完全启用MacBook Pro Touch Bar显示功能终极指南

您是否在Windows系统下使用MacBook Pro时,发现Touch Bar只能显示简单的亮度调节和音量控制?这确实是困扰众多双系统用户的技术痛点。今天,我们将为您揭秘如何通过开源驱动完美解锁Touch Bar的全部显示潜力。 【免费下载链接】DFRDisplayKm Wi…

作者头像 李华
网站建设 2026/5/29 21:59:46

安卓设备HID协议深度解析:从系统底层实现万能键盘鼠标模拟

安卓设备HID协议深度解析:从系统底层实现万能键盘鼠标模拟 【免费下载链接】android-hid-client Android app that allows you to use your phone as a keyboard and mouse WITHOUT any software on the other end (Requires root) 项目地址: https://gitcode.com…

作者头像 李华
网站建设 2026/5/20 12:26:34

通用显示器校准教程 验证显示器Win自带工具

以下是通用显示器校准教程(适用于 Windows/macOS,含系统工具 专业工具两种方案):方案 1:系统自带工具校准(免费,基础实用)步骤 1:准备工作关闭显示器的 “动态对比度&am…

作者头像 李华