Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 2|回復: 0

撰写文章时要避免的统计错误

[複製鏈接]

2

主題

2

帖子

8

積分

新手上路

Rank: 1

積分
8
發表於 2023-12-27 18:07:59 | 顯示全部樓層 |閱讀模式
科学的使命是理解和解释现实。但是,由于其不可通约的维度,我们需要进行实验来观察受控情况下会发生什么。我们从数据的统计分析以及对数据的解释中获得结论,这使我们能够识别关系、差异、模式或趋势。这样,人类、研究者就可以部分地理解“真相”。因此,统计数据远非像许多人认为的那样是不必要的,而是我们科学世界的重要工具。 统计数据……被误解的是 尽管统计学在任何科学分支(社会科学和纯科学)中都具有明显的重要性,但它始终像丑陋的姐妹一样。它不受欢迎。如今,有许多软件和计算机程序能够进行复杂的统计分析,因此有些人对此更加不重视,因为他们认为“他们不需要理解它或知道如何应用它”。然而,研究人员有必要掌握一些基本的统计学概念,才能正确解释结果并最终得出我们所寻求的科学真理。 (可悲的是)常见错误 本文作者之一的实验室于 2019 年 10 月发表,使用以下列表作为模板来识别与该小组期刊俱乐部统计分析相关的最常见错误。事实上,日记俱乐部是认识这些错误的最佳训练。当我们作为手稿的作者时,这也将是避免它们的第一步。 对照组缺席/不足 使用良好的对照组旨在避免操作本身造成的影响,例如外科手术或物质接种。即使在社会学研究中,我们在上一篇文章中已经提到过的潜在山楂效应也必须通过使用控制来最小化。这是一个非常严重的错误,极大地削弱了任何研究的结论。 解释两种效果之间的比较,而不直接比较它们 另一个常见错误是在没有对各组进行统计比较的情况下推断两个不同组的效果更大或更小。只有直接分析两组时才能评估这种效果。一般来说,这个错误是由于所选择的统计分析选择不当造成的。 分析单位的“膨胀” 分析单位是“可以随机且独立分配的最小观察值,即可以自由变化的独立值的数量”,正如 eLife 文章中所解释的那样。在科学研究中,有必要详细说明各组之间的差异和/或澄清在什么条件下将它们分组。

有时,研究人员会修改实验单位的概念,这意味着我们从分析中得出的结论可能会存在错误。 虚假相关性 可以说,当变量之间出现线性关系(但不一定如此)时,就会出现虚假相关性,并且两个变量都可能受到第三个未 电报号码数据 评估因素的影响。例如,由于异常值的影响,会出现虚假相关性。 使用小样本 样本量非常重要,主要是样本量越小,犯假阴性的概率就越大,即II型错误/β型错误。此外,当样本量较小时,分布可能不呈正态,了解这一点对于选择适当的统计分析非常重要。 循环分析 这是许多研究人员由于粗心而经常犯的错误。循环分析是我们回顾性地选择数据特征的任何分析。它是一种有意无意地“操纵”数据的形式,会导致统计结果出现错误。避免这种情况非常重要。 “p-hacking”或分析的灵活性 简而言之,这是操纵数据的另一种方式,既通过修改 p 值,又通过使用许多不同类型的分析来实现误报(请记住,统计数据基本上基于概率)。检查此链接可轻松全面地了解 p 值。 不校正多重比较 它通常与探索性分析相关(同样,分析的灵活性),其中“探索”许多条件对多个变量的影响。由于每个统计分析都涉及错误,无论错误有多小,在统计分析中使用多个变量都会导致更高的错误概率。例如,它们相对容易导致误报(I 型错误/α 型错误)。 关于非显着性结果的解释 这意味着,仅凭 p 值,无法确定我们没有发现统计上显着差异的事实是因为它们实际上不存在,还是因为我们无法检测到它们,例如,用大小样本不足,正如我们在第 5 点中看到的那样。需要进一步研究来详细说明为什么结果不显着。 相关性和因果关系 它认为,由于两个变量显着相关,因此一个变量必然是另一个变量的原因。与虚假相关一样,必须分析其他因素以评估两个相关变量之间是否存在因果关系。相关性并不意味着因果关系 还有一些错误 在科学界中,还存在或多或少出现的其他统计错误。他们之中有一些是: 不正确的抽样:我们已经提到过小样本的问题。然而,另一个错误是选择有偏差的样本,它不能代表我们的总体,因此,我们无法获得可以外推到整个总体的结论。



缺乏统计分析/数据表述不当:虽然越来越少见,但仍然有必要强调统计数据及其在科学文章中正确表述的必要性,以便正确理解和解释。 伪复制:它本身不是错误,但与错误号 3 有关。碰巧,当测量被复制但不是独立的时,它们不能被视为独立的,而是必须将单位考虑在内先前定义的帐户是实验性的。 这些错误是由于什么原因造成的呢? 《自然》杂志的一位作者表示,原因可能如下: 出版物的数量和积极成果的价值远高于严谨性。一篇带有负面结果的文章发表的机会很小,这可能会导致研究人员不惜一切代价试图获得正面结果。 假设扎实而强大的科学具有吸引力。有时,除了方法论之外,还需要更长的文章来解释统计分析、复制等中使用的所有工具。但当然,这对读者来说并不“性感”。 告诉作者他们犯了一个错误并不是一件令人愉快的事情,尤其是当作品已经被接受的时候。 在我看来,这些推理忽略了一些基本的东西,那就是研究人员本身工作中的道德规范。但是,抛开意见不谈,我们能做些什么来避免犯这些错误呢? 避免统计错误的策略 培训和信息:虽然不一定要知道确切的统计计算是什么,但了解它们的组成以及针对每种情况最合适的统计分析是什么是非常有必要的。我们有责任了解我们拥有的工具,并能够选择最合适、最符合我们的调查的工具。 良好的实验设计:首先,我们必须确定我们的科学问题以及我们将如何回答这些问题。重要的是要知道我们的问题和对照组是什么,清楚地定义每种情况下的实验单位,确定得出结论所需的样本量,确定将分析哪些变量以及如何分析它们。 谨慎分析:获取异常值可能会出现问题。需要谨慎对待这些数据,不要轻易删除或忽视。考虑到假定因果关系的相关性,在第一种情况下考虑新变量是非常有必要的。 透明解释:排除异常值,多重比较必须在稿件中明确解释并证明合理。同样,我们必须记住,如果我们想确定其不显着的原因,则对不显着数据的解释将需要额外的分析。 结论 统计分析对于解释《科学》中获得的结果具有决定性作用,因此,研究人员对这些结果进行培训和了解并避免错误至关重要,因为错误会导致不确定的结论,并违背我们的意愿使我们疏远。 ,我们如此渴望的“科学真理”。


回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

QQ|Archiver|手機版|自動贊助|图片情报站

GMT+8, 2025-4-5 20:04 , Processed in 0.035151 second(s), 18 queries .

抗攻擊 by GameHost X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |