学会提问之“八、数据有没有欺骗性” |
八、数据有没有欺骗性
统计数据经常会撒谎
展示统计数据的方式可能具有欺骗性
比如王佩丰教的展示销售数据条形图时把Y轴刻度改一下,突出数据差异性
警惕不知来历的数据
数据如何产生的
平均值
总数平均
中位数
众数
还要考虑极差和每个数据出现的频率(数值分布)
例:医生给了癌症病人一个中位数10个月,意味着一半病人活不到10个月,病人将作出可怕的展望,但很可能另外一半有的能活几十年,不同的医院给出的数据可能也不同。
数据欺骗
案例:减肥药公司做的临床试验是100人中只有6人报告有副作用,然而结论是94:%的人服用后有显著的积极效果。
将结论所需数据与所给数据进行比较
或者先不看作者结论,通过作者所给数据想想可以得出什么结论,进行比较。
数据缺失
百分比与绝对数值
有54000人饱受艾滋病折磨
通过聚焦全国范围内受病痛折磨的总人数来企图引起公众对某个社会问题的关注。尽管这显然是个亟待解决的问题,但当我们将54 000除以美国的大概总人口数3亿,我们只得到一个大概2%的数值。
相对比较
知道美国内战哪一年的年轻人不到一半
这样的调查结果和20年前类似的调查得出的结果比起来又怎么样?
信息缺失
网站、杂志上的投票
一个人有多少票
随机性小,投票基于网站,排除了不懂电脑的读者
对相同数据的不同表述方式
相对风险
医药公司通常在他们的广告中使用相对风险,媒体报道也倾向于关注相对风险。
绝对风险
案例
想象一个65岁的女性刚患了中风,和她的医生一起商量治疗的方法。医生引用了三种治疗方法的相关统计数据: (1)甲种疗法可以减少33%的未来再次患中风的可能; (2)乙种疗法可以减少3%的绝对风险,从6%降低到3%; (3)丙种疗法,有94%的女性在十年里不会再患第二次中风,而没有接受这种疗法的病人有91%的人十年里不再患中风。
所有这些选择都指向同样的治疗效果,只不过是以不同的方式来表达风险而已。第一种(33%)是相对危险度降低率,如果一种疗法将心脏病的风险从100例中的9例减少到100例中的6例,风险就降低了33%,但是绝对风险的变化,从9%到6%,却只有区区3%,而疗效好的结果只是从91提升到94,也仅仅只是提高了3个百分点。当一种疗法其好处是以相对方式而不是以绝对方式表达时,个人更愿意使用这种疗法。
每天吃太多高脂肪含量的肉食品使患肠癌的概率增加了25%。 新的癌症药物的效果令人失望,数据显示乳腺癌减少的绝对值只有0.5%。
练习
第一篇
平均值的欺骗性
答案补充:横向(其他政府部门活动花费)和纵向(往年竞选活动花费)比较
第二篇
需要百分比数据
答案补充:应该拿过去家中事故发生率与现在的进行比较;被狗咬与是否待在家中没有必然关系;被电视弄伤是怎么弄伤,视力?哪里来的数据?
第三篇
相对风险
kindle标注
轮到自己写作时,专门拿出点时间来解释这些数据是怎么产生的,数据的含义,以及数据存在的局限。这样做会增加你在读者中的可信度。你在向他们表明你并不是在偷偷摸摸地向他们灌输东西。你同时也在鼓励他们成为批判性思考的人,让他们自己对数据的质量得出结论。