学会提问之“六、证据的效力如何” |
六、证据的效力如何
类型:直觉、个人经历、典型案例、当事人证词、专家意见、个人观察、研究报告、类比
直觉
依赖于直觉的断言需要其他类型的证据
如大量个人经历和阅读经验会在某一时刻变成直觉冒出来。经验丰富的飞行员起飞时感觉不对劲。
个人经历
容易以偏概全
天天抽烟活到99
典型案例
分散注意力,使人们不纠结于证据的价值。
优势:让人容易对某个论题感兴趣
特点:用事例细节激发听众情感(禁止开车时使用手机的一种论辩方式是说一些让人肝肠寸断的故事,都是因为开车打电话出车祸导致人死于非命)
应对:这个例子有没有代表性?有没有强有力的反例?这个例子是否存在偏见?
当事人证词
通常效力不大
常见于:商业广告、电影预告、图书封底推荐等,尤其是引述名人的话。
问题:选择性。(兼听则明,期盼心理)利益相关(当事人立场)信息不全面。人为因素(当事人看起来值得信赖)
专家意见
我们需要依赖专家:面对纷繁复杂的生活我们只能在某几个方面小有所成,而要样样精通,我们既无时间也无知识储备。
专家也会犯错
IBM主席认为电脑没有市场
一些专家比另一些靠谱
网站专业度、信誉;业界名声
关键问题:专家对这个主题了解多少;是否有渠道掌握第一手资料(《美国医学协会杂志》);专家立场,是否有利益相关,偏见(校长对于削减教育经费的看法)等。
专家说的话被多手引用,考虑原始断言的可信度。
越是有争议的观点、结论,越需要更多时间花在论据上
学术写作
期盼的证据:经过同行专家评价的研究、稳妥的研究方法得来答得民意调查、严守学术标准进行的科学研究。
如果只依靠直觉等以上几个得来理由,则要当心。
个人观察
翻译的不好,更像是witness
最可信的报道基于最近得来的观察,而且是几个人处在最佳环境里同时得来的,和事件无明显期望值,不带任何偏见。
比如证人证词,很可能对记忆加工,遗漏之类,所以这一类一般不太可靠。
观察者,不像特定的镜子,并不能给我们提供“纯粹”的观察。我们所“见”所说的都是经过一系列的价值观、偏见、态度和期望值过滤后剩下来的东西。我们见到和听到的东西都是我们愿意听到和见到的东西,我们挑选和记住的那些经历的侧面都是和我们此前的经历和背景最相符最一致的那些侧面。
研究报告
依赖科学的方法:可公开验证(其他科研人员按照同样条件可得到同样结果);可控性(使用特别程序减少犯错率,外部因素影响最小化。所以科学方法很难应用到解决复杂人类行为的很多问题中,相对物理世界太不可控);语言精确,前后一致。
研究结果的可靠性
采用了科学方法也不一定得到可靠的结果。
研究质量有高有低
很多研究结果被另一群人重新检测后发现是错误的
研究结果只能支撑结论,不能证明结论,所有的科学发现都可以找到不止一种解释方法(参见第7章,啥意思)
研究人员有自己的期望值,难免夹杂主观因素。
研究结论被引用之后被歪曲
研究结论会随着时间流逝发生改变,尤其是关于人类行为的。
鼓励孩子而不是表扬孩子
见标注。
下面的研究“事实”都在主流科学资料来源上报道过,但是都被最近的研究证据所驳倒: ·百忧解、左洛复和帕罗西汀对于大部分抑郁症患者来说医疗效果要比安慰剂好得多。 ·吃鱼肝油、锻炼身体、做智力游戏能有效抵抗老年痴呆症。 ·麻疹疫苗可引起孤独症。
研究的人为因素越多就越难将研究结论推广到外部世界
强求确定性谬误
认为一个研究结论如果不是百分百确定的话就应该被抛弃。
判断研究是否可靠
研究的来源质量如何?被同行专家评定后才被发表的期刊较为可靠,所以要看期刊的声誉如何。除了来源质量,还有没有其他线索显示这项研究质量高?报告中有没有详细说?
研究结果是否被其他研究重复验证?如果被不断重复验证正确,那就有理由相信,至少在那些反对该结论的人能提供较有说服力的证据之前,我们都要相信它。
研究时间是最近的吗?研究结果有没有可能随着时间发生改变?有关抑郁症、犯罪和心脏病对的起因在20世纪80年代可能和在2010年看起来大不相同。
研究者是否显示出有强势批判性思维?有没有研究与之观点相反的材料?还是只选择支持他的?对于支持他观点的研究有没有批判的态度?有没有进一步证明结论的意愿?
研究样本能概括多大的范围?(下一部分讨论)
样本是否被过度概括了
研究人员永远不可能对所有事件、人群无一例外地进行研究;有些抽样方法比其他的更加可取。
覆盖率大
研究1000名比100名大学生更有说服力
多样性
各种不同类型大学的不同类型学生
随机性
尽量保证所有人都有同等机会被抽取
研究人员使用的调查报告、问卷调查等有没有偏见?片面的调查报告和问卷调查在科学研究中无孔不入。
调查和问卷的回答是否可靠
得到的答案不一定反映调查对象的真实态度。
很多调查问题设计有歧义,面临多种解读
调查本身包含两个重要偏见
语境偏见
问题在问卷中的位置,呈现方式;问卷长度(如果太长,后面的问题可能不那么认真回答了)
要不要将饮酒年龄降低到21岁以下?这个问题前面一题是:选举权应不应该被赋予18岁孩子?
措辞偏见
你对总统大张旗鼓推行医改式的社会主义有什么看法
你对总统的医改尝试,即覆盖人群更广、成本更低的医疗体系什么看法?
调查和问卷应当被当成较好的证据。但要注意不要在调查范围之外过多概括;有些调查声誉更高,调查质量越高,越有说服力。仔细盘查调查的程序在接受调查的结果,可以做出自己的合理概括。
研究进行的客观条件和研究者所描述的条件是否吻合?研究结果有没有被歪曲?
研究人员的立场?利益相关?
类比
用两件事物之间熟知的相似点作为基础,推导出关于其中一件的一个相对未知特征的结论。
它们让人们更容易联想到某个论题,因此对它产生更加浓厚的兴趣。
例子
伊拉克战争:支持者将其比作第二次世界大战,反对者将其比作越南战争。
隐含假设
我们需要解释的事物与被拿来作比较的事物在很多方面都很相似,那么它在其他重要方面也会相似。
关注两个因素
两个事物相同和相异的点
相同点和不同点之间的关联
通常相关的相同点比相关的不通电所占的比例越大,类比的效力越高。
练习
根本没必要害怕互联网会让报纸和杂志消失。不管怎么说,冷冻快餐的风行也并没有让下厨烧饭这个传统消失。
我跟作者观点不同,我认为问题在于类比的词性都变了
作为教育工作者,早点清除问题学生并处理好他们带来的问题是很重要的,因为一格臭鸡蛋往往会弄糟一整块鸡蛋饼。
臭鸡蛋一定会毁了任何一起的东西,但学生对班级的影响却不好预测。
练习
第一篇
证据类型:问卷调查
随机性不够;覆盖范围不足以过度概括
答案补充:酒鬼的明确定义,具体标准是什么?自我评定主观性太强
第二篇
类比
为什么法律系的学生参加难度极大的考试不允许使用手提电脑?律师都能使用电脑来查阅棘手案件的相关信息啊
考试使用电脑很多都是有答案的,相当于没有思考,律师查资料是为了辅助自己的论证。
答案:相同点是都涉及利用电脑查找难题的答案,不同是参加考试的学生正在被测试他们本该不借助任何外部帮助而能顺利掌握的那些知识。
第三篇
问卷
样本太少(75人)过度概括;覆盖范围小(得克萨斯州的一家饭店);问题有措辞谬误(将亵渎国旗定义为反美思想了,不允许不同解读方式)
kindle标注
从某种意义上说,所有类比都是错误的,因为它们做出了错误的假设:两样东西在一两个方面有相似之处,它们在其他重要方面也必然会有相似之处。也许你还是认为类比质量有高有低,有些类比经不起推敲,有些类比经得起考验,但即使最好的类比所提供的也只是暗示。因此,如果一个作者通过与另一件事作对比来得出一件事的结论,那么他就应该提供进一步的证据来支撑两者间最重要的相似点揭示出的具体原则。
对许多看法而言,总是没有足够的证据来彻底干脆地证实或是驳倒它们。例如,很多证据都证实“每隔一天服用一片阿司匹林可以减少患心脏病的风险”这个断言,虽然同时也有一些其他的证据可以反驳这一断言。在这种情况下,我们就需要判断,证据数量上的优势到底在哪边,这样我们才能决定这一事实断言的可靠程度如何。
比起要详细说出一套又一套复杂的内因和外因导致了一个人大发脾气,诸如人际关系出现的种种问题、父母对他的强化训练、孤立无援的感觉、睡眠不足和生活中的紧张刺激等因素,我们干脆简单地说那个人脾气不好,或者那个人是好与人为敌。这样的解释过于简化问题,阻碍我们找到更富有洞察力的理解。
面对纷繁复杂的生活我们只能在某几个方面小有所成,而要样样精通,我们既无时间也无知识储备。