猫眼思维:眼见未必为实

猫眼思维:眼见未必为实(经《思维方法高级教程》原著者朱奇先生授权 , 本人将陆续把自己研习《思维方法高级教程》的所感所悟、所摘所编在猫眼不定期刊发 , 形成《猫眼思维》系列 。 每期猫眼思维既可以独立成章 , 也可以按照时间序列系统阅读 。 愿与各位猫友共同努力 , 让猫眼成为思维科学的孵化器和播种机)(本期猫眼思维摘编自《思维方法高级教程》第四章第八节 , 标题为摘编者所加)通常情况下 , 宏观现象的外延都超出了人们直接的感知范围 , 要想用我们有限的感知能力去观察宏观现象 , 仅仅依靠感官已经不够,眼见未必为实,我们也需要掌握一些确定观察对象以及细分观察对象的专门技术 。例如 , 在早期 , 商品概念的外延仅仅包括粮、布、铁器等可数的若干类 , 每一类也只有可数的几个品种 , 我们可以全部罗列 , 悉数观察 , 寻找共同特征 。 在当代 , 商品概念的外延已达数十万个品种 , 不要说悉数观察了 , 就是罗列也罗列不完 。如果我们尚未真正认识到这种变化 , 并努力想出科学办法去应对 , 我们就会在不知不觉中犯一个大错:我们有可能会用感知到的很少一部分事物去充当更大一群事物的代表 。 如果用能感知到的很少一部分事物的共同特征做内涵 , 其外延本应该是那能感知到的这很少一部分事物 , 而我们却经常毫不犹豫地把更大一群的事物当作这个内涵的外延 。 我们毫不犹豫的理由仅仅是我们没有能力罗列那么多、观察那么多!这理由似乎正当 , 但静下心来想想就不是那么回事了 , 它顶多只是做不来的理由 , 而不是做得对的理由 。例如 , 你是一位泰国航空公司的飞行员 , 在你的生活和工作环境里交往最多的女人就是空姐 , 你观察了一个空姐 , 你发现细心温顺是她的特征 。 你又观察了你接触到的八十位空姐 , 你发现她们都有细心温顺的特征 。 这时你开始在潜意识里给这八十位空姐下定义了:除了生理特征 , 她们的内涵还包括一个共同的社会特征 , 那就是细心温柔 。 但遗憾的是 , 同样是你的那个潜意识 , 十有八九会把细心温柔的内涵毫不吝惜地给了全世界所有的空姐 , 甚至所有的女人 , 如果偶然遇见一位不那么细心温柔的空姐、女人 , 你反倒诧异!我们很清楚 , 你当然没有条件和能力去观察全世界所有的女人 , 甚至所有的空姐 , 但你不能因此就无条件地将那八十位空姐的特征当成全世界所有的空姐 , 甚至所有的女人的特征 。我们举的这个例子是生活中的小问题 , 即使你和多数人一样完全忽略这个思维错误 , 你的生活和工作也不会受到显著影响 。 但不幸的是 , 在一些重要问题上 , 类似的错误同样比比皆是 。 例如 , 在历史上的宫廷政治斗争中常见的一个词叫“清君侧” , 意思是想办法把其它政治派别的官员从皇帝身边清除掉 , 换成自己政治派别的人 。 通常情况下 , 某个政治派别“清君侧”的主要目的不是为了架空皇帝以篡夺帝位 , 而是为了控制皇帝的信息来源 , 使皇帝寻找事物共同性的归纳思维都建立在选择性信息的基础上 , 从而达到间接左右皇帝决策的目的 。 皇帝久居深宫 , 能直接感知的现象很有限 , 二手信息是他发现事物本质的主要依据 , 但他从少量二手信息出发形成的决策却有广泛影响力 。 如果皇帝接收的全部二手信息都是经过某个政治派别在众多信息中有意挑选出来的 , 那么用不着“苦谏”、“死谏” , 皇帝的决策就难免以偏概全、以点代面 , 这样的决策也就总会有利于该政治派别 。我们也承认 , 当我们实际形成概念时 , 尤其是形成涉及宏观现象的概念时 , 没有能力罗列那么多、观察那么多 , 我们每个人或多或少都有对现象选择性注意的缺陷 , 可我们必须要问:当我们的确需要用小外延去充当大外延时 , 当我们的确需要选择性注意时 , 除了上面描述的那种习惯式的做法 , 还有没有更科学一点的办法?非常幸运 , 统计学的随机抽样调查技术让我们在这个问题上向前迈出了一步 。一、统计学的几个基本概念1、调查:从统计学的角度 , 我们把对具体事物的感知、观察称作调查 。 这个概念增加了我们感知时的目的性 , 减少了感知时的随意性 。 当我们意识到我们是在做调查时 , 就会更加郑重其事地去感知事物 , 而不是走马观花和随心所欲地去感知事物 。2、调查总体:我们把需要观察的全部外延称作调查总体 。 例如中国妇女健康状况调查 , 作为中国妇女全部外延的每一个成年中国女人共同构成了调查总体 。3、普查:普查亦称全面调查 , 如果我们有条件对全部外延中的每一个具体外延进行观察和记录 , 以归纳共同特征和规律 , 我们就是在进行全面调查 。 例如人口普查、企业经营状况普查等 。4、抽样调查:如果调查总体庞大 , 我们的时间、金钱有限 , 只能选部分外延事物进行观察和记录 , 我们就是在进行抽样调查 。 进行抽样调查时所选中的那一部分外延称作样本 。 例如 , 一个企业想知道北京消费者对其新产品的评价 , 它做不到对一千多万人一一征求意见 , 它按一定标准挑选了一千人进行问卷调查 , 这种调查就是抽样调查 , 选中的那一千人就是样本 。5、总体推断:如果我们想把对样本进行观察和记录而总结出的特征和规律用于全部外延 , 我们就是在进行总体推断 。 例如企业将那一千个样本对新产品的评价当作全部北京消费者对新产品的评价 , 就是从样本出发的总体推断 。二、随机抽样技术总体推断的效果有优劣之分 , 首先可以肯定的是 , 我们前面提到的随意的、习惯性的“用小部分事物去充当更大一群的事物的代表” , 是代表性最差的总体推断 。更进一步讲 , 总体推断的优劣首先取决于样本对总体的代表性的强弱 , 而样本对总体的代表性的强弱又取决于从全部外延中选取样本的抽样技术;抽样技术分为非随机抽样和随机抽样 。非随机抽样包括任意非随机抽样、判断非随机抽样等 , 它经常导致样本对总体的代表性较弱 , 进而产生误差很大的总体推断 。 例如 , 前面例子中的泰国航空公司的飞行员 , 无意识中将自己随意接触到的八十位空姐作为全部空姐甚至全部女人的样本 , 就是任意非随机抽样 。 再如 , 前面例子中的搞“清君侧”的一帮奸臣 , 有意地将经过挑选的信息作为全部信息的样本 , 就是判断非随机抽样 。我们推荐的是更科学一些的随机抽样技术 。 与非随机抽样相比 , 随机抽样使样本对总体的代表性大大增强 , 是我们进行抽样调查时的首选 。 随机抽样技术包括简单随机抽样、等距随机抽样、分层随机抽样、分群随机抽样等 。1、简单随机抽样:标准的简单随机抽样是:先将全部外延事物编号 , 然后在数学手册中找到随机数表 , 从随机数表中的任意一个数码出发 , 按照行或列选出与拟选样本数量一样多的数码 , 与被选中的数码编号相同的那些外延事物就是选中的样本 。 这种最原始、最简单的随机抽样的一大好处是 , 每一个外延被选中的机会完全均等 , 主观意识影响选择过程的可能性完全被排除 。 前面例子中提到的泰国航空公司飞行员和“清君侧”的情形就能避免了 。后来人们发现 , 简单随机抽样虽然具有机会完全均等和排除主观影响的优点 , 但有时并不意味着所选样本的代表性最强 。 例如 , 你想调查一个学校全体五千名学生的平均身高 , 你准备抽取五十个样本 , 如果你使用简单随机抽样的方法 , 一定能排除该学校营养师人为提高身高数据以显示工作成绩的企图 , 也一定能排除长期接触高个头学生的篮球队教练凭感觉对全校平均身高的误判 , 但是 , 简单随机抽样仍不能保证五十个样本的代表性 。 如果抽取的五十个样本中四十五个都是女生怎么办?如果抽取的五十个样本中四十六个都是男生怎么办?几乎全部用男生的平均身高代表全体学生的平均身高 , 或者几乎全部用女生的平均身高代表全体学生的平均身高 , 误差真的不见得比非随机抽样小多少 。 简单随机抽样的确存在这样的可能 。 所以我们说 , 简单随机抽样虽然完全放弃了主观性 , 但取而代之的是完全由老天爷掌控的运气 , 运气不好同样不能保证样本达到理想的代表性 。经过探索 , 人们稍稍放松了一些对客观均等性的要求 , 稍稍加入了一些主观性 , 发明了分层随机抽样、分群随机抽样、等距随机抽样 。2、分层随机抽样:如果总体中的各个事物从某一个典型特征看存在明显差异 , 就先按这个特征对总体进行分层或分组 , 将准备选取的样本数量按比例分给各层或各组 , 再在各层或各组按分到的样本数进行简单随机抽样 。 例如 , 上面那所学校的五千名学生从性别特征看身高有明显差异 , 假设有三千名男生 , 二千名女生 , 即性别比为三比二 , 我们决定按照三比二的比例分配样本 , 在男生中抽取三十个样本 , 在女生中抽取二十个样本 , 总样本数仍为五十 。 算出这五十个样本的平均身高 , 用来代表五千名学生的平均身高 , 样本对总体的代表性就强 , 误差就小 。再如 , 税务部门为了提高企业所得税征收的科学性 , 需要对各个企业的可计入成本的招待费占总销售额的比率进行摸底调查 , 这样才能科学制定企业可计入成本的招待费的最高限额 , 既照顾到企业经营的需要和避免加重企业负担 , 又防止企业滥摊成本致使国家正常税收流失 。 问题是企业因规模不同 , 招待费占总销售额的比率差异明显 , 如果随机抽取的样本中小企业过多 , 调查结果就不能真实反映大企业的情况 , 反之 , 就不能真实反映小企业的情况 。 这时税务部门往往先在大、中、小企业之间分配样本数 , 再分别进行简单随机抽样 。 分配样本数的比例 , 有时是按照全部大、中、小企业的数量比例来确定 , 有时是按照大、中、小企业以往交纳税收的比例来确定 , 具有一定的主观目的性 。3、分群随机抽样:如果总体中的各个事物在地域上非常分散而调查经费和时间有限 , 或者对总体列出全部抽样编码信息非常困难 , 就先将总体按地域等标准分成若干个群体 , 然后用简单随机抽样办法抽取群体样本 , 最后在选中的群体中进行普查或进一步的抽样调查 。 例如 , 想在全国100个中等城市中选取10万人进行消费行为调查 。 如果直接做简单随机抽样 , 样本可能分布在全国各地 , 费用和时间耗费巨大 , 并且为了抽样需要对100个中等城市的全部消费者按姓名编码 , 信息采集工作繁重 。 如果我们采用分群随机抽样 , 情况就不同了 。 我们把一个城市看作一个群体样本 , 先在全国100个中等城市中用简单随机抽样办法抽取10个群体样本 , 再在这10个城市中随机抽样选取10万人作为调查样本 , 这样费用、时间、信息量都会大大减少 。4、等距随机抽样:是分层随机抽样的一种特例 , 就是先将总体的每个事物进行序列编号 , 再把编号按相同距离分成若干号码段 , 在第一号码段按简单随机抽样办法选取一个样本 , 记下这个样本在第一号码段的排序号 , 最后在其它号码段都分别选取一个与第一个样本具有同样排序号的样本 。 例如 , 我们想在100个学生中抽取10个样本 , 先把100个学生分成10个学习小组 , 每组10人 , 然后在第一组中用简单随机抽样办法抽取一人作为样本 , 比如抽到了编号为5的同学 , 最后我们就把编号为5、15、25、35、45、55、65、75、85、95的十位同学作为选取的样本 。 等距随机抽样的好处 , 一是使抽样操作简化了 , 只需在第一个号码段进行抽样操作即可;二是保证每个号码段都有一个样本代表 , 避免了样本集中于某一个号码段的可能 。


    推荐阅读