被试者|参加入职“人格测试”,很遗憾,答案越普通越正确( 五 )
本文插图
电影《面试》(Job Interview 2013)剧照 。
人格测试问题设计的尴尬:“喜欢读书 , 就是不爱社交吗?”
到目前为止 , 我们一直都在谈论测试人员如何阐释测试结果 , 下面我们再一起来看一下那些测试问题 。 测试问题能否免受人们价值观的干扰?在设计问题时 , 测试者不可避免地会受到其所在特定世界的习俗和价值观的影响 。
这方面的一个例子就是那些用来评估社交能力的问题 。 你读书吗?在某些群体中 , 阅读是一种不爱社交的行为 , 如果一个人承认自己有时选择读书而不是和同伴一起 , 他就有可能是一个内向者 。 然而 , 问题是相对的 。
如果在一个人成长的环境里阅读是一件非常正常的事情
(实际上 , 这在许多社交谈话中都是一个很好的话题)
, 那么隐藏在测试里的“价值观”就会对此给出一种完全不同的判断结果 。 人们并不总是会以同样的方式去进行社交 。 一个选择读书而不是和同伴打保龄球的人可能会被人评价为不爱社交 , 然而 , 事实上 , 他却很有可能是一个非常外向的人 。 他只是碰巧不喜欢打保龄球而已 。
本文插图
纪录片《书谜》(The Secret Life of Books Season , 2014)剧照 。
当门外汉被问题的含义弄得晕头转向时 , 测试人员有时会报以高深莫测的一笑 , 说这些不过是“表面效度” 。 他们认为 , 测试问题便于被试者理解固然是好 , 但是 , 如果有很多人在一段时间里都对问题进行了回答 , 那么问题本身也就变得没有那么重要了 。
换句话说 , 如果100个满意的主管都以相似的方式对一个特定问题给出了回答 , 那么这件事情就有了意义;因此 , 无论问题本身是否有意义 , 它都会产生一个有意义的相关系数 。
有人可能会问了:你所说的这些到底是什么意思?这里不是写一篇统计学论文的地方 , 我只想对那些让人印象深刻的测试图表和表格提出一点看法 , 谈谈它们是如何让人们忘记了常识 。
事实上 , 有很大一部分数学运算都是内部的——也就是说 , 它们是测试结果与测试结果之间的比较 , 而不是测试结果与外部证据之间的比较 。 现在 , 这种内部数学在确定测试的“可靠性”方面很有价值 。
例如 , 如果一组人参加了测试中的表格B测试 , 并且数学相关性显示他们的百分位数排名与他们参加同一测试中的表格A测试时一样 , 我们就认为这个测试在测量事物时是可靠的 。
然而 , 测试的可靠性很少会告诉我们它的有效性 。 除非它们确实测量了需要测量的特质 , 否则测试结果的一致性再高也是毫无意义 。 这些测试衡量的是社交能力、内向性或神经质倾向 , 还是仅仅衡量了一堆关于灭火或者喜欢阅读书籍这一类问题各项答案的选择次数?
要想表明测试有效 , 测试分数必须与被试者的后续行为相关 。 然而 , 当你去检查很多测试的有效性证据时 , 你会发现 , 它们主要展现的是特定测试的平均得分与其他人测试的平均得分有多么接近 。 因而 , 测试分数之间有相关性并不奇怪 。 测试题目的编写者在编写试题时经常互相借鉴
(其中有些试题会在多达10~12个不同的测试中出现)
, 这种相关性在很大程度上证实了测试领域存在的一些乱象 。
测试分数与行为的相关性:若干怀疑
那么 , 测试分数与行为的相关性究竟有几分呢?这里我们以本罗特人格量表
(Bernreuter Personality Inventory)
为例 。 这是迄今为止在商业领域得到最广泛应用的一种测试
(斯坦福大学出版社作为这一量表的经销商之一在1953年售出了100万份)
推荐阅读
- 迪丽热巴 |张艺兴情商有多高?热巴加入极挑后,他再也没说过这句口头禅
- 明星八卦|一手好牌被打烂?邓伦被曝加入《这就是灌篮3》,综艺已盖过演戏
- 烹饪|家常菜:油炸花生米,加入这两样,就变得满口香,不回软,一直脆
- 烹饪|炖鸡时,有人焯水,有人直接炖,老厨子:教你1招,鸡肉更加入味!
- 健身|坚持健身的4大好处,保准你看完会心动,想加入健身的行列
- 交通卡|「厦门 e 通卡」加入 Apple Pay 交通卡,免费开卡全国超百座城市可用
- 穿搭|Nicole Miller混搭中加入了波西米亚风和法式少女风
- 微云展资源平台|【追捧】品牌加入微云展平台,2020一起嗨!
- 爱旅行爱摄影|原来新都桥的景色,竟如此动人
- 爱旅行爱摄影|人少景美,这才是八月值得去的旅行地
