第九章韦伯定律_心理物理学纲要(费希纳)

第九章韦伯定律

(快捷键←)[上一章] [回目录] [下一章](快捷键→)

我在第七章中描述的以韦伯命名的定律，总体上看可谓是心理测量的基础之一，接下来我将详细地——在已有研究结果的基础之上——讨论该定律的宗旨、基础和局限。

该定律有多种不同的表述方式，但它们的基本内涵是一致的。依照情况的不同，其中总会有一种表述方式可能更具参考价值和实用性。

第一种表述方式是：如果两个刺激（或是从某一个刺激上增加或减少一定量之后与原刺激相比）的大小比例（或是增加或减少的刺激量相对于原刺激大小的比例）一定，那么无论这两个刺激的绝对大小是多大，它们之间的差异会被感受为是相同的，或者是产生了同样的差异或增量的感受。举例来说，对一个100单位大小的刺激增加1单位的刺激量，对一个200单位大小的刺激增加2单位的刺激量，对一个300单位大小的刺激增加3单位的刺激量，依此类推，这些情况下造成的差异感受是一样的。

第二种表述方式和第一种意义相同但更简练：只要相对刺激差异或相对刺激增量保持不变，那么其造成的感受差异或增量也相同；如果刺激的比率保持不变，那么它们引起的感受差异或增量也相同。有人可能会想到，在之前我曾说过，刺激的相对差异或相对增量一定的话，刺激的比率也就自动确定了，反之亦然。根据这点，就可以使用后一种对定律的表述方式来代替前一种。

最后，结合第六章里的差别感受性的抽象定义，我们可以这样表述韦伯定律：简单差别感受性与差别成分的大小成反比；相对差别感受性则与差别成分的大小无关。

可以从集中感受和广延感受两方面来验证韦伯定律。关于前者，可以从强度和音高（代表声音品质中量的方面）的角度来验证，但不能理所当然地认为在某个特定领域内验证了定律，就能推广到另一个领域内。而是必须在每个领域内各自采取特定的研究方法来验证。

为了确认从广延感受的角度能够验证韦伯定律，首先要根据定律中的公式，将眼可视、手可触的刺激和刺激差异，替换为感觉大小和差异的程度。如果能够发现一些现象，例如，两根线段的长度刚刚能被发现不同，或者更笼统地说感觉上去几乎一样长时，如果将它们的长度各增长一倍，那么根据韦伯定律，差异的感受应当是不变的。

在研究声音的音高时，振动的频率代表了刺激的大小。

如果韦伯定律是正确的，那么其推论也应该是正确的。因此，通过实验验证定律的推论，也可视为对定律证明的一部分。我不会抽象地讨论这个问题，而是会通过不同领域内的具体案例来进行验证，并且重点会使用来自视觉感受方面的例子。

我已经提到过，就历史而言，虽然韦伯并不是将这个定律公式化并验证的第一人，但他却无疑是给予了该定律一定的普遍性，确认了该定律，并且证明了该定律值得引起普遍关注的第一人。他的理论基于对重量、长度和音高最小可觉差的实验研究，可能大家会注意到，这些研究恰恰对应了人类感受的三种主要元素：强度、区间和品质。因为这三者涵盖了我们所能考虑到的所有方面，所以我们完全有理由使用韦伯之名来命名该定律。虽然对于这一研究只是出于一时的兴趣，韦伯本人没有对该定律进行十分深入的研究，但他的工作毫无疑问给后来的实验者们指明了攻关的方向。因此在更深入地讨论韦伯定律之前，我将逐字引用他的陈述。只有在说明韦伯定律形成了心理测量的基础后，当前的研究才显得很有必要。这一基础必须加强和扩大，使其可以支持更多更复杂的观察。由于这一定律对于我们目前的相关工作具有重要的基础性意义，因此我将在我所知的范围内，尽可能多地陈述与该定律有关的过去和当代、他人或我本人的研究发现，这将关乎该定律的确认和限制问题。

在经过初步的调查之后，我必须承认我们还没有完全证明韦伯定律，更不用说对它进行彻底的证实。这个领域内大多数的研究工作都是关于集中视觉感受、声音响度和音高感受、重量感受和视觉距离判断的。显然这个定律在任何情况下多多少少都广泛存在着限制。在温度感受方面韦伯定律的适用性仍然存在疑问。在广延触觉感受范围内，许多实验结果并不支持韦伯定律的有效性。而在其他感觉的研究领域内，尚未有相关的实验报告。

韦伯本人的工作

韦伯在他的一篇关于触觉和一般敏感性的论文里，笼统地提到了与韦伯定律相关的事实，具体内容题为《关于我们的触觉可以分辨出的最小重量差异、视觉可以分辨出的线段的最小长度差异以及耳朵可以分辨出的最小音调差异》。随后，在介绍了一些特殊的测定过程之后，他继续写道：

我已经说过，同样的结果在重量判断实验中也能被复制，无论增加的重量是一盎司还是半盎司，这都并不重要。重要的只是增加的重量与要比较的重量的比例是1/30还是1/50。同样的情况也出现在两条线段长度的比较和两个音调音高的比较中。[1]在比较线段长度时，如果要比较的两根线段是先后而不是同时呈现，只要在前一种情况下两条线段的长度差是后一种情况的两倍，那么要比较线段的绝对长度是1英寸还是2英寸并不重要。因为实际上如果当两根线段之间距离很近并且相互平行时，仅仅对照线段的末端，比较某根线段超出另一根的部分，就可以确定两根线段的长度关系。在这种情况下最重要的因素就是超出部分的绝对长度以及两根线段之间间隔的距离。在比较音调高低时也是这样的，因为我们很难分辨在音调系列中最后几个音的细微差异，所以只要比较的两个音调不排在最后，那么音调的绝对高低是高七度还是低七度并不重要。两个音调之间相差的振动频率也不重要，只有要比较的音调振动频率的比值才最重要……

判断的关键是对总量比率的感知，而不用对小规模的数量进行测量，也无需关于绝对差异的认识，这是一种很有趣的心理现象。在聆听音乐时，我们知觉的是音调的比率，而不用知道振动的频率；在欣赏建筑时，我们感受的是空间的比例，而不用去测量具体的长度是多少英寸；同样我们在重量大小的比较过程中，也是这样来判断感受性的大小的。

考虑到韦伯是基于经验得出了他的定律，所以我们只能对各种音调以及线段之间的关系进行大概的描述。但是我们可以从韦伯仔细的观察中，得知他绝对是一个可靠的实验者。关于重量的关系，我们可以从韦伯《收集的程序》（pp.81,86 ff.）中了解他的实验。

韦伯区分出了两种实验模式。第一种实验模式仅仅是将双手平放在桌面上，然后将一轻一重两个物体分别置于手中，观察压力下触觉的表现；第二种实验模式不仅可以凭压力做判断，同时也可以用手托起重物，凭借肌肉觉来感受重量的大小。其中，我们设计了两种物体重量条件，分别是32盎司以及32打兰作为较重物体的重量，无论是哪种重量条件，在两种实验模式中，最小可觉差与较轻重量的数值关系实际上都是一样的。在第一种实验模式下，四名被试对两种重量条件的平均最小可觉差是10.1（盎司或打兰），在第二种实验模式下的平均最小可觉差是3.0（盎司或打兰）。

更多细节可以参考以下韦伯本人对实验的描述（progr.coll.，p.86）：

几个人将双手放置在桌面上，之后我各放一张纸在他们的两只手上，纸上面各放置2磅重的物体。之后，我在他们不知情的情况下减轻了其中一只手上的重量，然后交换了双手上的物体，即将较轻的那个物体从一只手换到了另一只手。我会不断地移除手上的物体并且更换它们的位置，这样就能使被试无法猜测哪只手上放过更重的物体，而只能通过触觉来进行判断。如果在重复测试和频繁更替物体位置的过程中，被试能够正确地区别出哪只手上的物体重哪只手上的物体轻，我就会做一次记录。

之后我在同样的一批人身上进行了相同的实验，和上面的实验不同的是，这次他们可以用手托起物体并感受其重量。之后，我会不断地从小到大调整两个物体之间的重量差异，直到被试从犹豫不决两个物体孰轻孰重到能够完全进行确定的判断时，我就做一次记录，然后计算重量的差异，最后我比较了各次结果的数字。

在介绍完了几个实验系列的结果之后，韦伯还提到了定律之外的数据关系，他继续写道：

我们不能忽略其他的一些实验，它们证明了当通过触觉和肌肉觉来进行判断时，即使双手上的物体很轻，计算出的差异比率，也能跟2磅或32盎司的重量分别放置在双手上时的差异比率一样。一开始我分别在被试的双手上分别放置32盎司的物体，后来将物体重量变更为32打兰（即先前重量的1/8）[2]。虽然我估计被试在前一种情况下的感受性可能是后一种情况的八倍，但是实验的结果却证明，32打兰的情况下准确判断出轻重时，差异重量相对于原重量的比值，和32盎司的情况下的比值是相同的。

我将列出四项实验来证明这一点。我先将四人编号，让他们将手平放在桌上，感受并比较了两个给定重量物体，其中一个正好是32盎司而另一个比32盎司重，这项练习之后他们双手上均放置32盎司的物体，我开始一点一点地减少其中一只手上的重量，直到他们能够感觉出双手上重量的不同。当此时的重量差异被记录之后，我采取同样的方式再次进行了实验，不过这次他们可以抬托举起物体，这样就能够同时估计出触觉和一般肌肉觉的作用。任务完成后，我记录下他们能够觉察出差异时的物体重量。

然后我放弃了较重的物体，而采用较轻的32打兰为标准重量，通过同样的方式再次进行了上述实验，不过这次并没有让他们进行差异重量感受练习，因为我发现他们很容易察觉出差异，同样地只要他们一察觉到差异，我就将实验结果记录下来。

如果你比较我们在较大和较小重量条件下获得的结果，你会发现差异重量和原本重量间的关系几乎是一样的。

光

我在《萨克森科学学会论文集（数理分册）》（abhandlungen der sächs.gesellschaft der wissenschaften, math.-phys.cl., vol.4, pp.457 ff.）中题为《关于一个基本的心理物理学定律，及其与星等估计的关系》的这部分内容中，以及在同年同一个协会出版的《年报》（berichte, 1859, pp.58 ff.）增刊中，以集中视觉感受为例，完整说明了对韦伯定律的确认过程。我将在这里概述这些研究的要点，并适当地做一些补充。

在这之前，博格（bouguer）、阿拉戈（arago）、马森（masson）和斯坦海尔，都曾介绍过采用其他研究方法将这一定律应用于视觉领域进行的研究，后来我和福尔克曼也进行过类似的研究，但并没有太多人关注过这些内容。

除了斯坦海尔之外，所有对于韦伯定律的验证都是基于最小可觉差法（依赖平均差误法的原则），以及间接基于星等估计法。

由于我自己的研究提供了对韦伯定律的最简单的验证，即使这个验证不是最精确的，但这是韦伯定律最早的经验性认识，所以在此我将首先介绍这些研究，并将它们同定律的一般解释结合起来。

在一个少云的日子里，经常可以在天空中发现这样的一些相邻的云朵，它们之间仅在投影亮度上有一些细微的差别，或者一些刚好能从天空背景下被识别出来的云朵。注视天空中刚好能观察出差异的两片云朵组合，然后将墨镜戴在眼前，就像配镜师为光敏感的人所做的那样。经过粗略的光学测试，我了解到这些墨镜镜片单独使用时允许通过的光量略大于1/3，而两片合起来使用时最多能让1/7的光通过。我们假设在每只眼前各放置一片这种镜片能让每朵云的亮度减少到1/3，那么两朵云之间的亮度差异也会立即减少到1/3。在这样的假设前提下，似乎原本刚好能被觉察到的云朵间的亮度差异现在大量地减少，就会变得不能被察觉，或者假如在使用墨镜之前两朵云之间的差异还很大，远超最小可觉的界限，那么在使用墨镜之后这种差异至少会变得不那么明显。然而事实并非如此。原本至少达到最小可觉水平的差异，在加上墨镜之后仍是同样的情况，而我请其他人来重复这个实验，他们也报告了同样的感受。

我还进行了同样的实验，但这次是将两片镜片放在同一只眼前，同时闭上另一只眼，这样一来两片云之间的亮度差异就会减少到原来的1/7。然而结果仍是一样，先前刚好能察觉的差异，在加上镜片之后仍刚好能被察觉。

最后，我偶尔也使用了彩色镜片来使通过的光量更明显地减少，但是仍然出现了相同的实验结果。这也说明云朵之间或者云朵与天空背景之间的颜色差异并不影响实验结果，因为该实验中的彩色镜片能够在不同程度上吸收不同颜色的光。

在上述实验中，如果我们注意到改变云朵亮度的绝对差异大小并不改变差异比例，即相对差异不变的前提下，这种刚好能感觉到差异的现象始终存在，我们就不得不承认韦伯定律的正确性。

光度上的差异减少到原来的1/3、1/7甚至更少，但是最小可察觉的程度却和减少前是一致的，这一实验结果乍看上去的确非常不可思议而且有悖于常理，因为在日常生活中我们都知道随着光线减弱直至消失，亮度上的差别也会减弱直至消失。但是我们不能忽略韦伯定律成立的条件，即亮度的差异在减少的时候，两个被比较部分同样是按比例地减少，它们之间的比值不能改变。让我们把符合这种条件的情况称为第一主情况。但差异减少的方式还可能有另外一种情况，即通过减少较大的部分，或者增加较小的部分，使得两者之间越来越接近。我们可以把这种情况称为第二主情况，其中相对于两个部分而言，它们之间的差异正在一点一点地减少。这种情况与我们的日常经验相符，当两者非常相近时，它们之间的差异将非常难以分辨甚至可以说是完全消失，后面的实验也证明了这一点。

另外我们还可以引用第三主情况作为间接证据，来直接验证我们在第一主情况时已经发现的定律。在第三主情况下，两个部分的量并不是按比例改变的，而是同时在两者中增加或减去相同的量。这样一来就和第一种情况不同了，即两个部分之间的绝对差异量没变，但是相对差异量却改变了。如果同时增加相同的量，那么两个部分之间的相对差异量减少，如果同时减少相同的量，那么相对差异量增大。

如果相等的可察觉性依赖的是相对差异等价性而非绝对等价性这一原则是正确的，我们就必须预期到，虽然在第三主情况下两部分的绝对差异量感觉并没有改变，但对两部分差异的可察觉性肯定会改变。而且，我们还会预期当两部分同时增加相同的量时，差别的可察觉性会减小，当同时减少相同的量时，可察觉性会增加。

虽然设计一个专门的实验来验证以上假设是很简单的事情，但的确没有这个必要，因为结果肯定就是这样。此外，我们的日常生活经验就可以作为一项类似的观察性证据，目前就足以对这些假设进行证明。

我们每个人在晚上都能看到星星，而在完全的日光条件下，即使诸如天狼星或木星之类的亮星，人们也是看不到的。然而，夜晚时星星所在夜空区域与周围区域亮度的绝对差异，与白昼时相比并没有改变。只是在白昼时两者都由于阳光的作用而增加了相同大小的亮度。

有人可能会用同样的方法，来解释在第一个实验中有关云朵投影细微差异的结果。他们认为人使用墨镜后应该会感觉到云朵之间的差异被减弱了，虽然事实上这种减弱的程度并不多，但绝对感觉的减少确实存在。因此这种绝对差异的改变应该被感觉到，而不应该出现相对差异不变导致可察觉性不变的现象。然而大家可能也会注意到，从刚刚描述的体验中，绝对亮度差异的存在并不能保证其被察觉——的确，就算两者的绝对差异非常大，但只要它们的相对差异非常小，那么两者之间的差异就不会被察觉。在夜晚时分，没人会否定天狼星或木星与其周围的夜空亮度间存在着明显差异，但即使完全集中了注意力，也没有人能够在白天发现天狼星或木星。我们保证在白天和夜晚，天狼星和木星与其周围天空亮度的绝对差异是一样的，却因此产生了如此奇怪的现象。这是从物理角度上的分析结果，但是从感受的角度来看，在白天的这种亮度差异是零，甚至可以说比零还要小，必须将其放大到足够程度才能被我们所觉察。

另外，我们不应认为这种现象仅局限于点光源。后面介绍的关于投影的实验将提供一个非常便于获得的事实，即使当绝对差异很大时，在任意亮度的发光体表面也将出现和上面一致的现象。日常生活中的经验也可以用来说明同样的问题。

有人或许会注意过，当油画、银版照相法[3]相片、涂板、漆面桌等物体的表面上有反光时，这些物体上的图案就会变得非常难以辨认。如今大家都知道，反光的强度不取决于反光物体表面的颜色或者暗度，而只依赖于表面的光滑程度和光线的入射角度。也就是说，反光为图案及其背景的明暗部分均增加了同样亮的光线，并且使图案与背景之间的差异变得难以辨认。

总之，上述诸多例子应该可以充分地证明韦伯定律。但是这样一来，我们就可以认为定律是完全正确的吗？

我前面有意地提到过，在戴墨镜观察和用裸眼观察时，云朵间差异均至少是可觉的。有些被我请来重复该实验的人，甚至发现在使用墨镜之后可觉察的差异反而多多少少变大了，这种情况我也经常发现，但并不总是出现。于是我们可以确认，两物体间亮度的绝对差异减小时，只要相对差异的大小没有改变，那么两者间亮度差异带给人们的感觉并不会减少，这和人们的日常估计大相径庭。由于韦伯定律表明相同的相对差异会导致相同的可觉性，但那种在使用墨镜后感觉能力提高的现象，仍是一种有悖于韦伯定律的情况。

虽然光辐射情况的不同，可能会影响实验结果，还有一种可能是与之前较低水平的印象相比，被试容易在当前情况下，将与先前相同的可觉差异判断为更大。为了剔除出被试的这种错误判断，我将以下实验与一般性的研究方法结合了起来。

我戴上墨镜，在天空中寻找最小的可能差异，我将其判断为最小可觉水平，找到之后取下墨镜。如果戴墨镜时视知觉水平有任何程度的提升，那么戴着时的最小可觉差必然会在取下眼镜后变得无法察觉。然而在重复了许多次之后，无论我戴上一副还是多副墨镜，我都没能找到如此小的一个差异以至于在摘下墨镜之后就无法被察觉，就在我刚取下墨镜，眼睛突然暴露在强光下时，我突然感到一阵短暂性的眩光，但很快这种感觉就消失了。在刚戴上墨镜时，我会感受到视线由于光线的突然改变而产生短暂性的模糊体验，但和取下墨镜时的眩光一样，这种模糊体验很快就会消失。

在上面所有引用的实验中只是使用了非常微小的差异，即所谓的最小可觉差，这是非常关键的。

即使韦伯定律就如以下将要提到的，可以适用于更大差异时的情况，但并不容易将它们直接应用于实验之中。判断在使用墨镜前后差异是否一致，这是一件非常不确定的事情，而且结果的变异性很强，它无疑受到周围环境中各个变量的影响。就算使用的是最小可觉差，在等价性判断中仍然可能会产生类似前面所提到过的错觉，只不过与差异很大的情况下绝对感觉中所产生错觉相比，程度没有那么严重。使用极微小差异的最大好处在于，可以将这些实验和它们的逆实验结合起来，这样我们就无须判断差异间是否存在等价性，而只需要判断是否感受到差异就可以得出结论，以此减少了判断差异等价性而可能造成的错误。不戴墨镜时可以察觉到的最小可能差异，在戴上厚厚的墨镜后仍然可以察觉，反之，戴着厚厚的墨镜能够察觉的最小可能差异，在取下墨镜后仍然可以察觉，这种结果可以作为客观的证据，表明墨镜对差异感受的增减并没有影响。

但是不管怎样，实验与其逆实验的结合降低了韦伯定律失效的可能性。定律有效的光线强度范围，既不是接近完全黑暗也不是非常的明亮，这就限定了韦伯定律的适用范围，虽然此范围外的空间并不大。同时，这种描述既不能断定也不能证明定律的无限有效性。就事实而言，至少是出于实验的目的，高于或者低于这样的限制，都必然导致定律的失效。因此，在更进一步讨论韦伯定律的有效性之前，有必要检验定律的限制，因为只有将定律应用于这些限制范围并且合理解释之后，才能得知韦伯定律的有效性。

没人能够用裸眼看到太阳黑子，即使它们是无害的（至少只要太阳高挂在天空中），但是只要通过墨镜，任何人都可以看到它们。然而如果韦伯定律可以适用于最高的亮度条件下，我们就能将黑子同周围的亮光区域分开，就像戴上墨镜那么容易。可能只要是在令人感到眼花缭乱的情况下，即使当光线相比于太阳光弱很多时，观察得到的结果就会偏离韦伯定律的推论，虽然关于这方面的具体研究仍是空白。

因此，如果云朵十分明亮的话，那么戴上墨镜甚至能有助于使云朵投影之间差异的程度微微提高。从实验和逆实验组合的结果来判断，这种帮助的效果影响很小，我对中等亮度的云进行的实验中都没能发现这一客观现象。我必须承认，在以非常耀眼的云朵为对象进行的实验中，我遇到了一些问题，并且由于我眼睛出了毛病[4]，我没能对这一现象进行明确的定义。

我们再来看极暗的情况，如果一个人戴了极多套墨镜，这种条件下给人的感觉就是一下子什么都看不见了，因此即使原来能看到的差异确实很大，也会变得无法分辨。根据连续性的原则，当接近极端情况时，清晰度会变差，这已经通过经验证明。的确，无论原来的差异如何大，总能找到一副足够暗的墨镜，能够使得这种差异看起来比不戴墨镜时小。通过佩戴中等暗度的墨镜，太阳黑子相比于不戴墨镜时要更清晰，但在继续增加墨镜镜片的暗度后，又会重新变得更模糊，最终无法辨识。

我们不能说韦伯定律在任何范围内均有效，我们只能说在目前实验证据的基础上，可以确定，尚未证明在常规的可视亮度范围内，会出现不符合韦伯定律的情况。

根据在极暗和极亮两种条件下出现相反趋势的偏差，可以推论出韦伯定律在介于两个极端的中间范围内是有效的。在极亮时，降低亮度可以提高清晰度，同样地，在极暗时，增加亮度可以提高清晰度。因此只需要根据数学原理本身，就能断定必然存在一个特定的中间区间，在这个区域中无论增加还是降低亮度，韦伯定律都一样有效。只是这个区间的范围不能通过纯粹的数学推导来进行预测。

我先介绍上面这些实验研究，不仅因为在过去我对这方面内容尚一无所知时，这些实验证据是我最初尝试对韦伯定律进行证明时使用的，更是因为这些研究很方便，对所有人而言都易于操作，同时也和其他一般性事实一样，是韦伯定律的良好证据。唯一的不足在于，我们不能控制、统一维持以及改变光线的规格，因此不能随心所欲地控制三种主情况。因此我们需要增加一些措施来使实验观测更为顺利。

有许多方法可以处理不同色调，以制造最小可觉色差，因此实验也可以有许多不同的形式。一种非常简单的方式就是用墨汁在羊皮纸上绘制出刚好可以察觉的色差。事实上这样做并不比使用云朵投影更能保证差异的可测量性，但是这么做至少可以保证均匀性、变化率的可控性以及操作的方便性。

最近，我使用上述方法重复了那些实验和逆实验，得到了与我之前使用云朵时相同的结果。就算使用组合型墨镜，经过精确的光度学测量使得只有原先1/100的光线透过，但只要过一会儿，我就能够辨别出原先使用裸眼时能够辨别的最小程度的最小可觉差。在实验中保证充足的阳光是十分重要的。在同等的光亮度条件下，如果我将平时写作时使用的工作室台灯用于实验，那么投影差异将非常难以识别，但是当我将光线调暗到原来的1/12或更小时，其中的差异就如同没有变暗时一样清晰。

还有另一种简单易行且可以同时测量和变化三种主情况的方法，即使用两盏灯或两个光源照射同一个物体，以形成并排的两个投影。这样做的话，不仅能够使两个投影的光度深浅比例很容易调节，而且能够通过应用两个等亮光源以及计算光源与投影之间距离平方倒数的方法，对投影的亮度进行简单的测定。光源亮度的等价性，很容易通过投影亮度的等价性，以及投影与光源之间距离的等价性来判断。调节灯或调整光源就可以改变投影的深浅。实际上，使用一个投影及其周围的表面作为对比的两个对象来测试定律的有效性，比使用两个投影更为实用，因为一个投影和它周围表面的深浅比例更容易断定。下面详细讲解实验过程和需要注意的地方。

l和l′是两个光源，l′照不到的地方即形成的投影是我们希望检验的对象。该投影只是受到l的照射，而l与l′共同照射投影四周的表面。然后，逐渐移动l′使其远离投影所在的表面，而l则保持不动，这样一来，投影四周的表面受l′的额外照射将会越来越少。最终l′的照射减少到某个点，使得投影最终和四周融为一体，变得无法用肉眼辨识。此时，只要稍微移动一下某个光源或者改变某个光源的朝向，就可以产生最小可觉的投影。

这样就可以使用墨镜来开始实验和逆实验了。由此，定律以及定律的下限便可以此证实。

我们也可以不使用墨镜来等比例地减少光量，而是移动两个光源l与l′，逐渐使它们远离投影所在的表面，不过两个光源与对应投影之间的距离仍保持着相同的比例关系。接下来的实验就使用的是这种方法，并且实验过程与先前是互逆的。过去我们发现，只要将光照的亮度等比例地减少，那么相对的可觉差异是保持不变的。然而接下来将要详细说明的是，使两个投影之间的差异保持相同的可觉性。这种新的实验方法不仅是先前实验系列的重复，而且是对它们的补充和检验。

这种实验需要极为专注的注意以及严密的注视，来追踪这些投影消失以及再次出现的踪迹，由于我自己的眼睛状态不好，所以这个实验是由视力完好的福尔克曼以及其他几位观察员协助完成的。下面将说明实验过程中的一些关键点以及结果。

在一面垂直放置的白色面板前，垂直设置有一根杆，有两个光源l和l′照射这根杆，使其投射两个阴影到面板上。光源l是硬脂蜡烛，固定在面板前某个距离处。另一支是经过两种光度测量方法后被确认为具有相同亮度的蜡烛l′，观察者需要一直注视着它投射到面板上的投影，而另一位助理观察员移动蜡烛使其远离面板，直到观察者不再能辨识其投影为止。对于福尔克曼的眼睛来说，此时蜡烛l′与自己投影之间的距离是l距自己投影的10倍，这就意味着对于他的眼睛来说，投影刚刚变得无法辨识时的光照亮度是绝对光照亮度的1/100。用绝对亮度远高于或低于上述实验中亮度标准的光源进行实验，得到的距离比（即光照亮度的比）是一样的。我们必须注意到，在上述实验中，改变光源的强度或者将蜡烛l′靠近或远离面板，最后起到的效果都是一样的。在所有的情况下，l′与面板的距离必须是l与面板距离的10倍，才能令l′形成的投影正好无法辨识。我们采取了以下几种光照等级作为l值分别进行了实验，分别约为0.36，以及从1、2.25、7.71三种等级变化至38.79的区间（将硬脂蜡烛与白色面板距离3分米时的亮度等级定义为1），所获得的l′和面板距离与另一支蜡烛和面板距离的比例，均没有可觉的或者明显的差异。值得一提的是，只有在最低亮度（0.36）的条件下，这个比值有轻微的下降，即当投影正好消失时，l′与面板的距离相对于l与面板距离的比值，多少均是低于10的（根据表格数据结果从6至9倍不等）。这说明这种光照条件已经低于了韦伯定律适用的范围下限。

为了叙述上的简洁，我在上面只描述了l′的投影刚好无法辨识的那个极点。实际上在实验时，我们还在那一点前后移动l′，以在投影刚好消失和刚好出现的两个位置之间，尽可能精确地定位其最小可觉的位置。由于助手完全根据观察者的指示移动光源l′，所以观察者可以完全将视线和注意力放在对投影的感知上，而对于光源最终位置与面板之间的距离一无所知。因此，这样可以消除距离认知对于实验的影响，使实验结果更可信。

实验是由克诺伯劳教授（knoblauch）、哈勒（halle）大学的海登海因（heidenhain）和柏林大学的荣格（jung）协助福尔克曼完成的，部分实验中我也在场。令人惊讶的是，在测得最小可觉差的过程中，几乎所有的观察者的都发现了相同的比值即1/100，每个人的具体数值均在此数值左右轻微变化。

事实上这个实验不能保证单个实验结果具有很好的精度，因为我们都仅仅是在一段特定的距离范围里（对福尔克曼来说这段距离是总距离的1/10）移动l′，却不能准确地指出一个点，在这个点上投影变得刚好可察觉。因此，一般我们对每一个观察者的多次实验结果取平均值，作为最后的结果。然而，每个人的每次实验结果都是在平均值上下小范围地波动，而且经计算可获知最终的不确定性并不显著。

这个实验过程中，仅仅通过改变光源的亮度控制投影，对应的是第一主情况；只移动一个光源靠近或远离面板使得投影变亮或变暗，则对应第二主情况，这也很好理解。为了制造出第三主情况，我们可以使用一个光源来形成两个投影，或是一个光源照射形成一个投影，再用第三个足够亮的光源照射这个投影的周围表面。这样在某个位置，差异的消失过程将会生动地呈现在观察者的眼前。

以上就是我的一些实验，从中我受到了启发。正如我在一开始所提到的，虽然它们的实质并不新，但由于它们是由我独立提出的并已通过早期研究进行了改进，因此对它们的讨论仍然是有用的。它们对于验证和解释韦伯定律是有帮助的。不过，在这里我还是要按照时间顺序，介绍一下我在早期进行的韦伯定律验证工作中一些关键性的收获。最早进行投影消失实验研究的是博格［根据他的文章《关于拉卡耶[5]光度分级的光学论文》（traitéd'optique sur la gradation de la lumiére par lacaille, 1760, p.51］，他所使用的方法和福尔克曼类似[6]，具体的标题为《对某种光的强度研究，该强度能够使弱于它的光消失》。

我必须要说明，博格只引用了一个实验，实验中只提到了一种光源间距的例子，在这个距离条件下，投影间的差异达到1/64（与福尔克曼的1/100不同）时就不会被人所觉察。他进一步说明，这种感受性的程度也许会根据观察者的眼睛不同而不同；另外他认为对自己而言，这种感受性与光线的强度无关。

马森的一篇口头交流报告中则引用了[7]阿拉戈使用彩色光重复博格实验的情况。阿拉戈在其著名的天文学论著[8]中，对博格的实验方法进行了分析后写道，“无论m和l（博格实验中的两个光源）的绝对亮度是多少，实验结果都是相同的（相同的相对最小可觉差）”，反映了他对韦伯定律的正确性持积极态度。

阿拉戈在《光度的记忆》（memoires sur la photométrie, p.256）中没有重新提到这条定律，但他似乎已将其视为理所当然，他引用了证明运动影响差异可见性的实验，下面将介绍这实验。

马森[9]在执行一项电光度学的扩展实验中，得出了支持韦伯定律的结论。他的实验过程简明扼要，并且他的实验相比于博格或阿拉戈，更能精确、全面地证明韦伯定律。实验的基本过程如下：在直径大约为6cm的圆盘上将一块扇区涂黑，该区域标记为mn，其面积是圆盘总面积的1/60，如图1所示，然后使圆盘高速旋转起来。由于视觉后像现象，黑色的区域在白色的圆盘上会延展成为一个圆环或整圆，根据众所周知的快速运动物体与亮度的关系定律可推断，这个形成的环比周围的白色圆盘背景要暗1/60。由此可知，如果眼睛仍可以从圆盘背景中分辨出该环，那么也就能分辨出差异比率不低于1/60的差异。马森制作了一系列这样的圆盘，圆盘上的黑色扇区占圆盘的比例大小分别有1/50、1/60、1/70等等，一直到最小的比例1/120。依靠这些操作，马森就能够检验出视觉感受性的阈限是多少。接下来将介绍一种也能得出上述结论的方法，同时它相比于上述方法更有趣，因为它显示了在定律适用范围中，瞬时光线和稳定光线的效果是一样的。

图1　马森实验中所使用的圆盘

我们知道，如果在日光或人造光照射下，将一个圆盘表面分为黑白相间的扇区并快速旋转起来，就会呈现一种均匀的灰色。如果使用瞬时的电子火花代替，那么能够看到的是分开的黑白扇区。如果同时使用这两类光源，那么最后看到的是均匀的灰色还是分隔的黑白扇区，取决于这两种光源的强度比例。如果瞬时的电火花亮度很低，那么将看到均匀的灰色；如果电火花的亮度足够大，那么将看到分割的黑白扇区。根据马森的说明，虽然对于每个人的两只眼睛而言，看到灰色时的两种光源强度的比例是保持相同的，但是对于不同的人来说，这个比例却是因人而异的。如果与由电火花对白色扇区（因为黑色不能够明显地反射光线）进行照射产生的亮度，小于无电火花照射下圆盘呈现出均匀灰色所产生的亮度，那么这些扇区都将消失，人眼看到的将是均匀的灰色。在日光或人造光的亮度固定的前提下，圆盘上的白色和黑色扇区的宽度之比影响着最终的灰色的深度，这个比值将决定能够看到分隔的黑白扇区时所需的电火花亮度。如果黑白扇区的宽度相同，若在上一个实验中有人能够识别1/100的差异，就需要电火花的亮度达到稳定光源亮度的1/200，才能使该人眼看到黑白分隔的扇区，因为旋转圆盘使其变为灰色时，亮度也下降为原先的一半。马森为了区别于我们用以验证韦伯定律所进行的实验，他自己设计了一些实验并进行了大量的改造，但最终我们还是发现这些研究结果与之前的其他研究结果是相一致的。

下面引用的是马森对自己研究结果的详细叙述[10]，按顺序先是第一种观察方法，然后是第二种观察方法：

我测试了不同人的视力后发现，视力较弱的人的视觉感受性范围为1/50到1/70，视力正常的人的视觉感受性范围为1/80到1/100，而视力极好的人的视觉感受性范围为1/100到1/120甚至更小。我在实验中一共遇到了两个能够识别出圆盘上1/120差异的人。

我通过改变光线的强度发现，只要光线足够使人看清8开本上的字，那么对于同一个人来说他的视觉感受性就不会改变。因此，正如博格曾经发现的那样，眼睛的视觉感受性与光线的强度无关。我曾通过多种方法改变圆盘反射光的强度。例如曾将卡索灯[11]摆放在与圆盘相隔的不同距离处，并使用阴雨天气的阴暗条件，曾经在日落时昏黄的光线下进行实验，我还曾使用过经定日镜[12]反射的太阳光线，有时我还使用镜片制造发散的光线进行实验。最终都发现只要圆环扇区的内夹角小于某个限度，人眼距圆盘的距离就不会影响感受性。

在我改变了圆盘直径和圆环宽度的关系之后，这一结果仍然没有改变。我采用了表面有1/3或1/4部分为黑色的圆盘。我将黑色的部分设置在圆盘的不同位置，包括圆盘边缘、中心以及中心与边缘之间的地方。我将若干个黑色块摆放在圆盘之上，这些黑色部分的面积占圆盘面积的比例各不相同，最终我选择了圆盘5[13]。在所有的情况下，感受性的阈限都没有变化。

我使用彩色光线照射活动的圆盘，以检验视觉感受性是否会随着光束特性的不同而改变。除了在下面我将要提到的一些限制之外，我发现感受性的阈限是独立于色彩的。因此，无论是使用自然光还是彩色光线照射圆盘，我识别灰色圆环的敏感度都是1/100。

我采用使日光或者卡索灯的光线通过彩色镜片来产生各种颜色的光。后来我还使用了光谱中的颜色以及阿拉戈的测光装置。

感谢邦滕普斯（m.bontemps）热心地提供给我彩色镜片，我用光谱表测试了这些镜片。除了红色镜片只能允许光谱中极端的红色光通过之外，其他的镜片都可以让不同颜色的光以不同量通过。有一些诸如红色的镜片，吸收了太多的光线以至于让人很难看清圆盘上的圆环。

在前面的实验中，观察者注视圆盘的时间是不一样长的，因而导致我们无法确定，在照明为瞬时的情况下视觉感受性的阈限是否会保持不变。而我通过下面最后一个例子中论述的方法，验证了我自己视觉感受性的变化的确很小。

我用一台卡索灯照亮了一个光度计[14]中的所有扇区，然后我将电火花装置移动到尽可能远的位置，之后调节电火花装置或卡索灯的距离以使圆盘上的黑白扇区能够被看清。我使用了不同强度的光。在我的光度学实验中，通过比较在不同强度光下能够看清黑白扇区时，照明装置间所能达到的不同最远距离，这个距离与固定光源距离的比值，可以将它们作为一个人视觉感受性阈限的指标，在后面我将提到的实验中，这一结论也同样成立。

通过在不同被试身上进行这一实验，我在绝对测光过程中注意到一个具有重要意义的现象，即将稳定光源与圆盘的距离视为一个单元。我发现对于两个有相同视觉感受性并且都已适应了实验的人，比较持续光源（标准灯）和瞬时光源（电火花）的距离，在实验中的上述比值是一个定值。

我也曾使用自然光照射彩色圆盘来代替用彩色光照射白色圆盘的方法，发现对于我而言，在自然光照射彩色圆盘时感受性的阈限一直似乎都更小，但这种情况可能随着纸张的颜色而变化。但是，我并不认为这是我所确立定律中的例外情况。事实上这可能是由一些因素导致的，例如我们不可能找到颜色完全均一的彩色纸，彩色纸反射的光总是太弱，彩纸背面与圆盘表面黏合得不够紧，另外彩纸本身也会反射出不同量的白光，这个量的区间非常宽泛，具体数值与具体颜色相关。但即便如此，我还是在红色和蓝色纸张制作的圆盘上得到了与其他实验非常接近的结论。

我在实验中还发现，由于对比度强烈的关系，黑色扇区旋转所形成的圆环边缘十分明显，使得圆环的边缘部分十分容易辨认，会导致被试更容易发现它，所以我将圆盘上黑色扇区的边缘做了处理，使边缘模糊化（见原作的图6和图7）。

我在该实验及其他一些实验中还发现，虽然有一些被试对所有颜色光的感受性阈限都是一样的，但是他们在盯着被红光照射的圆盘看时会出现疲劳及不舒服的现象，这种现象表明这些被试内心对这种颜色的厌恶。我想这会是一个很有意思的研究，即研究除了红光之外其他颜色的光是否也会产生这种影响。

最后，我要介绍一下斯坦海尔的实验。在他的一篇关于棱镜测光的论文[15]中，他研究了光线的强度水平是否会影响对光线强度等价性估计的错误率。他简短地引用了一些相关的发现：“结果表明我们可以十分精确地判断两个表面的亮度是否相同。不论亮度的高低，此类估计的不确定性不会超过总亮度的1/38。”

这一论断包含了韦伯定律的思想，因为估计两种光线强度是否相等时的不确定性大小，可以理解为是取决于最小可觉差大小的。如果在不同的光强度下，大多数实验中平均误差的大小比例是相同的，那么差异的可觉差阈限与不同光强度的比例应该也是相同的。

斯坦海尔自己也写到了相似的发现：“b部分中将说明……总的光强度除以每次估计的误差总和，是可以除尽的。对于后面这个例子而言，如果把表面的光线强度调低到再也无法从周围天空的光线中分辨出来，那么它的强度就与周围天空的亮度成比例。”

1/38这个比例和我们之前所获得的1/64至1/120的结果看上去不一致。我们不能确定这种不一致的原因是被试间还是实验方法间的差异，但这种不一致并不影响定律的有效性。从这一点而言需要注意的是，斯坦海尔的1/38这个分数指的是不确定性的比率，与先前其他研究者所发现的大小为1/64至1/120的最小可觉差异并不是完全相同的。但是这种说法并不能解释结果间差异的大小和方向。

斯坦海尔的实验可以被视作对韦伯定律的验证，他的实验只使用了三种强度尺度的光，三者的比例是1.000比1.672比2.887。因此可以说强度的区间并不是很广。但是这实验却是非常重要和有价值的，不仅因为实验的执行者斯坦海尔在光度学测量应用方面的技艺精湛，更因为这个实验采用一个不同于其他实验的原理证明了韦伯定律的有效性，也说明了韦伯定律可以经受各种实验的检验。

事实上，我们很容易忽视一个事实，即斯坦海尔的实验原理其实类似于平均差误法，而早期的验证方法大都是基于最小可觉差法的。

由于在这里对斯坦海尔的结果和计算进行详细叙述会很麻烦，我建议读者可以去查阅他的原文或者我的论文[16]，在我的研究中，我对实验做了一些改进并且排除了与其余实验结果不符合的一个实验系列，最后得到的结果是1/40而不是1/38。我在下面只列出了实验结果总和以及简单平均误差，该误差是根据韦伯定律推算出来的，其值与光强度的平方根成比例。

正如第七章显示的那样，到目前为止对韦伯定律的验证中，所关注的都是很小的差异，如果心理测量想要建立在该定律的基础之上，就必须遵守这种限制。很难直接验证在差异大于最小可觉差的情况下韦伯定律是否有效，因为在这种情况下，等价性判断并不确切，另外实验和逆实验的结合，也不能帮助我们得出同最小可觉差标准实验一样的结论。然而，我在我的文章[17]提到了一种体验，即无论我们注视的是一道光还是一面墙，闭上一只眼睛会看到一个微弱的投影进入视野，但我们却不会觉得视野变亮或者变暗了。可能在某些情况下，这种体验可以归为我们定律的范畴，而且可以作为当差异略大于最小可觉水平时定律的有效性证明。关于这种体验的讨论，可以直接在我的论文中看到。

然而，相比于上面说的那种模棱两可的方法，还有一种方法可以在差异大于最小可觉水平的情况下，更准确地验证韦伯定律。这个方法同时也是关于韦伯定律的最早的研究方法，更值得一提的是，它也是我最早提到的证明韦伯定律有效性的突出观察证据之一，那就是星等估计法。不过首先，我们需要假定在进行验证定理所需的星等估计时，天文学家那训练有素的眼睛能够克服人所固有的困难。

众所周知，估计星等是自古就有（从希帕克斯时期）的工作，它需要人根据自己的眼睛对星亮度的感受进行分类，而不是根据其亮度的光度测量值，这样天文学家就能根据各颗星外显的亮度差异，将它们分为一等、二等、三等，等等。因此，如果星等的值越小，表明星可见的亮度越高。根据韦伯定律，只有当相邻星等光度学上的关系是一定时，人们知觉到相邻星等的亮度差异才是相同的；因此，以等差数列形式存在的星等系列，必须对应的是以等比形式存在的亮度系列，以采用星的亮度来描述其光度值。

为了确保正确性，我们必须考虑与上述的推论矛盾的说法，例如洪堡（v.humboldt）在《宇宙》（kosmos）中提到了赫舍尔（j.herschel）的观察，他提出连续的星等对应的实际亮度是一个二次幂函数列而不是等比数列，即

1, 1/4, 1/9, 1/16…

在等比数列中，每一个数都可以立即由前一个数乘以一个常数得到，然后我们会发现，这个数列和上面的数列很像，即

1/2, 1/4, 1/8, 1/16…

乍一看去这一矛盾非常重要，因为赫舍尔根据自己的测光判断，倾向于选择二次幂函数列而不是等比数列，并且对星等进行了仔细的校正以及与实际亮度间的比较，构建了当人们需要在任意确定性程度水平上进行判断时，所依赖的最广泛且最重要的基础。但是我相信在我的论文里已经很清楚地证明，这种矛盾只是表面的问题，在对定律进行完整的验证过程中，只要仔细地对这两个数列进行检验，问题本身就会迎刃而解。下面我将陈述其中的要点。

1, 1/4, 1/9, 1/16…和1/2, 1/4, 1/8, 1/16…两个数列之间的最大差异就在于第一星等亮度中。在第一星等亮度中，最亮星是最暗星亮度的16倍，因此，我们很有可能从其中随意选择一颗星的亮度作为整个星等亮度的代表，然后就随意使用它与其他系列进行对比了。而赫舍尔的确就是做了这么一种武断的选择。我们知道赫舍尔偏好使用的是二次幂函数列，在这个前提下，表示星等的数字以及对应的亮度比率就被确定了，同时这颗星所在位置的相对距离也被确定了。因此，赫舍尔选择了第一星等中最符合自己假设的星作为第一星等亮度的代表，而这颗星只是第一星等中第三亮的星，它不能代表第一星等的平均亮度水平。这颗星是南门二（半人马座α星），但赫舍尔自己也曾多次明确提到另一颗星，即参宿四（猎户座α星）更能代表第一星等的平均亮度——用他的话来说这颗星就是“典型的样本”，一颗“代表第一星等平均水平”的星。在后续的观察数据中，赫舍尔的确替换了这颗星，之后他根据自己的光度学测定结果推算了其他14颗星的分数值，并对它们进行了排序，在第一星等中比参宿四亮度高的星有6颗，低的有8颗，因此有6颗星的星等值比参宿四小，而8颗比它大。

那么很明显，如果不是随意选取，而是根据某种先入为主的概念，选取一颗能代表第一星等平均亮度的星，那就应该选择参宿四而不是南门二。根据赫舍尔自己进行的光度学测定，参宿四和南门二的亮度之比为0.484比1。因此，把二次幂函数列中的1替换为0.484之后，我们可以得到

0.484, 1/4, 1/9, 1/16…

上面的数列中，0.484和0.5或1/2的差距很小，1/9和1/8的差距很小，而根据赫舍尔自己的说法，准确地测定星等及其亮度是很困难的，而且他还提到，从长远角度来看，二次幂函数列不能很好地拟合观测获得的数据，而且由于两个数列之间的差异很小，足以使我们能够采用等比数列

1/2, 1/4, 1/8, 1/16…

替换二次幂函数列而不造成严重的后果。虽然二次幂函数列和等比数列在第四项之后的差别会越来越大，但是赫舍尔的光度学测量数据只到第四星等，所以我们无法进一步比较对于后面的数据而言，哪一个数列更加符合。

我的论文中有更周密的计算，进一步表明等比数列不仅符合赫舍尔的观测数据，而且只要对它们的关系进行合适的判断并选择恰当的公比，那么等比数列相比于二次幂函数列就能更好地代表那些数据。根据赫舍尔的观察和计算，使用二次幂函数列的误差平方和为2.719，而使用我们基于等比数列的公式得到的误差平方和只有2.2291。

赫舍尔的研究在这个领域内虽然非常重要，但它并不是可供我们参考的唯一研究。还有其他一些完整的研究，帮助我们消除了对于这样一个论断的怀疑，即呈等差数列排列的星等对应的实际亮度是按等比排列的，这其中包括了诸如斯坦海尔、施坦普费尔（stampfer）、约翰逊（johnson）、普森等人的研究，他们的研究均是独立完成的却都得到了相同的结果。在一开始提到的主要文献中能够看到一部分有关这些研究的总结，还有一部分能够在《萨克森学会报告》的附录中找到。

这些研究发现等比数列的公比之间差异不是很大，但由于各研究有的采用递增数列有的采用递减数列来对公比进行计算，所以数据变化范围很大，从2.5到0.4都有。下面是具体测定的数据：

*（1）根据斯坦海尔自己的计算，（2）根据与其计算方法略有不同的方法求得，参见abhandlung, pp.518 ff.。

+（1）由恒星的数值测得，（2）由行星的数值测得。

（1）根据我自己对星等的校正，（2）加上了进一步的星等估计得到的结果。

表中不同公比产生的原因，部分是由于对星等进行估计时的误差，部分在于进行光度学测量时不同观测者之间的误差。从一定程度上而言，如果天空背景的亮度没有被充分地考虑到，那么测定所获得的绝对值也可能受到影响，我在论文里更详细地讨论过这一问题。但在这里我就不具体讨论了，因为这些研究的结果是否具有总体的一致性，以及星等对应亮度呈等比排列这一结论的有效性，这些问题才是我们所关注的。

在上面的讨论之后，我们还另外注意到，我们的韦伯定律与赫舍尔的计算中有一处不一致的地方。即使如我们在上文中提到的，该不一致之处与赫舍尔本人的其他数据产生了冲突，而且即使它并不能否定我们上面得出的结果，但我们不能忽略这种不一致性，因为这个数据是由如此可信的一位观察者得出的。

赫舍尔在描写自己的天体测量仪（好望角之旅）时，在一个注解中提到，利用等边棱镜的反射性来使欲比较的两颗星连线与地平线平行，这种手段极为有效。他还写道：“通过外部反射，这仪器偶尔还能用来以相同比例减弱两颗几乎同等亮度星的亮度（通过使两颗星反射影像的连线直接与所要观察的星之间的连线平行）。在这种亮度被减弱的状态下，原本不易察觉的亮度差异变得明显了。通过（同等地）增加或减少入射角，就能够增加或减少反射影像亮度减弱的程度。”［在《纲要》（“outlines,”p.522）中还有一种类似的方法。］

经过上面一番论述之后可以这么总结，如果不考虑上述矛盾的情况，我本人仍无法把赫舍尔在特定的观察条件下发现的分歧视作是一种微不足道的偏差。表面上看来他似乎是“偶尔”才发现这个现象的，没有针对这个问题做专门的研究。因为赫舍尔平常多次提到，有“无数的原因”能够“以难以置信的方式影响着我们在实验中的判断”，所以与上述的特定实验结果相比，我们不能认为观测的随机性足以解释这种分歧的原因。从另一个角度看，也许像赫舍尔那样富有经验而老练的观察者最终都能够获得某种对细微差异的感受性，并因此能够帮助他发现细小的且与韦伯定律不一致之处，而对于没有经过专门训练的观察者来说，这种小规模的亮度差异是难以注意到的。另外，很有可能赫舍尔起初已经意识到观察中的困难，所以压缩了测定中的难度，特地选择了比较亮的星作为观察对象，这些星的亮度接近韦伯定律适用范围的上限，因此它们之间的差值很容易被注意到。不幸的是，由于赫舍尔并没有进行明确的叙述，所以我们无法知道具体情况是如何的。不过，这一矛盾的存在有确定的事实基础，因而需要对韦伯定律的适用范围进行进一步的研究。

到目前为止，我们讨论的主题是寻找在一定的范围内存在着韦伯定律的相关证据，但是对于准确的范围值尚未有定论。此类工作还未结束。然而，我们有必要更多地讨论这些范围的条件和性质，以及它们产生的原因。这样的讨论在某种程度上提供了一个机会，来使我们认识这些特定的因素，这些因素能够影响人对与定律无关的强度差异感觉，因此在以实验验证定律的过程中一定要使这些因素保持恒定或者具有可比性。虽然这些因素是第一次被提到，但为了给后面的讨论进行参考，我将在这里介绍有关且充分的细节。

当眼睛感觉到眩光时，定律适用范围的上限无疑受到眼睛因此被伤害这个事实的影响。通过这种方式，上限值就会非常明显。如果超过了这个上限，毫无疑问感觉器官会受损，导致感觉所依赖的内部活动不再增加，感觉本身也不会再有可能提升。两种不同强度的刺激，当它们都达到或者超过这一刺激限度时，只能够引起相同强度的感觉极限值，因此无法分辨它们之间的差异。无论如何，即使只是接近这一限度，韦伯定律都会发生偏差。

将亮度接近上限值时定律的偏差简单归因于眼睛对光线刺激的适应，导致对于光线强度的感受性下降，这样的解释似乎是很合理的。当人从白天明亮的室外突然进入一间阴暗的房间时，会立刻分辨不清任何亮度差异，这样的观察似乎很能说明问题。而之后人的分辨能力就会逐渐变得越来越好。同样的现象也可以反过来进行。当人长时间待在暗室后突然走进光亮处，刚一开始也会暂时看不清任何东西。之后只是慢慢地开始能分辨事物。所以，如果眼睛的适应是人在非常强的光线下无法分辨差异的原因，那么当人在从暗室进入明亮的房间时，一开始对差异的分辨能力应该是最好的，之后就会逐渐变得越来越差。这种双向的情况，我在前面有关云朵细微差异的实验和逆实验中已经展现过了。

因此有人可能会觉得，由亮房间到暗处时看不清东西是由于强光的后效引发的印象钝化效果，而对应地，由暗处到亮房间时看不清东西是由于钝化的印象需要时间来重新恢复。因此，如果眼睛的内在光[18]持续存在，那么当人从亮处走到暗处时，那些亮度微弱的细节无法对人形成以印象，这个原因就同在白天看不到星星的原理是一样的。相反地，如果是从暗处走到亮处，那么强的印象会比弱的印象更迟被感觉到，所以强光之间的差异是否相等在一开始是无法被察觉的。事实上，我曾经在关于“基本的心理物理定律”的论文中尝试使用这种解释。但是在后来更仔细地思考之后，这种解释的两个方向都似乎站不住脚，因为根据现有的经验，这种残留现象消失得太快，而且实现起来存在诸多困难。另外，强的印象比弱的印象更迟被感觉到这一假设，也和斯旺（swan）[19]的实验结果相矛盾。

除非我是错的，否则从一个照明良好的环境进入暗处时，一开始无法看清任何事物这一现象的原因，实质上是由我们将在第十二章里讨论到的原则决定的。但是反过来时，这一规则却无法解释从暗处到亮处时无法看清这一现象，而且我们可能还需要增加如下的解释，即在先前研究中，由于强光刺激使我们暂时变得有些感觉迟钝，从而无法感受到微弱的光线产生的效应，所以这种由强光刺激导致的感觉迟钝，同样可能使我们无法感受到微弱光线之间的差异。然而，不论我们是从亮处进入暗处还是暗处进入亮处，两种情况下的光线差异都很大，虽然两种光线条件产生的影响有先有后，但同样都能在条件变化的瞬间，就使我们的感觉暂时变得迟钝并且无法察觉到差异。不过即便这种解释，仍然存在极大的不确定性。

尽管如此，根据第十二章中要提到的原则，当眼睛以相同的程度适应明暗两种光线条件时，最终比较的结果和两种光线以相同的比例变暗的结果是一样的，这种情况发生的可能性是非常大的。这些条件下差异的可觉程度仍然相同，因此韦伯定律仍然适用。

至于韦伯定律适用范围的下限，我们经过严密的检查，意识到也许它并不是一个真实存在的限制。至今为止我们发现定律的偏离情况，严格说来都是符合定律的结果。为了证实这一点，我们需要进行一些初步的讨论，而这些讨论对后面的其他一些内容具有很高的重要性。

在非正常的条件下，无需外部的刺激而只需内在因素（内部的刺激）就能产生各种类型的感觉，这种感觉通常被称为幻觉，它提供了这种可能性存在的证据。实质上，在特定的环境中，以稳定和普遍的方式出现这种感觉，这并没有什么大不了的。例如，在视觉方面，我们必须承认或多或少存在着一般性的幻觉。闭着眼睛或者在黑暗中时，我们看到的黑色就是这种没有外部刺激而产生的视觉感受。这不同于什么都没看到，不是用手指或者后脑勺看，也不同于由于没有外部声音刺激而什么都没听到的情况。闭眼时看到的黑色，更像是当我们看着一个表面是黑色的物体时，其反射的光给我们造成的印象，这种印象可以呈现各种层次不同的强度，甚至可以造成最高强度的视觉感受。的确可以说，这种内在的黑色可以出于纯粹的内在原因，而偶然地变成亮光或者发生包含着零星亮点的现象。

只要注意的话，我们就可以在闭上眼睛后看到的黑色中发现一种细小的光点，这种现象在不同的人身上，各种状态且不同视力的眼睛中都能够发现，并且在某些特殊疾病人群身上这种现象的程度可能被加强。而我的情况是，从我患眼病开始的这段漫长的时间里，我经常能够看到持续闪烁且非常明亮的光，这种情况会根据我眼睛产生的刺激而增强，并且存在着很大的波动。另外，这种活跃且主观的光现象在不同个体身上的形式可能会极为不同。在这里我将不会引用更多细节，建议读者参考眼睛疾病方面的书籍及生理学实验中关于主观光现象的章节。例如，《鲁特的眼科学》（rüte's ophthalmol., p.192）。

这种内部视觉上的黑色也能够在深度上增加或减少。这方面的证据很容易找到。如果坚持专注地在一段时间里盯着一个黑色纸面上的白色圆盘，之后就会得到一个相对明亮背景上深黑色圆盘的后像，甚至将眼睛闭上并用双手捂住双眼（为了防止有光漏进眼皮里面来），还是能看到这个后像。同时在出现后像的位置，视网膜开始变得对外界的光线不敏感。如果在后像仍然存在时张开眼，盯着一个白色的表面，那么将会看到白色底面上有一个黑点。当眼睛疲劳时内在光就会变暗，当眼睛得到充分休息后内在光就会变得相对更亮。

无论是部分的还是整体的，是短暂的还是持续的，是仅影响视网膜还是影响视觉系统的中枢部分，感觉麻痹都能够产生和视疲劳类似的效应。只有视网膜上的部分区域受到影响的情况并不少见。把一个物体放在病人患病区域对应的视野内，让他看物体上灰色、黑色或彩色的光点，具体看到的颜色将取决于视觉对不同颜色光线感受性的减弱程度。[20]在有些被试身上这种现象是暂时性的。即使是出于内部原因，也都会导致整个视野永久或者暂时性地变暗。鲁特[21]“发现一位妇女在持续的光照条件下，眼睛会突然完全被黑暗笼罩。而可视的物体会时不时地突破黑暗，像幽灵一样出现，之后在她尝试要注视它们时，物体又会迅速消失”。

如果不仅是视网膜，连视觉的中枢部分都完全受损的话，那么人视野中的黑色感觉应该不仅仅是变暗，而应该是完全消失（就像是在闭起眼睛时视野边缘区域的感觉），也就是说这种情况下的眼睛，不会比手指或者是死亡的神经纤维能看到的东西更多。有关这种效果是否完全且永久的问题，我还没有能够找到相关的观察结论，也还没有从著名的眼科医师那里获得最终的意见；实际情况可能并不是这样的。然而根据鲁特提供的信息，这种情况的确会暂时且部分地存在[22]：“在神经错乱的病人身上有时会出现这样的情况，视网膜的部分区域出现暂时性退化，外部世界投影到这部分视网膜上的事物似乎完全不存在了。”[23]大脑里视觉感受的中枢部分很有可能和基础的生命活动存在根本的联系，因此不能完全且持久地在不涉及其他活动的前提下，暂停某一种活动。

在定律有效性并不存在下限的假设下，甚至对于内在光的光度学测量，也可以用与之前验证韦伯定律的实验类似的方案进行。在黑夜里，有一个物体挡住了灯光而产生投影，我们只要将灯往远离物体的方向移动，直到这仅被内在光填充的投影，刚好无法从同时被内在光和外在光照亮的背景中分辨出来。应用福尔克曼结果中获得的1/100这一数据，在这个距离开外，增加了内在光水平的灯光亮度只需要达到内在光强度的1/100，就能产生上述效果。

实际上这一实验已经有人做过了，即使实验完成得比较随意。在一道又长又暗的走廊里，将硬脂蜡烛放置在物体前，背景为一块黑色天鹅绒，周围有一些空间，当蜡烛被往后移动87英尺时，福尔克曼就再也看不清黑色天鹅绒上的投影了。在这个距离，往原内在光水平上增加1/100的内在光亮度，就相当于在这个距离1/10的条件下，也就是8.7英尺时的烛光亮度。因此，这个实验告诉我们，一块黑色的背板接收来自一根约9英尺外硬脂蜡烛的光，和没有外部光照时的内在光亮度是相等的。也就是说，前后两种情况下的测光亮度是相等的。

也许有人会觉得这种内在光的亮度非常明显且太高了，因为它被假定为某个物体表面被一支蜡烛在约9英尺之外照射时表现出的亮度，但是我们也不能忽略的是，在这个实验中采用的是黑色天鹅绒制成的背景，它是这个判断过程中的基本事实。实际上一个全黑的表面能够吸收所有的光线，所以它是不会被照亮的，哪怕是被任意强度的火苗在非常接近的距离内进行照射。只有在采用非全黑物体进行的实验环境中，才能允许我们来对全黑背景下的低亮度水平进行讨论。在这种环境中，非全黑的背景仍可以反射一些光，但是非常少，接近于阴影水平，这时能够非常好地对内在光的强度进行测量，这一点已经在实验中被证实。

我在这里引用的结果，只是福尔克曼利用自己的眼睛在仔细而小心进行的实验中获得的。他还另外叫了两个人来进行这项实验，他们在87英尺时却仍然能识别出投影，由于环境的性质原因，超过这个距离实验就无法推进了。这个结果说明要么是他们的内在光水平不同，要么是他们的感受性不同。福尔克曼尝试继续进行这些实验，以进一步完成更准确的测定。同时他的结果已经足以证明内在光的测光强度既不是不可确定的量，也不是小到无法测量的。这一点就是我们现在所需要的结论。

因此根据上面所说的内容，我们知道了在完全没有外在光源的情况下，视野中感受到的黑色仍应被视为一种真实的视觉感受，因此我们不可以忽视在这种情况下对韦伯定律的检验。

如果我们在没有使用工具的前提下，裸眼观察两朵十分相似的云或其投影的微小差异，那么内在光的亮度应该同时加于两者上。如果我们在眼前放上灰色滤镜，以降低云朵或其投影的亮度，这种情况下内在光的亮度是不会改变的。每次内在光都是以固定的强度加在云朵或投影上，因此放上滤镜前后内在光在总亮度中的比例实际上是不同的，同时与先前的相对差异也不同，而且变化的方向是下降的，根据韦伯定律，这必然会导致差异感受的下降。的确，如果我们使用更深的滤镜，那么内在光最终将会取代投影之间的细微差异，所有的差异都会消失。实际上，眼睛内在光的作用形式和我们想象的不一样，它非常类似于在明亮的白天里，星星都消失时的情况。因此，只有在内在光和外在光源的亮度相比小到可以忽略时，才能采取外在光刺激对韦伯定律进行证明。甚至连马森也曾声明，只有在光线的强度可以满足一般阅读的要求时，韦伯定律才能发挥作用。换句话说，如果在光线太暗的条件下进行实验，那么投影间的细小差异会变得更不清楚。相应的规则已应用于所有的改进实验中，并且已多次被经验证实。

有一个发现可以佐证我的观点，即可以通过一种看上去似乎违背但实际上却符合以上原则的方法，来使得亮度与内在光之间的差异达到极小甚至消失。

在夜晚，注视一颗刚好可从背景的黑色夜空中辨认出来的星星，那么通过戴上一副墨镜或者将一盏灯凑近眼旁，就会发现再也看不到这颗星了。此现象还有一个对应的完美案例，它与1858年10月初的那颗灿烂的彗星[24]有关。使用灰色或有色的滤镜，或者将一盏明亮的灯靠近眼旁，都可以看到彗尾缩短了，当我使用在白天时能够看到云彩最佳细节的深红色滤镜来观察时，整颗彗星甚至都会变得看不见。这其中的第一点原因是星星或者彗星的光通过滤镜产生了明显的衰减，但内在光并没有减少。第二点原因是，不仅是影像投射到的视网膜区域被光照亮，甚至在一定程度上整个视网膜背景都能被照亮。不同的研究者都注意到，这个现象来自于多方面的原因。

首先，光透过巩膜和脉络膜时会略为变红。布吕克（brücke）在《物理学年鉴》（pogg.ann., lxxxiv, p.148）中提到，他对视网膜影像的主观和客观色彩进行了仔细的研究，获得了一些以上述事实为基础的显著结论。其次，这个影像产生漫反射，达到视网膜的其他区域，之后回射到角膜，再从角膜反射回视网膜［赫尔姆霍茨在《物理学年鉴》（lxxxvi, pp.501 ff.）中强调了这一事实以及下一事实］。最后，由于眼细胞介质、纤维、细胞膜的微观结构存在，折射会导致不规则的散射现象。迈耶（meyer）在《物理学年鉴》（xcvi, p.235）中介绍了一项特别的研究，其中他发现光源周围有彩色光晕的现象，就是由于这一原因而产生的。由于这最后一个原因，以及光源形成的影像对视网膜其余区域的分散性反射，影像周围的光是整个视网膜区域中最亮的。然而，整个视野都会被照亮，只是亮度从影像对应区域开始逐渐向外周递减。

由于以上这些因素的联合作用，假如星星或者彗尾投射到眼中的微光，距离灯光在眼中形成的影像越近，那么被掩盖的可能性就越大，就像白天天空中的星光一样，因为在这个条件下，灯光形成影像的光场是最亮的。

因此，布鲁斯特（brewster）[25]陈述道：

“让点亮的蜡烛靠近右眼，烛光作用于部分视网膜区域，这会使视网膜其余区域对其他光亮刺激的感受，或多或少有所下降。被照亮的点附近感受性的衰减最强，其余区域距离照亮的点越远这种影响越小。在受到强烈刺激的视网膜部位附近，对于其他中等亮度的物体完全无法有所感觉；而且有生动色彩的物体不仅被夺去了光泽，更会慢慢地改变色彩。”

出于同样的原因，我们可以使用赫尔姆霍茨的方法[26]，在没有荧光物质的帮助下，看到使用平常方法看不到的太阳光谱中的紫外线。光谱中的其他射线会将紫外线掩盖，因此只需要采取一些措施，将这种射线与光谱的其他部分隔离开来即可。

从上述说明中还可以得到进一步的一般性结论。虽然在当照射光增强时，从黑色和白色表面反射回来的光会以相同的比例增加，但是此时黑色和白色表面的差异却会显得更大，这是因为相比于白色，黑色的亮度组成中内在光的成分更多。这也就是为什么在亮的地方比在暗的地方更便于阅读的最根本原因。

除了韦伯定律中有关光线强度的限制，我们还不能忘记强度以外的其他条件对于亮度差异知觉的可能影响，只有保证这些条件的一致性，韦伯定律才能有效。据我们所知，关于这些条件的研究目前还非常不充分。但我们还是会提到一些，到目前为止就我们的经验而言，这些因素非常值得关注。

在本书上说过，阿拉戈注意到被比较部分的运动对差异知觉的影响。福尔克曼也注意到了这个效应。在实验中，为了能够非常好地判断投影的出现和消失，产生投影的光源必须要被移动，这样就会导致阴影也会同时出现运动。在这种运动的影响下，1/100的最小可觉差异比值就可能会被修正。

我们在这里谈到的阿拉戈的实验中，实验对象并不是两个投影，而是下面的方法中所提到的客体。采用的仪器是一台望远镜，内部配置了一套洛匈棱镜，可以形成双重的影像，而在物镜之前有一个尼科尔棱镜[27]，将这台望远镜对准一个黑色硬板纸背景上的洞，通过这个装置，就能够看到背景后面的天空。转动尼科尔棱镜，就可以随意减弱两个影像中一个的亮度，与另一个影像相比就可以测得减弱的程度。两个棱镜主要部分的相对位置，决定了两个影像的相对亮度差异。按从目镜到物镜的方向，在望远镜内部直线移动洛匈棱镜，能够使得较暗的那个影像运动起来，通过这种方式，它的运动过程将从其边缘与较亮的影像正中相交的位置开始，移动到当两个影像的边缘刚好重合的位置为止。

在若干个观察者的帮助之下，以上述方式进行的三个系列实验中，当较暗的影像叠加在较亮影像上方，并且运动速度达到每秒12角分[28]，同时其亮度与较亮影像的亮度比值符合以下值的情况下，较暗的影像就会消失：

关于这三个系列实验中绝对值的巨大差异，阿拉戈说：“我不会尝试在这里解释，为什么三个实验中静止状态下的眼睛感受性会如此不同。这是一个和生理学有关的现象，我之后将会回过头来再进行叙述。”这种差异并不是由不同观察者之间的差异造成的，因为阿拉戈说，以上“由劳吉尔（laugier）先生、古戎（goujon）先生和查尔斯·马修（charles mathieu）先生获得的观测数据基本一致”，这种差异也不是由刺激的绝对强度差异造成的。因为这样会相当于承认我们的定律在一般的天文学领域的表现，是在某种程度上与阿拉戈论述的一般性实验结果相矛盾的：“我们可以说，计算获得的信息能够帮助我们判断该范围内的暗度水平，结果告诉我们当投射到较亮影像之外的较暗影像亮度只有前者的1/2100时，它就会消失。”

下面福斯特（förster）[29]的记述同样是关于运动的影响，这部分内容非常有趣。他在谈到自己的光度计时说：

在很暗的光照下看一个很小的物体，一段时间后会发现物体不是变得更清楚而是似乎突然消失了，但很短的时间之后又会重新出现。我相信这一现象并不是由于视网膜的属性之一，即能量的波动造成的，物体重新出现真正的原因，可能是在这个时刻眼睛发生了微小的运动，使得原先以其他方式激活的影像落入新的视网膜区域上。我正好有个机会与奥贝特（aubert）协作（参见v.gräfe'sches arch.，3）进行了关于视网膜空间感觉的实验，这是个能够很好地验证这一事实的机会。我们在暗室里从几英尺之外观察几张面积很大的白纸，纸上写着巨大的数字，纸张之间存在着很大的间隔，这一个过程的关键是要保持眼睛静止不动。房间非常暗，以至于那些数字对我们来说看起来就像是白纸上的污渍。我盯着其中一个数字看，不久之后——在亮度固定的微弱照明条件下——我所注视的数字与其他数字一样，都完全消失在灰暗的纸张之中，作为背景的纸张也变得越来越暗。当这种情况发生时，我就无法继续注视，眼眶有种难受的感觉，而只要此时眼睛进行一下微小的调整，我就会立刻又看到整张纸及纸上污渍般的数字。眼睛的运动要么是如上述这样被注意到的，要么是有意识地做出的，或者我们也可以从上述事实推断，最终，一个与先前不同位置上的数字出现在了注视点中。

现在尚不知道运动是如何产生这种影响的。

目前所获得的事实认为，运动使差异投射到一个新的且尚未疲劳的视网膜位置上，所以会产生这种效果，但是由于差异双方本身并没有因为运动而改变，而只是改变了这种非常细微的差异出现的位置，所以这种疲劳的状态似乎并不会因为运动程度的多少而减弱。[30]

另一种可能是，运动对差异感觉的提升是由于对多个刺激差异的多重感觉联合导致的，而不仅仅只是取决于刺激本身的新鲜感。也许在刺激发生后的一段特定时间内，许多印象将会以总和的形式相继被激活。最后，以下情形（至今还没有公开解释过）可能暂时可以从一般性的角度解释运动的影响。对任何两个不同大小的刺激进行比较时，使用同一器官相继进行比较，相比于同时进行不同器官的比较而言，成功率要高得多，这与韦伯在他实验证据的基础上所提出的观点类似，本书上曾提及过这部分内容。即当我们比较两个重量间的微小差异时，使用同一只手相继提起重量进行比较，会比使用两只手分别同时提起两个重量比较来得容易。而在我们的实验中，通过对光的运动控制，使得同时投影到视网膜不同区域的两个刺激间的差异关系，变为了相继投影到视网膜上的两个刺激之间的差异。原本视网膜上的一点受到强光的刺激，而运动使得照射到这点上的光变弱了，相反的情况也同样存在，运动越快，在一段给定时间里光线相继达到视网膜上的点就越多。然而，这种解释目前仍然只是一种推测。

还有一个影响差异感觉能力的因素就是刺激大小，但其实只要它们的强度大小保持在某个具有可比性的范围内，这一因素就并不影响韦伯定律。这个结论是根据有关星星和投影的扩展实验中获得的事实而直接推断出来的。但是，相同强度的点光源与面光源相比，却更难从背景中被辨认出来。由于我将在第十一章中更详细地讨论这一问题，所以就不在这里深入叙述了。

第三，有研究表明一个给定的相对亮度差异，当构成这个差异的两个刺激较暗且背景较亮时，相对于刺激较亮背景较暗的情况，更容易被分辨出来。关于这一点，首先有阿拉戈采用测光装置，在一种或多种实验条件结合的情况下进行了研究，基于自己的实验[31]

做出了专门的论述，另外汉克尔也通过其他的测光实验发现了同样的结果，证实了这一情况（目前还未出版）。

最后一点需要注意的是：虽然在许多方面音高和颜色都可以进行有效的类比，但对音高适用的韦伯定律在颜色领域内却并不适用，这也是一个明显的例外情况。正如下面马上要提到的，音高实验考察的是对振动中可觉差异的等价性判断，而颜色则与之不同，因为无法使颜色的振荡频率等比例地变化。的确，在光谱范围内，眼睛一般很难分辨出颜色上小三度——甚至是大三度——的差异（一个比喻），但在黄色或绿色的范围内这种最小可觉差的变化却非常快，以至于从黄色到绿色过渡的每个可识别的差异都像个小半音一样突出。[32]此外，音调和颜色之间还有很多没有讨论的问题，因此它们之间的类比不能成立。

声音

关于声音，我们必须区分噪音和乐音，噪音没有特别的音高，只有强度可供测量，而乐音除了强度（声强取决于振幅，与其平方成比例），还有音高（由振动的频率决定，也是其物理测量的参数）。使用噪音和乐音都可以研究强度，但是要研究音高只能使用乐音。首先让我们先来对强度进行研究。

在维洛特的指导之下，伦茨和沃尔夫[33]使用正误法进行了实验，他们在合适的环境下，将滴答作响的钟分别放在与耳朵距离不同的几个地方，对响度的差异判断进行了研究。以下是他们的主要研究结果：

“如果两个强度较低的声音一个紧接着一个相继呈现，而且两个声音的强度比例达到100:72，那么在所有情况下被试都可以非常清楚地区分这两个声音了，而且随着差异绝对值的增加，判断的肯定性就越高。若两个声音的强度比例为100:92，那么正确判断的次数就会超过错误或模糊判断的次数，虽然超过的值并不大。”

这些仔细设计的实验值得引起我们的注意，因为它们是使用正误法的良好示范，并且它们指出了我们对于声音响度差异的辨别能力相对较差，这些事实对于接下来的内容很重要。然而，这些实验并不适合于验证韦伯定律的有效性，因为它们的设计目标并不是研究不同绝对刺激强度下的差异感受的等价性。而下面的实验是有关于这方面内容的。

在福尔克曼完成了他的测光实验之后，我向他提到了韦伯定律普适性的重要意义。他当场就即兴发挥设计了一个实验装置，供我用来实现验证声音响度范围内韦伯定律的初实验，我当天就以低廉的造价将这套设备制作了出来。

这套设备是由一把能够自由摆动的锤子构成的，锤子会撞击到对应圆盘中的一个物体，物体的材质不同，要么会发出要么不会发出声音。一根坚固的编针作为摆锤的轴。这根轴是固定在一根横木中两个黄铜制成的孔上，而这根横木的两头又是固定在一块厚木板的两个顶端的。从自然状态上说，锤子重量是重或轻、锤子落下前相对于圆盘的高度是高或低、人距离设备的距离近或远等，都可能控制锤子发出的声音是变大或者变小。由于在最初的设计中，并没有设计用来判断锤子释放前高度的分度圆装置（机械中的专业术语），所以便在设备旁放上了一段有着几个高度标记的象限仪，每次锤子释放前的高度都依靠该象限仪来确定。锤子是木制的，撞击的是一个方形玻璃瓶。事先设定两种下落高度，对应两种声音之间的差异足够明显，能使站在设备旁的观察者无需了解具体下落的高度，就能准确无误地判断出哪个声音更大。但是这两种声音之间的差异又要足够小，能使得当这种差异减小一半时，判断不如上述情况中的那么准确，观察者有时会做出正确的有时又会做出错误的回答。然后，观察者朝向远离设备的方向分别迈出6步、12步、18步，以保证与设备之间的距离至少是最初距离的12倍。在每种距离条件下，都要针对两种下落高度多次重复同样的实验，与前面的实验相同，需要先呈现给观察者一个非常小但却仍可以确信是否存在的声音差异。如果距离变为原来的12倍，观察者听到的声音强度就变成了原来的1/144[34]，而两种高度产生的声音差异一开始就只是略高于最小可觉程度，因此假如对声音强度差异的判断是依赖于绝对强度的大小，那么此时的差异就应该变得无法辨别。然而，在所有的三种距离条件下，观察者对差异的判断却仍然非常有信心，而且成绩也和在设备旁边时一样好。

虽然这一实验设计和实验设备从某种程度上说仍很粗糙，但已经充分覆盖了其中的关键点，并且结论很有总结性，从中我们可以预见，就算采用更精密的实验设备进行更精细的实验，也不会得出其他的结果。福尔克曼后来的实验的确证实了这一猜想，他特地设计了一个规模更大的实验，其中声音的强度能够增大100倍以上。然而他的实验中没有使用落锤法，而是在采取了适当的防护措施的前提下，让铁球自由落体到铁盘上以产生声音。我也参与了部分实验。在实验中，铁球下落的高度、铁球的质量以及观察者与装置间的距离，均可以在很大的范围内变动。在铁球下落轨迹的一侧垂直固定了一个刻度装置，用以精确测量铁球下落的高度及其变异值。从方法和结果这两个方面来看，这个实验与之前描述的其他实验是基本一致的。当绝对声音强度变化值达到最大程度，前后两次铁球下落高度的比例为3:4时（即声音强度的比例也是3:4，后面我们将会进行说明），正好足以使两名有良好分辨能力的观察者能做出正确的判断。这一比值与伦茨和沃尔夫的实验结果非常相符。

下面是从福尔克曼的日志中摘录的，是有关实验的详细描述：

将一根标有刻度的棱柱竖立在一块平板上。可以通过三个螺丝调节棱柱以保持完全竖直。棱柱上有两只可以滑动的水平臂α和β。金属球从这两只滑臂指示的高度开始下落至平板上。使用拇指和食指捏起金属球，指尖靠在水平臂α或β上，然后小心地分开两个手指释放金属球。我有两个重量相同的球，左右手各取一球，这样就不需要在释放了第一个小球之后再寻找和提取第二个球，减免了一次动作。

观察者与仪器之间的最近距离为1米，最远为6米。

铁球先后两次下落高度的绝对值之比为3:11。

两个不同铁球的重量之比是1.35克：14.85克……

我和海登海因遵守上述的声音差异范围设定，进行了大量实验，结果发现，在声音的强度之比为3:4时我们能够非常确定地分辨出差异，而当差异比例下降为6:7时，我们就会变得犹豫不决并产生一些错误。

但是另一方面，在声音的强度之比为3:4时，费希纳却会频繁出错。不过，显然练习会影响他的判断能力，因为在实验末尾一次很长的系列测试中，他每次都能够正确判断出强度为3:4的声音差异，而在实验开始阶段他的错误次数多于正确次数，在经过了一段时间的实验之后，他的判断中仍有1/3是错误的，只有2/3是正确的。

早期的实验都是基于最小可觉差法的。出于我之前已经说过的原因，这种方法不能达到像正误法和平均误差法那样的精确度。因此无疑地，使用那些方法进行的实验都是值得商榷的。不过考虑到实验中声音刺激的绝对强度变化范围非常大，所以这些结果通常也足以证明定律的有效性。这些已有的实验最多只是在低值位上与定律存在一点偏离，我们没有必要为这样的概率水平给出任何理由。

关于此类实验中将要使用到的装置，从理论和实践方面补充一些内容说明似乎是很有必要的。

沙夫豪特[35]曾经描述过一个使用下落的球发出声音，来测量对声音感受性的装置，不过这个装置只是用来了测量绝对感受性。

音摆也被用来进行这方面的研究。伊塔德（itard）[36]曾使用过一种测量听力障碍者听觉感受性的仪器，该仪器被称为听力计。仪器的构造是这样的，基座上有一根立柱，柱子上固定着一根横杆，杆上自由悬挂着一个锤制而成的铜环。铜环受到音摆的敲击而发出声音，摆下落的高度使用刻度弧来测量。

我自己也曾经制作过一个双音摆，结构与上述的音摆相似，差异在于我采用的是两个带刻度的音摆，它们分别敲击一块石板[37]的两边以发出声音；不过我还没有机会使用这个装置来进行实验。

接下来的评论是有关于这些装置相关的理论的：

如果忽略空气阻力和其他可能干扰因素的影响，那么当物体自由下落或者音摆敲击另一个物体时，产生的声音强度与下落的高度以及下落物体的重量成正比。[38]

实际上，声音的强度和发声物体振幅的平方成正比；而振幅（根据那个著名的公式）与粒子经过其平衡位置时的速度成正比，这一速度也是其离开平衡位置时速度。因此这一速度又取决于下落物体的重量及撞击时的速度。根据自由落体定律，下落物体撞击时的速度（即下落时的最终速度）与下落高度的平方根成正比。即下落物体撞击时最终速度的平方与下落的高度成正比，因此粒子经过其平衡位置（诸如此类的位置）时速度的平方也与下落的高度成正比。我们知道，无论物体是自由落体还是按照弯曲的路径下落，只要是经过同样的高度，对下落的音摆和对自由落体的物体而言，最终速度是一样的（假设轴的摩擦阻力可以忽略）。我们必须注意的只有一点，如果声音强度依赖于下落时的高度这一假设是正确的，那就不能在释放物体时为其施加初速度。因为实验中我们采用的下落高度值都很小，所以在这种条件下空气阻力基本可以忽略不计，我们按照正常情况进行操作即可，尤其是使用铅作为下落物体的材料时。

以上论述表明，音摆发出的声音强度并不是和音摆释放时的角度φ（摆角）成正比，而是与释放时和最低位置之间的高度差成正比；换句话说，是与1-cosφ=2sin2φ/2成正比。可以据此来校正音摆。因为cos45°等于=0.707而cos90°等于0，所以这两个高度产生的声音强度之比为比1-0.707（=0.293）∶1，约等于3比10。而60°、90°、180°对应的声音强度之比为1/2:1:2。只要摆角不超过60°，就可以将声音的强度近似等于摆角的平方，所以摆角增加为原来的2倍，声音便增强到原来的4倍，摆角增加为原来的3倍，声音便增强到原来的9倍。[39]

下面的简表列出了0°到90°之间的摆角对应的声音强度，以及从声音强度推出的摆角角度，90°摆角条件下的声音强度分别被定义为1（第1部分）和10（第2部分）。180°摆角产生的声音强度是90°时的2倍，90°到180°之间的摆角产生的声音强度均在这个范围之内。不过，我们一般不太可能使用大于90°的摆角。

声音强度与音摆摆角的关系

续前表

至于音高方面的研究，我们已经看到韦伯以及他引用过的德勒泽纳都进行过一般性的描述，他们采用了振动的次数取代了刺激强度。不过我很确定的是，德勒泽纳在自己书中提到的研究主要是关于偏离某些音程（例如单音符、八度音程、五度音程等等）多大的程度，音调仍能够被区分出来，而不是直接研究韦伯定律所提出的问题，即两个音调（在不同高度）的振动次数比例保持相同时，它们两者间差异的可辨别性是否保持不变。同时并不需要专门设计实验去验证定律中的这个问题。毕竟，对于精通音乐的人来说，相同的振动比率对应着来自不同八度的两个声音间的同等大小差异，证明这一点是很简单的——甚至可以说是根本不值得一提——这样我们可以认为这种证明比其他情境下的更为直接，而且甚至可以产生更大的差异。欧拉、赫尔巴特和德罗比什也曾在他们关于音调关系的数学问题中以这一事实作为结论的基础。

我有时会在实验中使用木质的音摆敲击木块发出声音，然后请一些精通音乐的人，让他们将45°摆角和90°摆角时产生的声音强度，与音高的比率对应起来。其中一部分参与者表示他们做不到这一点。而非常惊人的是，其中大多数可以完成任务的参与者（他们都是独立完成任务的，不知道别人的判断结果）都认为两个声音间的差异可以类比为四度音程。不过我不准备在这里过多讨论这些实验，因为它们都还很粗糙且未定型，而且得出的结论也不一致。就我个人来说，我仍怀疑是否能够将两个声音强度的比率和所产生的音高感受进行直接的类比。但不管怎样，这些实验确认了伦茨与沃尔夫，以及福尔克曼得到的结果是可信的。根据这样的结论，我们就应该得知，这种相当广泛的声音强度差异（3:10）并不会造成巨大的感受差异。

关于这一问题，我联想到曾在莱茵合唱节上遇到一位音乐家［小提琴大师冯·瓦希莱夫斯基（von wasilewski）］，他提到一个非常有趣的现象，即一个有着400名男性的唱诗班发出的声音，听起来并不比只有200名男性的唱诗班更响。

重量

在本书我曾经提到通过最小可觉差法获得有关韦伯定律的结果，这个结果为重量判断中定律的适用性提供了第一个证据。韦伯的实验有着特别的优点，即在他的部分实验中，皮肤对压力的感受性可以与肌肉感觉相分离，而类似方法进行的其他实验则大多是基于两种感受的结合。另一方面，我自己通过正误法所进行的实验中，关注的则是在提举重量的比较过程中，这些感受自然结合情况下的结果，我马上就要讨论到其中的细节问题。通过我的操作模式，不能精确地区分这两种感受。然而鉴于韦伯定律保证了自己的准确度，所以每个对于定律的有效证据似乎都是有用的。另外，这些实验本身也就是作为检验韦伯定律的研究方法而存在的。

为了让读者更好地理解接下来的描述，会经常参照本书关于方法章节的内容。然而我认为没有必要再回到其中的细节上。另一方面，读者会发现接下来讨论的内容中，包含了很多先前介绍过的证据和案例。

接下来将讨论两套重要的系列实验，一种是双手操作实验，另一种是单手操作实验（分别用右手和左手进行实验）。两种实验的过程基本类似，均包含六个水平的质量，即300、500、1000、1500、2000和3000毫克，两类实验的结果基本一致。单手操作系列于1856年的10月到11月间进行，双手操作系列则是在1856年的12月到1857年的1月间进行。这些实验的环境从本质上说，与描述的一般条件一致。我们需要特别注意以下事实：

每个系列实验均包含了32个实验日，每个实验日里有12个实验区段，每个区段由64次重量提举组成，也就是说实验总共包括32×12×64＝24576次简单提举的试次。每一个标准重量p（其重量将定时更换）对应两个特定的增量比例值作为附加重量，分别是0.04p和0.08p。使用后一种附加重量更容易为被试察觉出变化，但从后续表格中可以看出，被试仍然会犯下相当量的错误，因为被试高估了自己的能力。这个结果的原因可以参考有关实验程序的阐述，其中被试的每次判断都仅仅是基于一次配对的重量提举，而不是基于多次重复的提举，在这个程序中被试对d＝0.08p的比较很少产生错误的判断。每天的实验中需要举起12×64＝768次重量，给六个标准重量中的每一个都分配了两个实验区段，每个区段64个实验试次，每天所有的实验试次均是与同一个相对d值进行比较，d值只有在数日或者数周后才会更改一次，这在下文中将会介绍。同时，每天实验程序中标准重量的出现顺序会按照升序（↑）和降序（↓）隔日进行轮换。无论是双手还是单手操作，每个标准重量都对应了32×128＝4096次重量提举的比较。其中2048次是与d＝0.04p进行比较，与d＝0.08p进行比较的次数相同，这2048次中，重量升序（↑）和降序（↓）的次数分别为1024次。双手操作实验中每天针对每个标准重量的128次提举是连续的。而在单手操作中则每64次左手实验后接着进行64次右手实验，并且接下来的实验部分中轮换两只手进行实验的顺序。d＝0.04p与d＝0.08p这两种附加重量条件，在双手操作实验中是两天一轮换，而在单手操作实验中则每八天一轮换。这样的实验程序导致在双手实验系列中，两种d导致的感受性值非常相近。因此这个实验系列可以用来证实我们的定律，即假如感受性h是固定的，根据d的大小就可以获得正确判断占总判断次数的比率r/n。[40]但在单手操作实验中情况则不同，如在我的评论中提到的，以0.08p作为附加重量的实验周中，感受性值与0.04p的实验周相比，前者较低。然而现在我们关注的是标准重量的大小对于感受性值的影响，这在单手实验与双手实验中的结果是一致的。

为了开始最简便的系列观察操作——即使这些观察并不是最精确的——我将先给出所有标准重量p对应的总正确判断数r。这些值是按照它们的主要条件进行分类，而不是根据四种主要条件准确对应的测量方法进行分类（即可以计算出t=hd值的方法）。但即便不进行上述计算，我们关心的主要结果，也可以通过正确判断的总次数r与所有判断之间的关系获得。对于同样的实验系列结果，即便采用了更精确的处理方式，也不能获得比先前更精确的证明结论。

这里使用的重量单位均为克。

为了防止下表中数字的意义有可能被误解，所以我将重点解释一下第一张表中的第一个数字。对应于p＝300, d＝0.04p, n＝1024（↑）的数字612表示，标准重量等于300克，附加重量为0.04p（也就是12克）时的实验日中，所有使用升序变化条件下（↑）的正确判断次数的总和为612，而在相同条件下所有的判断次数总和为1024。错误判断次数则相应地为1024-612＝412。其他数字的意义依此类推。自然地，因为最后一列的r是同一行中前面四列的数字加和而得到的，所以对应的总判断次数是前面各列n的4倍，即括弧中的4096。另外，最后一行的r是基于同一列中前面六个p对应的数字加和而得到的，所以对应的总判断次数是前面各行n的6倍，即6144。

1.双手操作系列中正确判断次数r

2.单手操作系列中正确判断次数r

可能读者会很容易注意到，在这里我略显不恰当地省略了有关表中不同条件下不同结果的讨论（比如对于不同的d值、左右手的差别、↑和↓的差异）。这些问题的细节将在《测量方法》一书中进行讨论。这里之所以分类给出这些差异结果，主要是为了展示不同条件但同样的程序情况下正确判断次数的变化，即正确次数随着标准重量大小的上升而缓慢上升，当重量达到最大的2000克或3000克时，上升的幅度就微乎其微了。当我们认识到不同实验条件下的变化一致性后，就只需要关注最后一列数据，也就是在两个表格中，每个标准重量条件下n值为4096时的正确判断次数之和这一数字即可。

这些实验的数据应该可以直接且精确地支持韦伯定律，也就是在不同的标准重量条件下所有的r值应该不仅是相近而且应是一模一样的，因为附加重量与标准重量的比值在所有的实验条件中是一样的。但事实并非如此。不过，本实验数据与定律预测值之间的偏差并不是关注的重点，因为它与光感受性实验中那种真正的偏差是有差别的，这种偏差应该同样被视为是定律作用的结果。就像我们在光感受性实验中即使没有额外的光线，也必须考虑到内在光造成的影响一样，在本实验中，我们也要考虑手臂的重量甚至是覆盖手臂的衣物重量（在本实验中只有很轻的衬衫袖子需要考虑[41]），这些重量在没有提起外部重量p的情况下也是存在的，因为在提举物体的过程中这些重量一样也被提起了。现在，就像之前实验中当内在光相对于外在光小到可以忽略的程度时，定律就可以通过实验得以证实一样，在举起重量的过程中手臂的重量相对于需要提起的重量物也可以忽略时，定律也才得以成立。

实际上相对于理论值，我们只在最大的重量值上观测到不是很明显的偏差，而且这偏差是按着先前概念中所期望的方向发展的；也就是说，正确判断的数量多少是随着p值的上升而上升的。如果我们考虑到实验过程中保持不变的绝对增量a，也就是手臂的重量，这个重量增加到不断增加的标准重量p上（d值只是随p值成比例地变化），于是就有了d/（p+a）这个表达式来预测正确判断的数量，其中随着p的增长，分母中a起到的作用相比于p自然就会越来越小。当p值变大到超过某个程度，a的作用就可以开始忽略不计了。这个论断已经获得了实验证实。

既然手臂的重量是值得考虑的，但令我们感到奇怪的是，p值从300克到3000克这个逐渐增加的过程中，并没有因为手臂重量的影响下降而导致p对应的正确判断次数显著上升的情况。令人更震惊的是，在最小的两个p值，即从300克增加到500克时，正确判断的数量并没有显著上升，甚至在双手实验中产生了小幅度下降。这个反常的现象我们稍候再进行讨论，它并不是一个常态的现象，因为第一，我们并不能确定手臂对自身重量产生的感觉是否和外部施加重量的作用方式一致。第二点，必须注意到当举起重量p时，我们是使用整个手臂为杠杆，被提举的物体位于杠杆的一端，而手臂的力矩（作用点位于其重心）相对较短。第三点，即便是增加了对力臂的考虑，我们也只是关注了肌肉的运动，而没有考虑压力的感觉，因为只有重量p能够对皮肤产生压力觉，而手臂的重量却不能。第四点也是最后一点，我们必须考虑表中正确判断的数据并不是为我们提供一个准确的感受性标准，而仅仅是为了证明感受性随着标准重量的增加而变化。我们提到的问题在这里表现得很明显；而且我们必须特别注意一下提到的实验环境问题，即当标准重量增加时，提举的时间顺序p产生的影响作用就会增加，同时根据内容，在这个事实下正确判断的次数总和，比无影响假设下的期望次数要略小。事实上如果没有这些误差的干扰，标准重量最大时的正确判断次数应比现在要更高一些，而且因此应该与标准重量最小时的正确次数间的差距要更大一些。这种情况在小附加重量0.04p时表现得尤为明显，而相比之下，大附加重量0.08p中这个p的作用多多少少可以理解为消失了。因此我们会在双手操作实验中发现，1500克与3000克在0.04p条件下的正确判断次数分别为1321和1335，在0.08p时则分别为1592和1657。在单手操作实验中也是类似的情况，0.04p时对应的数值分别为1465和1460, 0.08p时为1687和1726。两种类型实验中表现出的数值差异是一样的，均为0.08p时的值大于0.04p时的值。

通过提到的完全补偿程序来彻底去除次要效应造成的干扰，这个方法主要是对四种主要实验条件进行分别的计算来实现分离。我们首先看到，在接下来的表3中列出了根据四种主要条件计算的r值。而在表4中列出的是根据基本表求出的t值（不包含子群）。在《测量方法》中我将给出单手实验中计算得到的数据。这里我不想加入太多的表。接下来关注的是对结论性结果的讨论，这在表4的4hd和8hd两列中给出。表4中剩下的数据和表3中所有的数据都仅仅是为了给这个结果提供一个基础。不过在说明结果提取方法和证明方法的总体细节上，这些数据还是有用的，所以应该顺带展示给大家。

3.双手操作系列中四种主要实验条件下的正确判断次数r

4.根据前表得出的双手操作系列t值　n＝512，υ＝1

为了更清晰的表达我的观点，我想对两张表的第一个数据再进行一次解释：

表3中当p＝300, d＝0.04p, n＝512时，r1＝328这个数值意味着，标准重量p为300克，附加重量d为12克，在第一种主要实验条件（也就是d处于左边容器并且先被提举起时）下正确判断数量r1的值为328。

表4中对应的t1＝2547是从基本表中推出来的，通过r/n＝328/512＝0.6406这个数值可以推算出相应的t值。表顶端n＝512和υ＝1表示每个t值是从1倍的512个实验试次（不包含子群）中得出的。

这样就可以看到r值在四种主要实验条件下的变化，并且能够得出标准重量变化带来的影响。当p＝3000时，正确判断的次数r＝244，因此比错误判断次数268小（由总判断数n＝512减去正确次数可得），所以我们得到的t值就是负的（见表4）。顺带提一下，这样的情况在我其他的观察表中还是比较常见的。

大家也可以自己使用表3中的数据，通过介绍的规则，来完全平衡和确定p值和q值的影响，虽然我们现在对这些测定并不感兴趣。

而且，比较t值表中d＝0.04p和d＝0.08p时的总和值，检验它们是否有显著的成比例关系，也能够得出让人信服的有价值的结论；换句话说，0.08p条件下的总和值是0.04p条件下的两倍。这个事实证明了根据[42]所提到的方法进行的计算是正确的。不过在这里，我暂时不会对这些内容进行详细的说明。

关键的问题是，在不同p值条件下，表中根据t1、t2、t3、t4得出4hd和8hd对应的总和值，在多大程度上能够保持稳定。如果我们的定律是正确的，而且手臂的重量没有加在p值上（或相对于p很小），它们就应该是稳定的，就像用以计算出t的r值一样稳定。

两列4hd中和8hd列中的值才是我们真正关心的测量结果，前两列数据是有关于不同重量间的对比，而最后一列则将它们放在一起考虑。这些值同样是独立于有关不同容器的时间影响p和空间影响q的，也就是说，这些值是差别感受性h与附加重量4d或8d相乘得到的结果，所以对于不同的标准重量而言，其对应差别感受性的量度h值可以通过除以4d或是8d获得。[43]根据我们的定律，由于标准重量p与附加重量d是成比例的，那么除去手臂的重量，这一指标（h）与p也应该是成反比例的。但4hd与8hd的结果在不同的标准重量是一致的，所以上述这种假设不成立。现在既然这些偏差的等价性证明比成比例的证明更容易，那么我们将放弃计算h值，而是使用得出的4hd和8hd进行计算。

为了更清晰的总结之前提到的三列关键数据，我们分别除以4或8，只保留单独的hd值，具体见下表。根据使用的命名规则，在每列平均值上分别指定υ＝4和υ＝8，每列中的数据都是来自n的4倍或者8倍次数观测的平均值，n等于512。

5.双手操作系列中的hd值　n＝512

如果我们想要定义hd的抽象概念，它在这里只是为证实我们的定律而存在的，对这个实验具有一定的意义，那么可以使用以下的方法：如果我们使用的每一个标准重量，并不是像标准实验中那样相同的相对附加重量，而是混合使用的成比例的附加重量，那么将其除以hd或给定几倍或几分之几的hd，总是能够得到相同的r/n分数。比如，在接下来的双手实验中，我们就必须将与标准重量2000和3000克成比例的附加重量值，除以与4500和4909[44]成比例的数值，这样才能得到同样强度的感受。

虽然这些并不是我们计算的确定结果——我们后面将会呈现——我还是在这里把它们列出来，因为它们和最终的结果并没有显著的差异，所以依然能够成为可靠的证据，同时它们的论证基础与最终结果间并没有太大的偏差。我们可以根据第八章给出的规则进行再计算。有人在不分组的情况下用相同的p和d进行了一整个月的观察，从中采集每个条件下正确判断的数量，最终获得了和基本表中的t值一致的结果。就像指出的那样，我倾向于在所有的实验系列中，根据不同的实验条件划分出每组n＝64的子集，然后分别计算它们的t值，最后将它们加起来并计算平均数，这样做是为了确认排除p和q的影响而产生的变异。在双手和单手实验系列中均执行了上述的实验流程。在这里，列出每个从包含了64个实验试次的子集中获得的正确判断数量以及对应的t值，将会占用太多的空间。所以我决定限制一下内容，在这里只按照υ值将每个实验进行分割列出结果，以这种方式作为我在两种实验系列中的最终结论。

6.双手操作系列中的hd值　n＝64

7.单手操作系列中的hd值　n＝64

在这里我将通过表5和表6的对比，再次阐述一下计算方法中的要点。两张表都是属于双手操作系列，并且是基于同样的数据。它们的区别仅在于表5中的数据是以n为512为基础计算hd值的，没有进行分组，而表6是按照n为64进行分组来分开计算的。因为这个区别，后一个表中所有的数值都比前一个表中所有的值略大。假如这种区别相对于所有的数值都是一致的，就不必对这个问题太过担心，因为我们关注的只是成比例的变化。然而，也有数字变化的比例比其他数字要大。通过对每个实验系列进行单独的检验后我们发现了造成这个差别的原因，是因为执行每个系列的实验月份中，p和q完全不可能保持稳定，而是发生不规则的变化。通过将这些实验系列继续细分为如此多的子集，就可以忽略每组中的不规则变化，这样我们就能通过消除p和q的变异性而去掉这一不利因素的影响。因此，表6的数据比表5的数据更有价值。然而与此同时，两个表中的数据并没有出现决定性的差异，所以人们很可能选择第一个表，因为其中的数据更简洁。无论如何，对比这些表的数据可以给我们提供一种信息，即通过良好的分组可以使绝对测量维持相似的变化。

比较单手操作与双手操作系列的数据就可以发现，两组实验结果的比值在随着标准重量的增加而逐渐地下降，并且趋于稳定。

简单地看一下表6和表7中的数据，就会发现两者的结果几乎是一致的，另外除了在p值较高时，hd值随着p的增加而增加的幅度相对于r值要更加明显之外，两张表中的结果和先前r值表的结果也非常相似。总的来说，这些参数随着p值增加而增加的幅度明显趋于一致。

我们发现在双手操作系列中，三个最大的p值1500、2000、3000对应的hd值分别为4342、4500、4908，而单手操作系列中则分别是5682、5639和6152。p值从1500到3000间数值翻倍，而hd值相对只是仅仅增长了一点点——大概分别为1.13或1.08倍。

对于我而言，是非常有兴趣地看到较大重量值条件下的hd均存在等价性，尤其是两个最大的重量值2000和3000克对应的hd值也大致相等，因为它们对于我们定律验证是如此重要。我同时利用这个实验系列的机会，将双手操作和单手实验串联起来，进行一项两者间的比较。因为这两种实验在之前是作为一个整体存在，一个接一个进行的，并没有提供任何的对比处理。另外，我也想进一步测试实验中获得的t值与使用的d值间的比例。

上述这项系列实验同样持续了32天，是于1858年的12月和1859年的1月间进行的，遵循的是描述的标准条件。虽然从时间上而言这次的实验与先前实验之间的间隔比较久了，但它们是非常类似的。每个实验区段由8个分组构成，每个分组包括64次重量提举。因此整个实验序列包括32×8×64＝16384次重量提举。每天改变标准重量值。单手操作与双手操作实验每两天交换一次。另外每天实验中每进行两个分组实验后，额外重量会在0.04p和0.08p之间更替一次，具体地说，就是当p为2000克时d值在80和160克之间更替，而p值为3000克时，d值在120和240克之间更替。同时在单手操作中，就如我常操作的那样，每隔64次重物提举之后，即完成一个分组实验后，我都会在左右手间交换一下再继续实验。

为了和之前的实验系列有所区别，这部分实验被称为单双手操作系列。我先通过表8将预实验中四种主要条件下的r值总和列出。表9则是将每组64次实验的结果，按照四种主要条件分类进行hd值的归集。虽然由于篇幅限制，我在这里就不给出具体的计算原理，但具体过程是与之前表6和表7中的是基本一致的。

8.单双手操作系列中的正确判断次数r

注：当p＝2000时r的总和为5875；当p＝3000时r的总和为6002。

9.单双手实验系列中的hd值　n=64

注：当p＝2000时hd的总和为31186；当p＝3000时hd的总和为32938。

如果严格按照之前的实验环境和计算方法来进行上述这部分实验，那么当p值为2000和3000时，表9中的数据应该和表6和表7中的趋势是完全一致的。然而，我们发现本实验中双手的数据比先前实验中的要明显来得小。事实的确如此，而且在单手的数据中，当0.08p的情况下与先前实验暂且差异不大，但是当0.04p的情况下，本次实验数据就明显小很多。同时我们应该记得，单手类型实验在d值为0.04p与0.08p两种条件下是没有可比性的，因为根据说明，后者显然不是前者的两倍，因为两类数据是根据不同时期进行的实验而得出的。这个结论支持的内容，即使所有的外部实验环境一致，也不能说不同时间观测的结论具有可比性。不过同时，这对于我们所关心的每个系列内数据的可比性并没有影响。

在这次这个实验系列中，我们发现当同一天中d值变化时，根据r值计算得出的hd值与给定的d值仍然成比例，这也验证了我们所使用计算方法的有效性。

在最终的结果中我们发现，当p值从2000变为3000时，hd值仅仅从31186变为32938。形成偏离韦伯定律理论值的准确原因我们之前已经解释过了，是因为额外的手臂重量没有参与计算。相比于其他表中的数据，9464显然大了很多，这可视为是一个小概率事件。因此我们看到的差距比应该达到的水平要小一些。否则，当前实验对于之前的实验结果应该是一个完美的验证。

手臂的力矩对重量提举产生了多大程度的影响，很难事先进行量化，一方面是因为活动的手臂力矩很难测量，另一方面是因为肌肉感觉参与到整个实验过程中的程度也不够清楚，所以在假设我们的定律正确的前提下，有人可能会认为根据我们计算出的hd值就可以推算出增加到p上的具体数值。然而细想一下，仅仅以目前的这些因素来达成这一目的显然是不够的。

根据独立误差估计求和的统计理论，产生了以下的公式。假设肌肉感觉自身的作用可以表达为t′=h′d，给定重量d本身引起的压力作用表达为t′=h′d，则有以下表达式

我们可以用这个关系为基础来实现我们的意图。韦伯定律认为t′与p+a成反比，其中a可以通过之前的陈述来进行理解，而t′与p成反比。这样之前的公式可以改写成

其中c′与c′是常数。三个未知量c′、c′和a都需要从不同p值中获得的hd来确定。然而，即使我们能克服所有计算的困难，但我们依然要承认，较小的p值情况下感受性变化的不规则性仍然是精确计算的障碍。

当p值从300克变化为500克时，t值没有增加反而略有减小，这个异常的变化还不能够通过之前的理论解释。我几乎不能相信这是由于观察次数不够导致的小概率事件（虽然这个可能存在，因为两者间的差异不大，而且需要很多数据去确认这种差异的显著性）。但抛开两套均包含了很多个试次的实验系列不谈，相对来说，t值作为p值的函数，其增量的最大值应该出现在p值最小的时候，因为其中手臂的力矩已经达到最大值，所以p的力矩也增加到最大。另外，除非在重量最小的实验过程中可能存在着特别的干扰条件，更何况它在重量较大时就会被掩蔽，那么按照我的观点，这种效应应该在测量过程中能被感受到。

虽然我对于这种异常的情况给不出任何确定的解释，而且我也完全认同需要通过新的实验来验证这一发现，但在接下来的讨论中我将提供类似的案例来说明这种现象确实存在于自然界中。

有人假设可能压力的提高会造成感受性下降，这都是对神经末梢的机械压缩或者是与压力感觉关联的结构造成的（与感受能力的降低无关，根据韦伯定律感受性是与刺激的增加成比例的）。上述影响在重量较大的情况下消失了，相比于韦伯定律的影响，它应该具有一种更普遍更基本的原因解释，但可能只在重量轻的情况下才发挥作用。这可以解释为什么在p值最小的情况下t值不升反降。我不反对把这个影响与实验环境结合起来探讨，但一直困扰着我的是，虽然强烈的感受总是与很强的压力联系在一起，但相比于更强的接触，轻轻的挠痒这样的动作给人会造成强烈的感受，而且可能带来剧烈的反射行为。然而，我很愿意承认这个问题只是初步的想法，它需要更进一步的证据来说明，并且可能有助于后续工作的开展。

在有关重量判断和光的实验中，我们发现了韦伯定律普遍存在着下限这一事实，因为可以类推，很有可能还存在着一个上限，其中存在同样的数值关系。然而至今我的实验都没有继续探寻韦伯定律的上限，因为重量过大会对被试造成伤害。显然，我们采用正误法虽然进行了大量的研究，但远不足以保证在永远无害的前提下获取有效的数据。或许我们应该更倾向于使用最小可觉差法来获得更多的实验数据，而且不用担心对被试的伤害，因为这个方法所能达到的最高准确性程度与实验试次个数的关系并不是那么紧密。

回顾之前所叙述过的内容会发现，韦伯定律在有关重量的实验范围内，对有效性的观察和对其有效界限内容的探究仍还有很长的路要走。我的实验仅仅算是继韦伯提出其理论后迈出的第二步，目的是为了对原有的方法进行调整，后人研究时应当使用这些调整后的新方法。

我们只能说就目前看来，观测的结果与定律总体上非常一致，所以在既定范围内是没有理由怀疑其近似或准确的有效性程度的。然而，在下限时产生的异常，在上限时可能存在的疑问，对手臂重量影响的准确测定，对于触觉和肌肉感觉的明确区分，这些因素仍然需要未来实验的验证。总的来说，韦伯的实验是第一个对于这个定律进行的验证，但他的实验并不适合用来进行有关普适性的叙述。我的实验能够通过准确说明实验所在的环境，从而识别出数据中的偏差，但并不足以消除这些偏差。

毫无疑问的是，韦伯的方法中实现了压力觉的完全独立，其中重量压在手指的最后一节上，而整个手掌则贴在桌子上。韦伯在其论文中描述过他采用其他实验程序来进行关于触觉和一般敏感性的实验，在实验中，重量放在一块布上，观察者将布的四个角拧成一股，用一只手抓住，我认为这种处理能否独立于肌肉觉有待商榷。在这种方法中，如果重量超过一定的范围，布的四个角必然会从手指中滑落，除非观察采用更大的力量以对抗滑落的趋势，这样就会产生更大的压力。按理说，这种压力应该始终保持稳定，否则只会让问题进一步复杂化。

实际上，我想象不出能够精确地将肌肉觉完全独立的实验方法。或许相比于采用静止重量的形式，让球或小锤从一定高度落在皮肤上的方式，更适于有效地分离压力觉。将这种方式获得的结果与重量提举实验进行比较，将会获得相当有趣的结论。

不谈韦伯定律正确与否，人们可能按照我们刚刚描述过的方式，来直接解释实验中获得的结果，具体总结如下：

举起一个给定的重物，同时与另一个增加了附加重量的情况进行对比，那么如果给定重量增加，则也必须相应地增加附加重量，才能产生与先前相同的可觉差感受。

如果允许按比例地往标准重量上增加附加重量，这样保证其相对而非绝对的大小保持不变，那么由于标准重量的增长，相对重量增量也会略微变得更为显著。然而这个趋势是朝相等的方向发展的，在1500克和3000克两个标准重量水平下，为了感受到相同程度的相对重量变化，两者间所需要的附加重量变化比例差异却变得非常小，大概达到11:10。这意味着为了达到相同的可觉性，1500克和3000克的标准重量的相对增量必须达到接近11:10的比例，而不是完全相等；也就是说在正误法实验中，两者所导致的正确判断对错误判断的比率不是完全相等的。

随着标准重量大小的增长，产生相同感受性的可觉重量也必须正向地增长，但在低水平标准重量条件下却出现了例外。标准重量从300克增加为500克时，最小可觉差却没有增长，反而略微变小。另一方面，从500克水平往上，最小可觉差则一直在上升。

造成这个低水平标准重量条件下意外情况的原因并不清楚，并且在之前的文章中研究者们都只是进行了猜测。为什么标准重量增加后却没有发现相对等价的附加重量增加值，原因也许出在提举重量的手臂上，因为在提举重量的过程中还需要提起手臂，这样手臂重量附加在标准重量上，因此在计算等价的相对重量增加值时必须考虑在内，在计算标准重量时必须加上额外的手臂重量。

如果我们将多种附加重量加在同一个标准重量上，就可以更容易地发现当附加重量增加时结果的变化。因为这样能更好地感觉，所以在使用正误法进行重量比较实验时，在相同总实验次数前提下，正确与错误判断次数的比值有了提高。但是正确判断的次数却没有按重量增加的比率上升，而是按一个更小的比率增加。

基于给出的规则，根据基本表的数值，找到正确判断的次数随着附加重量变化的规律，已经通过实验结果获得了证实。

以上结果，是在标准重量为300、500、1000、1500、2000和3000克，同时附加重量设为标准重量的0.04和0.08倍的实验中获得的。假设重量提举过程中的时间和空间顺序导致的常误被消除的前提下，无论是单手还是双手提举重量，获得的结果都是一致的。

温度

当谈到韦伯定律在温度感受上的适用范围时，还有很多问题有待解决。韦伯[45]倾向于认为：“我们实际感受到的是皮肤温度的上升或下降，而不是实际温度的上升或下降的程度。比方说，人们通常不会注意到自己的前额或者手哪个更暖，直到他把手放在前额上，当人们这样做的时可以经常感受到较大的温度差异，有时他可能发现自己的手更温暖，而其他时候可能是前额更温暖。”韦伯提到的很多其他体验也基本上证实了这种观点。然而，如果感受到的温度与一般或平均温度之间的差异足够大，则我们就很有可能可以感受到持续的温暖或是寒冷。

然而如果有人想利用韦伯定律研究对于温度感受的差异性，那么刺激与之比较的参照点不是绝对的零度，而应该是我们感觉起来不冷不热的温度水平，所有相应的温度感受研究都将围绕着这个水平点展开，这是毫无疑问的。我们了解感受的差异可增可减，而韦伯定律需要解释的问题就是，温度发生等比例的相对增加时，即温度差而非温度的绝对值按照相等比例变化时，是否会带来相等的可觉性，通俗来说，即是否会带来温度感受的等比例增加。

根据一部分极不严谨的实验，我总结了关于这个问题的研究准则，这些准则似乎只能在中等水平的温度下起作用，而不能适用于很热或很冷的温度条件。

我采用了最小可觉差法，用六天的时间进行相关实验（1855年12月）。实验设计借用了韦伯的方法，将同一只手的两根手指先后浸泡在两个盛有在不同温度水的容器中，浸泡的深度相同。实验使用的是莱比锡物理系内的一对格莱纳温度计（greiner，一著名温度计品牌）来对水的温度进行精确和准确的测量，温度记录的精度达到0.5个列氏温度（r）等级。通过该温度计，可以将0.5度10等分或是将1度20等分进行简单估计。我非常感激将这两个温度计借给我进行实验的研究员汉克尔，他告诉我其中一个温度计测得的度数比另一个温度计高0.05度，我自己也证实了这个系统误差，并且在每次观察之后都对这一常误进行了校正。系列实验条件中其他的情况，我将在给出结果时进行必要的说明。[46]

温度大约处于10°到20°r范围内时，被试对温度差异的感受非常敏感，最小可觉差很难被精确测定。当感受性达到最大值时，任何可以忽略不计或接近忽略不计的差异都能被感觉到，因而感受性测定受到这种限制的影响，无法直接准确地测得。我的实验温度范围是从20°至正常体温这段区间，超过这段区间我的实验就不管用了，当在实验中采用的温度超过了冰点和体温间的中点值（＝14.77°r[47]）时，我发现实验结果特别契合韦伯定律，因为在这个平均值之上时，温度对应的最小可觉差正好能够和温度的增加成比例。在后面的实验中，需要记录的数据有温度差d以及对应的即时温度t，这些数据可供任何有关最小可觉差的计算所使用。差异d是根据观察时所使用的两个温度间差异的平均值进行定义的。d值的计算基于这样的假设，即最小可觉差是与温度减去14.77°得到的数值成比例的。下表的第1部分的数值并不是特别有说服力，因为观察到的差异值太小了，并且可能都仅仅是为了说明在表格这部分的温度区间内，最小可觉差不明显。另一方面，我们看到表第2部分中的温度是从19.13°开始的，因此我们可以参考这部分中的每一对观察值与计算值进行思考。

15.03°r至31.35°r的温度敏感性

表中的估算值，是根据每一个温度减去14.77°（t-14.77°）得到的值，乘以0.03623而得到的。这个常数值只是根据t＝19.13°至31.35°这段范围的观测而得到的。然而，在表格第1部分即高于14.77°且低于19.13°的温度区间内，观测值d所对应的估算值，却也同样是通过这个常数值（如前文所提到的，这个数值非常小）来计算而得的。实验总共进行了六天，上表的数据仅仅是通过其中三天的观察得到的，因为其余三天的实验关注的只是温度低于平均温度值时的情况，会在后面的内容中单独介绍。

表格第1部分中带星标的数据表示这个数据不仅仅是最小可觉察值，而是为了表示觉察的程度比最小可觉程度要高，即为了记录观察中可觉察（一颗星*）与可清楚觉察（两颗星**）两种情况。其中的一个区别是在我们关注的这个温度水平上（例如17°），可清楚觉察的精细度已经达到不足以从温度计上读出的程度了（其中两个温度计间0.05°的差距已经进行了必要的校正）。这样一来，也许有人会假设，感受性最强时的温度平均值范围应该在16°到17°之间，而不是前面所说的14.77°，根据上述数据结果显示，的确有可能存在这种情况。然而根据存在平均温度附近这种小到几乎为零的差异值d进行推论，谁也无法保证获得的结果是正确的，因为除了感受性（衡量是否可觉察的指标）的变异之外，错误的数据读取，以及水温与温度计之间差异过小足以导致或隐藏了这其中的误差，即使我们已经采取所有手段来尽力减少这些误差来源也无济于事。从全局的角度来看，在一开始以14.77°作为计算的参照点对于实验是有好处的。

此外，在t＝20°以下的d值变化轨迹都非常像是误差导致的结果，但我们不能这样轻易地下结论，因为整个实验过程总的来说，是在我不了解两个容器中哪个水温更高的情况下进行的。我重复交换着浸在容器中的手指，直到我对结果非常确定时才进行判断，这样我的正确率很高，在大量的实验试次中，仅仅在接近平均温度时犯了一次错误，在这个区域内最小可觉差几乎接近于零。在这个案例后续的一项验证研究中发现，我判断出的最小可觉差异，它的正负方向却正好与我假设的完全相反，实际上在实验过程中我经常发现不了两个容器间的温度差异，而后通过温度计我发现两个容器间的确不存在温差，或者是它们之间的温差低于温度计可量度的最小范围。这个结果同时可以为温度计之间的相互检验提供数据，并且也能作为感觉的一般且可靠的证据。

检查表中的数据发现，平均温度参照点以下与以上的最小可觉差似乎没有呈现出对称趋势。后者的数据更符合韦伯定律，这是考虑到差异的精确程度而做出的判断。当温度处于平均温度与10°间时，最小可觉差仍然太小，以至于无法揭示出它们之间的任何关系，但是从10°开始继续下降时，最小可觉差快速大量地增长，甚至比平均温度之上的发展趋势，或者是根据韦伯定律推算的趋势都要来得快。通过经验计算我们可以相当精确地表示出d与t-t三次方之间的比例关系，其中t＝14.77°，t是观测到最小可觉差时的温度，那么为了根据温度读数获得最小可觉差，需要将（t-t）3乘以常数0.002734。这个结论显然是在很冷时感受性大幅度下降的情况下得出的。当温度超过平均点太多，接近灼热感产生的点时，我们也可能发现类似的偏差。不过仍然可以看到，只有在温度高于平均点很多的情况下，这种偏差才会很明显，而低于平均点时则是立刻出现了偏差。

在+10.5°r到+4.5°r范围内，可以通过下面的公式计算供观测值进行比较的估算值，即

d=（14.77-t）3×0.002734

我用了数天来获取温度低于这个范围时的常数值，但由于数据的变化极不规律，因此找不到恰当的值。

4.6°r至10.5°r的温度感受性

虽然在观测值与估算值之间的差值有正有负，但实验结果显示观测值与估算值之间存在着一定的对应关系，考虑到对这些具体的实验进行重复中存在的种种困难（尤其是这些实验事实与数据都是在不同的日期采集的），能够得到这样的结果已经让我非常满意了。毕竟我们无法确定每天的感受性水平都是相同的，也无法保证每天能够保持相同的主观最小可觉标准。假如我删除一些不合适的数据，显然还可以将观测值与估算值之间的相符程度再提高一些，但在计算开始之前我已经给出了所有有关最小可觉差的情况。我必须承认我所给出的公式，仅仅只能被视为是一个在特定范围内适用的经验公式。为了数据的完整性，后面会附上10.5°到14.20°之间的d值，这部分数据的给出不为别的目的，而只是让读者了解到这些数据可以被观察到，就是数值太小了。尽管如此，如果我们使用的是前面这个公式，那么与根据计算获得的预测值相比，这些观测而得的数据仍多多少少要大些，这在观测数据的归集和计算中将会表现出来。

虽然我认真执行了这些研究，但仍有必要进行实验的重复，尤其是因为我们在低于平均点时采用的升序，而在高于平均点时使用的是降序进行的实验，这样会降低实验结果的可比性。为了确认韦伯定律在平均点以上范围内的有效性，我们需要比现有实验中更多的观测次数，所以本实验的结果也只能作为初始结论存在，可以与后来的实验进行对比。虽然未经证实，我还是想明确表示，韦伯定律在规定范围仍是相当有效的。我试图完成有关这方面的实验，或者重新再做一次。但由于没有时间，只好中断了，因为我还要继续下面的内容。

10.88°r至14.2°r之间的温度敏感性

*可清楚觉察而非最小可觉水平。

下面我补充说明一下这个实验的程序。

实验中用来盛放不同温度水的容器是两个大号黏土坩埚，因为这样可以尽可能地减缓水温的变化。坩埚中的水深大概达到食指的第一和第二个指节的中间位置点（从手掌处开始计算），这样正好可以保证右手的食指和中指触底。因此接触到水的手指面积总是固定的。温度计固定在坩埚中一个合适的位置，保证水银泡正好没入水位的中部，并且在每次观察前都搅动一下。在坩埚中放入冰块或者提前在烤箱中加热过的金属或黏土器具，而后搅拌一下来调节水温。实验程序中先将两根手指放入坩埚中，完全浸泡直到手指接触到坩埚底，之后等待对温度的感觉稳定下来。之后两根手指分别不断交替浸泡到不同的坩埚中，直到观察者判断出其中的区别。如果温度感受性超过我称之为最小可觉的水平，温度需要向相反的方向变化，这样我就不能凭上一次的经验来判断哪一个容器的水温超过了对方，所以只能不断重复实验直到找到最小可觉差，上述的交换往往要在实验中重复多次（我不得不承认这个过程非常枯燥）。在被试做出判断后立刻记录温度。

虽然我需要记录的仅仅是我称之为最小可觉察水平的感受，但在我负责的记录过程中我会记下所有的感觉数值，并且尽可能地保证记录的一致性。这是为了能够按照下列顺序标记数值：

完全无法觉察、几乎没有觉察、刚刚能够觉察到（最小可觉）、觉察到、明显觉察到、十分确定、强烈、十分强烈。

通常来讲我们很难对上述几个叫法进行明显的区分。所谓“几乎没有觉察”指的是被试不能够非常确定自己的答案是否正确，虽然在后面的实验中可以对这种模糊的感觉进行确认，但是仍可以说被试在这种水平下的判断是完全随机的。因此，诸如“几乎没有觉察”、“觉察到”和“明显觉察到”这三个水平其实是非常相近的，即使是不同日期里进行的实验也是如此。所以，我将上述三个水平对应数值的平均值记录为最小可觉差，并且这样的程序还要重复多次。

当然，除了最小可觉差法，我们还需要采用其他方法研究的结果，以对这方面进行补充。福尔克曼指导医学院的学生林德曼（lindemann）使用平均差误法进行了实验，并以此作为他博士论文的主题。然而我们从这个实验中并不能获取太多信息，因为虽然实验温度范围扩展到7c到45.55c，以及14.6c到45.55c两种，并且每个范围条件下都含有两个温度升序和两个降序系列，但每个温度区间内的实验过少，所以这个使用平均差误法进行的实验被我们排除了。这个实验程序中右手齐腕浸泡到水中，在温度升序实验中总是先浸泡在较热的水中，而在温度降序实验中先浸泡在较冷的水里。[48]然后再加入更热或更冷的水来中和温度，以作为下一次感觉判断的对象。

在两个升序的实验系列中（即当林德曼通过先后加入热水的方式来调节两个容器中的温度），总是存在正向的误差，而两个降序的实验系列中总是出现负向的误差。有人可能会问：出现这种情况，是因为在升序和降序系列中温度变化的范围包含了两个相反的方向，还是因为在单个实验试次中，热水和冷水的变化方向都是朝着相反方向进行的？我们可以从每个实验系列中的第一个试次所处的环境条件来验证后一种说法的可能性。关于这方面内容以及其他问题的准确细节，都是缺失的。

此外，我们在某些关键因素中发现了常误。随着温度递增或递减，每个实验系列中的单个误差发展仍具有规律性，因此我们可以认为几乎所有这些误差都是恒定的，因为变化的误差必然在具体表现上存在着不规律性。而这个实验中这种规律性是非常不显著的。

第一个升序的实验序列，温度范围在26.4c到38.8c（含）[49]之间，一共有23个试次，这其中除了五次例外，其他均产生了+0.05c的固定误差。在相对较高或较低的温度下，误差会增加，但增加的幅度很小且略不规则，结果在39.4c到45.5c这一区间内产生的误差值只有0.5c、0.6c、0.7c和0.8c四种，而且多为下降的趋势（例如，在升序实验序列中，一开始在14.6c条件下误差为+0.5c，之后在16c和18.2c时变为0.4c，依此类推）。在第二个升序实验系列中，温度范围为31.35c至42.9c，其中有14个实验试次，它们均无一例外地出现了+0.05c的误差。温度为44.8c与45.1c时，误差增大为0.1c，而温度为7.9c与8.4c时，误差减少为+0.25c[50]。第一个降序实验系列中，从41.5c至19.5c的区间内，有22个实验试次，得到的误差是-0.05c，但有3个例外；在44.7°时误差增长为-0.1c，7°时增长为0.29c。第二个降序实验系列中，从41.65°至19.35°的区间内，有21个实验试次，得到的误差是-0.05c，没有例外；在44.9c时误差增长为-0.1c，7.55°时增长为-0.25c。

上述实验与我的实验相同的地方主要表现在，在一开始的温度区间内误差几乎不存在，相比于温度越来越温暖的趋势，在温度越来越寒冷的情况下，误差增加的速度更快且幅度更大。该实验中的误差，比起我的实验和先前韦伯实验中的最小可觉差要小得多。这里并不存在矛盾，因为根据我提到的内容，平均误差应该总是小于最小可觉差的。这个结果也可能部分归结于实验程序的不同，因为我只使用了两个手指上的两个骨节，而林德曼则使用了整个右手。另外一个实质性的区别是，林德曼发现在体温附近的误差值最小，而在我的研究中则是发现在平均参照点附近的最小可觉差最小。同时，由于林德曼实验中的误差从整体上看近乎稳定，所以没有办法证实两种实验结果间是否真的存在矛盾。不管怎么说，这部分内容需要更多的实验来进行验证。不过我们至少可以总结说，仍可被识别的差异以及与平均参照点之间的误差究竟能小到何种程度，想要通过精确的测量而获得是很有难度的。

类似于我在重量判断实验中所使用的正误法，或许是最适合这个实验主题的方法。不过实际上，人类很难像感受重量和重量差别那样感受到恒定的温度和温度差别。然而，似乎通过尽可能地减少导致温度变化的因素，例如，必要时在每10次实验观察之后重新记录校准温度值，有可能帮助我们获得有用的结果，尤其是采用基本表进行可能的数据简化之后。

广延感受性大小（视觉或触觉大小的测量）

为了对韦伯定律的一般性描述进行补充，图宾根的医科学生哈格梅耶尔[51]，使用正误法对韦伯定律在视觉上的适用性程度进行了近似的证明。然而他的实验有太多值得商榷的部分，因为他的实验试次数不足，并且由不同实验试次组获得的平均数不具有可比性。因此，这种结论的有效性受到限制。实际上，实验的内容包括了对给定线段长度与其之前所呈现线段长度的比较，这些给定长度线段部分是水平呈现，部分是垂直呈现。这些线段长度均为按比例增大或减小。实验记录者的主要目的，是考察标准线段长度与被比较长度之间的不同呈现时间差对被试结果的影响，以及被试判断了几次变长，几次变短，几次正确，几次错误，还有几次没有判断。哈格梅耶尔自己也承认，实验中正确和错误判断的比率不是由线段间的绝对差异决定的，而是由相对的比例大小决定的。总之，哈格梅耶尔的研究是不正规的，因此在这里我不会提到其中任何特殊的结论。

我的实验和福尔克曼的实验中均使用了平均差误法，其中被试需要观察两个小点或是两条平行线之间的间距，间距范围在10至240毫米之间，与眼睛的距离在1英尺至800毫米范围之间，结果发现误差或平均误差之和与间距几乎是成比例的关系，这与期望相符，为定律提供了确定的证据。另外，在福尔克曼的——以及他指导了阿培尔（appel，是一名视力极佳的学生）进行的——实验中采用了0.2到3.6毫米的微距，但这个正常的视觉距离范围内却没能发现任何成比例的结果。数据中误差或平均误差的总和（排除了常误之后）可以分为两部分。其中一部分我称之为福尔克曼常量[52]；另一部分我称之为韦伯变量，根据韦伯定律，它是与标准间距成比例的。可能前者在对较大的间距进行实验时会有很好的效果，但它与另一个误差部分组成，即与间距成比例的误差部分相比实在太小，以至于基本可以忽略不计，另外我们一直不能获知如何对前者进行测定，而在非常小的标准间距情况下，前者就在可变误差总和中占据较大的部分。就如福尔克曼所认为的，在诸如0.2和0.3毫米这样极小的间距条件下，这种误差同样会由于兴奋的传播而被异常放大。

可以看出在这里，我们讨论的问题同样也是韦伯定律的适用下限问题。另外我们还会发现可能还存在着一个上限，对应无穷大的间距。

下面将列出主要的实验结果。它们均属于之前提到过在其他感觉实验中曾出现的纯粹可变误差δ的情况，并且总是得到纯粹的误差之和∑δ；同样我们还经常（当我对结果进行计算时）根据每个间距进行分组，每个小组中均包含m次观察，分别计算每个小组的纯粹误差平方和∑δ2。因此每个用于计算总和的误差数量应为μm。μ和m的值分别是从单个实验系列中获得。在对每个水平行进行求和时，μ的值应该翻倍，因为这些和总是由两个特定的和值相加得出，分别如l和r或者o和u。当一组对比长度为水平放置时，在观察次数相等的前提下，分别统计标准间距位于左边或右边（l或是r）情况下的结果，当为垂直即一上一下地放置时，则也分别统计当标准长度位于上方或者是下方（o或是u）情况下的结果。

只有测微组v使用的是垂直间距，即比较水平线之间的距离；其他所有组都使用的是水平间距，即垂直线之间的距离（当使用的是线的情况下）。

通过简单求和∑δ的方式就可以直接得出间距的比值，而没有必要先进行平均误差ε=∑δ/μm的计算。如果需要，误差平方和可以用来计算二次平均误差，即

通过这个值可以确定概率界限内数据的稳定性和常规关系，即

但在这里我需要省略关于这种关系的检验方法。我们同样还可以用来证明误差平方和∑δ2除以误差和的平方，再乘以观测次数的两倍（这里即2μm），得到的结果约等于鲁道夫常数π，这可以非常容易地从先前的函数关系中推导出来，而且已经在其他研究中获得了更加彻底的证明。但不巧的是在实验系列1和2中，最小距离并不能给出这样一个证据，这是实验环境所导致的，在这里尚无需注意这些问题。不管怎么样，我们没有必要特别关注这些关系。

这里提到的所有实验系列都或多或少存在着常误。具体情况我暂时就不说明了，在《测量方法》书中将会详细阐述。

实验系列1：费希纳（1856年12月9日—1857年1月17日）

实验使用了五个水平距离。这些距离是通过两支圆规的脚间距测量出来的，两支圆规相邻地放置在我前方的桌子上。圆规整个被盖住，只露出两个规脚。被试观测距离约为1巴黎英尺。脚间距用带有横线刻度的尺子测量，刻度线的间距代表0.05个巴黎行（刻度线本身的宽度约为0.06个巴黎行）。将圆规覆盖起来是为排除圆规张开的角度对间距估计可能造成的影响。不过实验中仍然存在着小问题，具体表现为圆规的两脚由于从覆盖物中突出来，因此当间距较大时，它们的倾斜度就相比于间距较小时更大。在后续实验中使用平行线来消除了这个问题。不过在任何实验条件下，这个问题从本质上说都仅仅只能影响常误，而不会对纯粹的可变误差产生影响，这在接下来的表中可以看出，可变误差与长度之间仍正好存在比例关系。

为了使数据的解释过程中不出现任何的误会，我将单独解释表中的第一个数据；这样大家就可以很容易理解其他数据。

当间距d＝10时，即前面提到的10个0.05巴黎行，标准间距位于左侧时的纯粹误差之和∑δ＝20.27；也就是说，将所有正的和负的绝对误差的绝对值加在一起得到的是20.27个0.05巴黎行。表头的m＝60，μ＝2的意思是，和其他行一样，l和r均是由2×60＝120个独立误差构成。不过每个这样的误差和并不是正好从120次观察中获得的，而是根据两组60次观察的结果分别求和而得。之后分别确定距离的平均误差和绝对误差。

距离阈限值，费希纳实验系列1　m＝60，μ＝2　单位：0.05巴黎行

实验系列2：福尔克曼（1857年3月22日—4月1日）

用三条每条长220毫米的平行白线来确定八种水平间距，用重物紧紧固定，放置在距离眼前大概800毫米的黑色背景板前。白线可以根据一把固定在恰当角度的水平尺的标记来进行移动，并且读数直接精确到毫米。

我报告了两个版本的总和∑δ值，一个是m＝48，μ＝1，一个是m＝16，μ＝3，这样我们就可以使用已有的程序来检验其中的差异。

距离阈限值，福尔克曼实验系列2　（1）m＝48，μ＝1　单位：1毫米

有人可能会注意到，两种计算方法之间的差异在大部分d值水平上都非常小，但在两个关键水平即d＝40r和d＝160r时却有较大差异。当这些实验系列被仔细复查时，就会发现这个事实是与常误的巨大变异紧紧联系在一起的。[53]既然数据分组后更利于控制，那么我们就会倾向于选择后一种计算方法而不是第一种。

实验系列3：福尔克曼（1857年12月6日和17日）

采用同样的条件对先前的实验系列进行了重复，最小的两个距离没有再参与实验。

距离阈限值，福尔克曼实验系列3　m＝16，μ＝3　单位：1毫米

非常有趣的是，表中最后一列数据显示出l和r的结果非常相近。这证明了绝对可变误差是独立于白线位置的，无论左右都是一样的，而这里没有提及的常误则是非常依赖于位置因素的，并且在l和r原始误差之和间存在着很大的差异。

三个实验都充分证明了∑δ与距离成比例。将误差和除以距离即可明显地看到这个结果，每个实验都证明了商数的这种恒常性。通过这个方法（在第二个实验系列中采用的是m＝16，υ＝3这部分数据）可以得到以下数据∑δ/d。

距离判断中∑δ与d的比例值

如果需要计算每个单元距离对应的平均误差或者需要距离的平均误差分数，可以用以上数据的平均值，除以对应的每个实验条件下观察到这个数值需要的实验次数。我们必须将每个表头的m值和μ值的乘积再乘以2，因为μ值原本是分别对应l和r，但是在这里需要结合到一起计算。因为相比于较短的距离，较长距离条件下较大的误差之和能够给我们提供更精确的值，所以将所有的误差之和加到一起就能得到更准确的结果[54]，这个和的结果在表的最后一行中有给出。然后将得到的结果除以所有的距离之和，得到每个距离单元上的误差和平均值，再用这个误差值除以2μm。

最后得到如下结果：

因此可以得出我的距离估计误差平均值约为1/60，福尔克曼在前一个实验（2）中的误差约为1/90，后一个实验（3）中的则为1/100。这个比例在每种距离条件下都是保持一致的。如果需要的话，可以简单地将平均误差值乘以0.845347计算出或然误差，所得到的值可能超过实际值，但也有同样的可能达不到实际值。或然误差结果一定会小于平均误差，因为在正态分布情况下，相比于较大的误差，较小的误差更频繁地出现。详细内容在我的《测量方法》中有介绍。

读者可能会发现福尔克曼的估计精度要比我的高。其中的原因要么可能在于判断三条平行线间的距离要比相邻的圆规脚来得容易，要么是因为他的视觉敏感性要比我好（事实上的确如此），或者可能两种原因兼有。这需要后续实验来进行确定。显然这些针对大量个体和不同的观察条件下，所开展的有关于极端值和平均敏感性值的广延感受性实验，将会是非常有趣的实验。结果可能依赖于不同的因素，比如福尔克曼实验中，横线是否移动，中间的线是否经过调整，观察过程使用的是单眼还是双眼，而且两点或两条线之间是垂直还是水平关系抑或是存在角度差，覆盖物是方形的还是圆形的，都会影响实验的结果。无论条件如何，我们都必须仔细考虑常误的大小和种类。然而，我们在这里关注的只是定律本身而已。

福尔克曼的第二个实验系列中得到了相当小的平均误差，相比他的第一个实验更加精确。这个差异可能是由于练习效应导致的，因为第一个实验和第二个实验系列之间还进行了很多次的距离判断（包括所有的微距判断），虽然第一个实验系列被分为了两个分系列但其内部的改善作用不够明显，这通过对部分实验系列进行专门性的检查就可以得知。

可能有人会发现，福尔克曼本人在视觉范围内的平均误差与视觉强度的最小可觉差非常地一致，这是个有趣的现象。然而，这样的一致性并不总是普遍存在的。

在这里我使用的是诸如1/60、1/90和1/100这样的近似值，而没有使用前面精确计算得到的类似1/62.5这样的数字，因为后面这类数值是基于不同m得到的，同时m值也总是有限的，所以这些数据的准确性和可比性都不高。根据我的评论可以看出，误差之和以及因此得到的平均误差越小，其对应的用以获取误差值的m也越小。这种论述的证据可以在实验系列2的数据中获得，如根据0.011287（1/88.6）和0.010808（1/92.5）这两个基于单位距离获得的平均误差值，就是很好的说明。两个值来自同样的实验过程，但是第一个数据是由分组m＝48的条件得出的，而第二个数据则是由分组m＝16的条件得出的。我们可以发现虽然差异并不是十分显著，但这种差异确实存在并且值得考虑。

如果我们想使数据常态化，也就是使结果能够适用于任意的观测次数，那就需要进行校正。根据我简要提到过的公式，以及我在《测量方法》一书中进行过的理论推导，可知校正就是通过将每个值乘以（3m+1）/3m来实现的。因此我们将60、48、16和16这些m值分别代入公式进行校正之后得到以下结果：

如果说这种校正可以提供完全补偿，那么实验系列2中的第一和第二个结果应当完全一致。实际大家可以注意到，这两个值逐渐相互接近，差值的程度也逐渐可以忽略不计。也许有人倾向于认为剩下的这部分差值是因为数据校正并不是基于绝对和确定的测量基础上，而仅仅是依赖概率论，所以会由于随机波动而残留一些细微的差异。然而我通过对类似的情况进行仔细的分析，发现这并不是一个随机因素造成的结果。因为我在第八章中已经简要提到过，可以证明这种偏差总是会往一个方向发展。[55]这种情况发生的原因是我们的校正不允许常误中存在可变性，因此当m值较大时就会对可变误差造成污染。所以m＝16时的校正值1/89.7相比于m＝48时的1/88.0更可取。

因为在我自己的实验系列1中，常误基本可以忽略不计，而且它的变异几乎不能对结果产生较大的影响，所以1/62.1这个校正值可以被认为是足够精确的。因此我没有对这个数据的有效性给予特别的关注。

下面我们应该回过头来看一下微距实验系列中的结果。这些实验均使用千分尺来完成，最小距离单位为0.01毫米，该单位还可以再十等分来进行估计。后续表格中使用的单位为0.001毫米，比如距离300指的是0.300毫米的实际距离，误差和265则等于0.265毫米。其中的小数部分——实际上它们是多余的——是因为对原始误差进行校正后而产生的。

设备中的距离[56]是三根0.445毫米粗、11毫米长的细平行银线之间的距离来定义的。研究者从不同的距离观察这三根线，距离值总是以整的毫米数据表示，观察要么是对着牛奶色玻璃灯罩制成的台灯进行，要么是对着明亮的天空进行。

福尔克曼的实验系列中，最小距离值在括号中列出，因为这些距离并不适用于这一实验系列，在后续计算中直接删除。产生这种偏差的原因是因为银线在光照下会反光，导致在实验中被试很难看到这些线。福尔克曼发现这种问题条件下进行的估计很难与其他距离条件下的进行比较。阿培尔的视觉非常敏锐，这种反光对他来说不成问题，所以在他的实验数据中没有进行这种删除的处理。

除了这里介绍的微距实验之外，还有两个另外的微距实验系列，这里就不再进行介绍，因为实验设计中的距离过小，两个点或两根线之间太过接近，同时得到的数据也非常杂乱，没有规律可循。

实验系列4：福尔克曼（1857年3月22日—4月1日）

实验内容为判断333毫米之外的七种水平距离。

距离阈限值，福尔克曼实验系列4　m＝30，μ＝4

实验系列5：福尔克曼（1857年4月至6月的某个时间段）

实验内容为判断333毫米之外的六种垂直距离。

在垂直距离的实验中，观察者为了克服判断时视力不清造成的困难而佩戴了眼镜，不过在所有的水平距离实验中观察者均没有佩戴眼镜。

距离阈限值，福尔克曼实验系列5　m＝96，μ＝1

实验系列6：阿培尔（1857年5月和6月）

实验内容为判断370毫米之外的七种水平距离。

距离阈限值，阿培尔实验系列6　m＝48，μ＝2

实验系列7：阿培尔（1857年10月）

实验内容为判断300毫米之外的六种水平距离。

∑δ的计算进行了两次，一次使用的是μ＝2，一次使用的是μ＝6。

距离阈限值，阿培尔实验系列7　m＝33，μ＝2

将这些表中的数据结合起来（除去括号中省略的数据，原因在前面已经叙述过）就会发现，一致性不仅出现在同一个观察者的不同系列实验结果中，在不同观察者的结果中也同样存在。误差和随着距离变大而增大，但是它们与距离之间的比值却比预期来得小。即使是我们省略的两个额外实验系列中的数据，也同样完全支持这个结论。之前曾提到过，我们可以将误差视为由两个主要部分构成，一部分是在不同距离之间保持不变的，称之为福尔克曼常量。我用字母v来表示它。另一部分误差与距离大小成比例，叫做韦伯变量，其在单位距离下的值我用w来表示。对于每个距离而言，w必须乘以相应的d值，才能给出成相同比例的wd值。

根据误差源的结合法则，每个距离对应的误差和∑δ由v部分和wd部分组成，但不是简单地将两部分值相加。因此不能写为

∑δ=v+wd

但是两类误差的平方和与误差和∑δ的平方应该是相等的，这样我们有

（∑δ）2=v2+（wd）2

因此可得

因为误差和的平方（∑δ）2相比于平方和∑δ2有更高的优先级，根据误差论就可以将上述等式中误差和的平方换做是误差的平方和。然而从生理学因素上来考虑，或许和的平方的形式更加符合，后面我会继续提及这个问题，并且我使用这一推论作为后面内容的基础。

通过理论推导和根据我们的实验直接可以得出，两个给定的独立误差源，其中一者产生了误差总和a，另一者为误差总和b，当它们组合在一起的时候，不可能简单地认为它们的误差总和正好就是a+b，而是会产生一个比这个加和值小一些的结果。平均来说，产生相反符号的误差概率与相同符号的概率基本相同，但只是在后一种情况下，两者合成产生的误差才等于它们的总和，而在第一种情况下两者合成产生的误差却等于两者之间的差值。理论上来讲，各个部分误差平方的总和一般（严格来说，是在相似环境中对误差进行无数次取值的情况下）是等于组合后结果误差平方之和。同样地，各部分误差和的平方总和，一般来说也等于组合后结果误差之和的平方。这些理论推导出的结果可以很容易地通过两个相互独立的实验系列来进行检验，采集它们的实验误差作为独立误差源；通过代数方法我们将两个误差相加，再与两个实验合并之后获得的误差进行相比，看它们是否相等。我真的非常确信，根据误差平方和与误差和的平方都能够达到对理论结果进行校正的目的。我做过很多实验证明了这一点，在其他地方会详细解释。

只要在观察的时候，存在一个独立于距离的误差源以及另一个与距离存在特定关系的误差源，那么接下来的推理就会与这两个部分有关，并且可以使用先前的等式。所有关于有效性的疑问假设都可以通过观察实验本身来解答，因为只要它们是有效的，我们就可以反过来计算诸如v和w这样的数值，来证明初始观察数据可以根据这些公式来进行表示。

通过两种距离条件下的观察结果就已经足以计算v值和w值。分别使用实验系列4中d＝800和d＝1400两种取值下的误差和1541.5与2275.7，并将l和r的条件组合起来，根据以下方程组

v2+8002w2=1541.52

v2+14002w2=2275.72

我们可以轻松求得未知的v2和w2的值。之后再通过求平方根得到v和w。

如果存在两个以上的距离值及其对应的误差值结果，就可以基于所有的这些组合来获得相应的v和w。但在计算v和w对应的误差和之前需要验证另一个假设。即组合中各种条件下的v和w的值必须高度一致，这样剩余的误差值就可以被认作是实验中无法补偿的随机变异。通过对大量此类数值进行平均，可以更准确地计算出v和w。

这种方法只有一个缺陷：虽然当观察结果完全符合假设时，每种结合方式的最终结果之间的差异很小，以至于结果之间可以通用，但由于用以组合的数据选择具有主观性，不同的结合方式会得到的最终结果仍是不同的。同时，最小二乘法仍然是可取的，因为它排除了所有的主观性，并且能够让我们达到最接近于真实结果的值。下表给出了按照这个方法计算出来的结果，其中l和r的结果被组合在一起，而且没有采用相等的m值或观察距离（这在后续内容中将补充）。[57]用正负号标记或然误差，μ值是一个包含了l和r的有效组合——换言之，表头观测的μ值应该翻倍。

基于原始误差之和根据等式v2+d2w2=（∑δ）2计算出的v值和w值

如果想验证我们有关福尔克曼常量和韦伯变量的假设，我们就需要首先考虑或然误差值，这个值相比于v和w的值要小很多。其次，我们需要根据不同d值对应表中的v和w值计算（∑δ）2或∑δ的值，使用v2+d2w2=（∑δ）2计算前者以及使用

计算后者。对比计算出的值与观察值，可以得出让人满意的一致性。下面将给出（∑δ）2的汇总结果，出于简洁的考虑省去所有的距离值。所有的数据都取自前几张表中的观察结果，括号中的数据没有使用。

根据前几张表中的v和w值计算出的（∑δ2）值与实际观测值的对照表

观测值与计算值之间的一致程度都比较高，除了实验系列7中的个别数据偏差较大。这样我们就可以说在很小的距离范围内，韦伯定律同样适用于视觉距离判断，不过这事先必须先对数据进行汇总整理。

我个人对使用大量的其他方法进行数据评估比较感兴趣。虽然结果从本质上说差异并不是很大，但是这有助于根据结果来决定如何在不同方法中进行选择。这里采用不同方法对实验系列4中的数据进行了处理。

1.区别于之前将l和r相加，这里分开进行计算，但仍然使用相同的程序。得到的结果如下：

2.有人可能认为将等式表示为

更适合作为最小二乘法计算的基础，因为（∑δ）和（∑δ）2均可直接观察到。但是专家一眼就可以看出，这个等式失去了原有的线性，并且需要更多的计算进行结果的校正。我将实验4中l和r的数据分别根据这种方法进行的计算，结果如下：

这些值与之前的计算结果只存在细微的差异。因此没有必要继续采取这种复杂的方式进行计算。

3.为了从等式v′2+d2w′2=∑δ2中得到常量v′和w′，我采用了偏差平方和进行计算，而不是之前的误差和平方。因此对于l和r分别有：

根据统计理论，∑δ2和（∑δ）2的关系为：

其中π值等于鲁道夫常数。根据这个公式，可以帮助我们得到与前面的v和w近似的值。

我采用第1点中的方法对实验6和7中l和r的数据进行了分别计算。实验6的结果如下：

实验7的结果如下：

之前所有表格中的v和w是根据每个实验系列中的误差之和计算出来的，因此与各个总和成比例。然而，不同实验系列是基于不同的距离而获得不同的误差值的，所以要根据实验结果表头的μm乘积来进行计算，所以不同实验系列中的数值必须分别除以误差的个数：120、192、192、132。这样得出的v和w才是平均值。因为每一系列的实验基于不同的m值，所以对于有限的m值，考虑将结果同样乘以（3m+1）/3m是一个妥当的方法。不过这个校正产生的变化值很小。最后我们必须要考虑到由于观察距离不同，数据估计的结果并不总是相同。不过这一因素对于w没有影响，因为w总是表现出同样的比例误差（虽然刺激间的距离从远处看来会变小），但这一因素会影响v，因为v在所有距离条件下都保持同样的绝对大小。为了使不同观察距离条件下的误差具有可比性，我们必须将它们统一为相同观察距离条件下的数值，采取的处理方式就是求倒数。然而首先，我们必须将所有的观察距离值加上7毫米来进行校正，这个7毫米正好是从角膜到光线交叉点[58]之间的距离，举例说明，实验系列4中的观察距离是333毫米，校正之后就变成了340毫米。

如果我们采用这三种缩减或校正方法，将所有的值缩减到从333+7毫米进行有限次数的观察水平，就会得到与之前结果都不相同的下表。

根据距离眼节点340毫米条件下的误差值进行校正缩减后的v和w值

这个表中的数据很有趣且值得注意。福尔克曼在实验4中使用水平微距值得出的w值为1/79.1，这与仅仅是稍早前的实验系列2中，使用相对更大的距离得出的1/89.7之间差异并不大。这个值没有任何特殊的意义，只是在一个系列实验中v造成的差异性逐渐消失后得到的w值。任何仍然存在的差异可能都是由于实验方法的不同造成的。

另一方面，使用微距进行的两个实验中，采用水平距离进行的实验4（使用的是两条垂直的平行线）产生的w与采用垂直距离进行的实验5（使用的是两条水平的平行线）产生的w之间存在着非常明显的差异，这令人很震惊。虽然两个实验间隔不是很长，但是在垂直条件下产生的w值是水平条件下的两倍。因此在前一种条件下进行的估计要比后一种条件下的准确性要差很多。这个结果与实验进行期间产生的直接假设一致。虽然没有给出数据，但我可以告诉大家垂直条件下的常误也比水平条件时要大很多。阿培尔的两个系列观察6和7中采用的均是水平距离，两个实验的w值差异过大，同时实验6中的w值过小，因此数据值得怀疑。实验过程本身没有能够揭开我们怀疑或是解释差异的证据。在对福尔克曼的结果一无所知的前提下，实验7中的1/85.3却与福尔克曼的1/79.1非常接近，如果他获知的话，结果就很可能会完全一致。我们更应该关注常量v。阿培尔的实验系列6中稍有偏差，因此其中的w值也不可信，除此之外，两个完全不同的观察者在垂直和水平距离条件下所获得的三个不同v值非常地一致，这样就可以下结论说我们所面对的是一个自然且绝对的常量。最后，考虑到观察实验的不确定性，以及常量v大小中的常误与未校正误差中的w[59]，综合以上考虑，水平和垂直距离条件下分别得到的v值8.210和7.319之间的差异非常小，这种情况很可能并不是由于随机因素造成的。阿培尔得到的8.5476与福尔克曼得到的8.210两个值，一致程度高得惊人。为了证明我们面对的是一个常量，需要扩大我们目前正在采用的距离值范围来对实验进行重复，这样才能发现个体差异，并且在不同实验环境下对上述结论进行检验。

我们可能会想知道这个常量的意义是什么。福尔克曼正在筹备的新书中对此进行了阐述，我在这里只是简要地告诉大家，这个问题从他发现这种常量始就促使他去进行探究并且完成了大量枯燥的实验。对它的存在人们仍然怀有疑问，即便如此，福尔克曼仍然很希望能够找到这个数值存在的真正证据。

如果韦伯的观点是正确的，即物体看起来的大小取决于投射到视网膜上的影像占据了多少个单元，那么只要它们是占据了两个视网膜单元，无论末端是落在距离这两个单元中最近或最远的点，看起来都是一样的。在某些情况下短线看起来可能会与长线一样长。比如我在图2中给出的案例，其中圆圈表示的是视网膜上的感觉单元。对我们来说可以很清楚地看出哪根线段更长哪根更短，但是对于一个视网膜单元来说在某些情况下却可能是等长的。在线段或距离较大的时候，这种误差可以忽略，因为它们覆盖了很多视网膜单元，但是在微距的情况下却不一样。在使用平均差误法进行的微距实验中，这个问题导致在判断等价性时出现了明显的错误。因此，平均误差的大小与视网膜单元的直径有关。如果我们了解视网膜单元是如何相互联系的，那么通过福尔克曼常量就可以进行视网膜单元尺寸的估计。

图2　视网膜上感觉单元成像的原理图

为了探讨平均误差是否可以使用福尔克曼常量来表示，我进行了仔细的考察，必须解决三个问题：（1）平均误差的大小和视网膜单元直径之间的关系有待确定；（2）需要验证在不同的标准距离下产生的此类误差是否确实地（或至少大致地）保证了足够的稳定性，这样才可以将其表示为像v值这样的常量；（3）另外这种常量的大小在解剖学上是否与视网膜单元的尺寸存在足够的对应关系，仍有待验证。

前两个问题需要靠概率论来解决。这两个问题的解决原理很容易描述，但即便对于专业的数学人士来说，实际执行起来也是非常困难的。[60]但是，我们可以根据福尔克曼尝试过的方法，通过复制眼结构开展实验。第三个问题解决起来有困难，因为我们尚未准确地了解视网膜终极感觉单元的结构。这里我不再进行更深入的讨论，留待福尔克曼在他自己的书里再来论述，毕竟这个实验的结果属于他本人。关于这个常量，前面的讨论足以吸引大家的注意了。

总结以上关于福尔克曼常量的讨论，我认为这就是一种通过将其观察到的大小程度缩减到在视网膜上表征水平的计算方法。当然，假如有人想要检验该常量与视网膜单元的关系，这种缩减法是必需的。

根据以340毫米为观察距离条件下的福尔克曼常量表，基于眼节点计算后的结果为8.210（即如果单位是0.001毫米，那么对应的常量就是0.008210毫米，在微距实验条件下的计算依此类推）。如果假设光线交叉点到视网膜的距离为15毫米（取整后），那么视网膜上对应的v与观测距离对应的v的比值为15:340，换句话说，给定常量v在视网膜上的距离为0.0003621毫米。这个估计值是基于这样的假设，即一条线段在视网膜上成像的线性范围，是线段两端反射的光线穿越交叉点最后允许落在视网膜的点间区域内。这是最基本的计算方式。

然而在这里有个疑问——感谢韦伯提出了这个问题——光线的交叉点是不是决定性的因素。通常来讲，距离的测量需要借助于眼睛的运动，先将光轴聚焦在一个点上，然后移动到另一个点。相应地，似乎眼睛的中心点[61]是一个更好的点，以作为线段两端反射的光线与眼的交叉点，以此计算出成像在视网膜上占据的距离范围。然而这个点的位置在角膜后，距离角膜前表面有5.6巴黎行或14.224毫米。[62]这个距离对应于距离视网膜前7.778毫米的位置，这会使得之前成像大小的计算值减半。在这里我必须保留这个问题供大家思考。

也许有人会认为福尔克曼常量可能是由于在千分尺上读数时的估计误差造成的。自然这种误差不会依赖于观察距离的大小，并因此在每种距离条件下都会造成一个稳定的平均误差。但是我们的v值过大，千分尺的读数可能直接取到0.01毫米即十个千分之一毫米单位；平均的v值达到0.008毫米或是八个千分之一毫米单位。这样大的一个平均误差是不太可能的一件事情。然而显然，福尔克曼常量需要进行一个小调整。

如果这个常量真的是根据眼球器官结构的特点而得到的，那么这将预示着广延光感受中将会出现与集中感受极为一致的情况。换句话说我们在这里验证了韦伯定律，但仅仅局限于当前这个前提下，即我们考虑到这个常量由于内部器官的因素，必须加入外部变量导致的效应中去。

在引入平均差误法之前，我使用最小可觉差法进行了一些关于视觉距离估计的实验。虽然其中使用的方法已经被后来更精确的测量方法所取代，但由于目前尚未有采取这种方法获得的其他肯定的结论，所以我在这里还是要介绍一下这些实验。

我对自己视觉距离估计的敏锐性进行了几个预实验，使用的是两支圆规，其中一支的两脚间距设置为1又1/12巴黎英寸，另一个设置为1又1/40巴黎英寸。然后我将两支圆规混在一起，这样我就不知道哪个是哪个了。接着我尝试用肉眼分辨脚间距较大的那一个。我每次都能够做出正确判断，但需要消耗的时间都很长。我从可视度最好的距离观察这两支圆规，它们是并排放在一起的，因此规脚是水平的。当脚间距变为原来的两倍和四倍，这样在后一组实验中，圆规的脚间距分别为4.0和4.1英寸，这种情况下我也能够做出正确的判断，但是判断过程都一样困难。我重复了由这三个实验构成的小实验组三次，并且三次被试都是我本人，两次在同一天进行，一次在第二天进行。对于我而言，圆规和眼睛之间的距离是长是短似乎并不重要，只要不超过视力可及的范围即可。似乎我甚至可以正确区分出比1/40更小的距离。但如同我前面曾经提到的，如果我们不把最小可觉的标准提高一点点的话，实验就会沦为枯燥的对错判断，如果实验试次的个数足够多，结果就会更准确，但如果实验次数很少，结果就不能得到保证了。但不管怎么说，实验中得到的差异已经够小了，所以如果我再把实验减半，判断的结果就不再可信了。这种任务主要依赖于肉眼的极限努力，但在实验中这种能力尚未完全发挥出来。

即使韦伯定律在视觉距离刺激判断中的有效性已经得到了证明，但这种证明在感觉范畴中究竟意味着什么却并不是很清楚。就韦伯关于广延感受性的调节方法而言，我们需要解决的有关韦伯定律在这个领域中的意义问题可以包括以下几种。当有关感觉中心的数值以相对等量的水平变化时，空间距离之间的差异是否给人的感觉是等大的或者是等可觉的？如果是，感觉范畴内感觉中枢细胞的激活数量是否能够替代集中感受中刺激的强度量？但是没有视觉范畴内的实验研究能够澄清这些问题，因为它们全部均是存在眼睛运动影响的情况下，也就是眼睛的自然状态下执行的实验。在这种情况下，不同的距离产生的感觉并不是通过刺激所能覆盖的感觉中枢细胞的数量来进行比较，而是通过将刺激移近或移远以生成统一且最清晰的视觉感受来实现。事实上，即便眼球不运动，因为随着眼球中央凹到边缘神经分布密度的逐渐下降，我们也不能够用实验直接对韦伯定律进行证明。

因此有人会怀疑我们的证明或许和运动引起的肌肉感觉有关，从某种程度上而言，调节距离估计的可能是肌肉觉，而不是用于估计的感觉中心数量。然而即使这个解释得到证明，对韦伯定律的验证仍然是我们关注的重点。无论如何，它都是我们需要回答的基本问题。而且肌肉感觉与距离判断之间的关系确定存在很多的难点，在这里不会详细讨论。

这里将介绍另一个研究方法，它号称可以找到解决问题的方法。这个方法是用在我们的皮肤上的，因为韦伯在实验中指出，皮肤可以像视觉器官一样很好地感知距离，而且还不会受到眼球运动的影响。这个方法的唯一问题在于我们无法得知其中的神经纤维是否平均分布。这样看来最好的解决方法似乎是在皮肤不同部位分别来测试定律是否适用。因此我在自己的前额进行了一些实验，这是因为前额的皮肤面积很大且很平坦，另外皮肤下方的骨骼基础结实，所以是最好的实验区域。同时福尔克曼采用平均差误法也进行了一些实验，使用的是他的左手中指尖以及他的手背。所有结果均一致地显示出在校正误差和知觉到的距离之间，甚至连一种近似成比例的关系都不存在。总的来说平均误差的增长是更缓慢的，在大的间隔条件下完全没有超过一定的值。当然我们首先必须承认，这些误差可以被表征为两个部分的组合，一部分是与距离成比例的，另一部分是稳定的，这种论述是毫无疑问的，就和在微距条件下的视距判断中发现的情况是类似的。但是根据我们上述实验的结果，发现它们完全不能够证明韦伯定律存在于这个范围内——当使用上面所述的方法来操作时——除了神经分布的不规则性，我们所进行的这些实验结果也不能说明太多问题。

同时一个新的问题产生了：我们是否有必要继续使用这个方法对广延感受进行研究？初看起来，因为我们想要证明韦伯定律在广延感受与集中感受范围内有着相同水平的有效性，而且这种有效性在后者中已经被发现了，所以上述问题的答案似乎很明显。但是我们不能忽视一个事实，使用视觉或触觉进行距离估计的行为受到既定视觉或触觉范围的限制。这些范围的大小并没有受到影响，但集中的光刺激对前一种刺激的强度施加了限制，同样也会影响后一种刺激的强度。自然地这就产生了一个不同的情况。我在后续章节中会回来继续讨论这一点。关于之前产生负向结果的系列实验将会在《测量方法》一书中进行叙述。

物质财富与心理财富

韦伯定律可以适用于更广泛的领域。我们的物质占有（物质财富）作为一个惰性存在而言对我们没有任何的价值和意义，但是却构成了唤醒精神价值（心理财富）的环境。从这个角度而言它们取代了刺激。在这一点上，我们可以说一美元对穷人的价值比富人更大。它可以让一个乞丐开心一整天，却不能引起百万富翁的注意。韦伯定律可以解释这样的情况。如果想在被拉普拉斯称为心理财富的指标上增加相同的额度，那么在物质财富上增加的额度就与现有的物质占有量成比例。

这个原理最早出现在丹尼尔·贝努利的论文中，论文名为《各种新理论的理想大小》（大意，specimen theoriae novae de mensura sortis, incomment.acad.scient.imp.petropolit.t.v., 1738）。之后被拉普拉斯在他的著作《概率论分析》（théorie analytique des probabilités, pp.187,432）中引用，并且在后续的推论中进行了发展。后来泊松在他的《概率论研究》（recherches sur la probabilité）中提及并接纳了这一观点。

物质财富和心理财富最早并不是由贝努利而是拉普拉斯提出的。贝努利在简要介绍了这一观点后曾提道：

显然不可以通过价格来估计一个物质的价值，我们必须从这个物质能带来的利益来进行判断。价格是物质对自身价值的估计；而利益则包含了人的心态。因此，毋庸置疑的是，1000达科特[63]相对于穷人的价值比富人来说要更高，虽然钱币的量是相同的。

他进一步论述道：

因此非常可能的是，不论多小的终极利益增加值，都是与人的地位高低成反比例关系的。

他基于自己的微分方程和对数方程提出了上述观点。我们之后还可以同样使用韦伯定律来建立更加一般化的理论基础。

拉普拉斯写道：

我们必须区分两种对于财富的渴望类型，一种是相对财富，一种是绝对财富：后者因为独立的动机而更可取，前者却会因为动机的变化而变化。对于相对财富的值没有一般性的估计手段：很自然地会假设一个无限小的总和相对值应该与其绝对值大小成直接的比例关系，并且与一个人的总财富值成反比。显然一法郎对于一个拥有很多钱的人来说有价值，但是很少，而且估计其相对值最自然的方法就是对人所拥有的财富值取反比。

他继续写道：

根据这个原则，x表示一个个体的物质财富，其增量dx表示个体得到的心理财富，它与物质财富成反比；精神财富的增长可以用kdx/x表示，k代表常数。因此建立一个精神财富y与物质财富x的关系式如下：

y=klogx+logh

h表示任意常量，取决于y值相对于给定x值的变化。考虑到自然规律，我们不能假设x或y为零或是负数；对于一无所有的人则将他自己的存在当作心理财富，相比于具体的物质财富所产生的价值，这种存在的价值很难定义，但我们也不能小看这种价值，因为它对于我们的生存是必需的；我们可以想象可能这个一无所有的人会不满足于得到仅100法郎的钱，同时他也很有可能不经告知就将其花光了。

泊松写道：

由于一个人收入的价值取决于他的财富状况，我们因此分离了相对价值的数学期望并且将其命名为心理期望值。当它是一个无穷小的量时，我们将其与这个人当前拥有的财富之间的关系当作是心理期望值的测量指标，这个值可能正也可能负，相应地代表这种财富最后是增是减。我们通过对这一指标进行积分运算可以推导出与先前准则一致的结论，大家应该可以都直接猜测出这个结果。

* * *

注释：

[1] delezenne inrecueil des travaux de la soc.des sc.de lille1827 im ausz.inbull.des sc.nat.，Ⅺ，p.275, und infechner's repertor.der experimentalphysik,leipzig, 1832, vol.1，p.341.

[2] 现制中的打兰为盎司的1/16，此处可能是新旧制重量单位的差异。——译者注

[3] 也称达盖尔照相法，指的是利用镀有碘化银的钢板在暗箱里进行曝光，然后以水银蒸气进行显影，再以普通食盐定影，得到的实际上是一个金属负像，但十分清晰而且可以永久保存。——译者注

[4] 19世纪30年代末，费希纳为了获得后像而注视太阳过长的时间，因而导致自己的视网膜受损。——译者注

[5] 拉卡耶（lacaille），法国著名的天文学家，1757年编制了包括400颗亮星的星表。——译者注

[6] 由于我无法获得博格本人的文章，所以这里我引用的是马森的文章，即ann.de chim.et de phys., 1845, vol.xiv, p.148。

[7] ann.de chim.et de phys., 1845, vol.xiv, p.150.

[8] 由w.g.汉克尔编著（w.g.hankel, t.1，p.168）。

[9] ann.de chim.et de phys., 1845, vol.xiv, p.150.

[10] 据我所知，马森的研究从没有刊载在德国的科学期刊上，所以我有必要在这里逐字逐句引用他的原文。

[11] 即我们现在所说的油灯。——译者注

[12] 将太阳或其他天体的光线反射到固定方向的光学装置，又称定星镜。——译者注

[13] 这个圆盘包含了一个隔断的黑色扇区。

[14] 马森在这里指的是由若干设备组成的测光装置，他在原作中对此装置有所描述。该装置包括一个快速旋转的、被分为若干白色和黑色扇区的圆盘，以及一个用以产生照明的电火花的设备。

[15] steinheil，elemente der helligkeits-messungen am sternenhimmel, in denabhandl.der mathemat.phys.kl.der kön.bair.akad., 1837.

[16] 这里指的是费希纳的关于心理物理学定理和星等估算的文章，文章刊载于abhandl.d.kgl.sächs.ges.d.wiss., 1859, vol.4，pp.457-532和berichte d.kgl.sächs.ges.d.wiss., 1859, vol.Ⅺ，pp.58-86。——译者注

[17] 参见这里指的是费希纳的关于心理物理学定理和星等估算的文章，文章刊载于abhandl.d.kgl.sächs.ges.d.wiss., 1859, vol.4，pp.457-532和berichte d.kgl.sächs.ges.d.wiss., 1859, vol.Ⅺ，pp.58-86。——译者注

[18] 在完全黑暗的环境里，眼睛仍然能够产生光亮的感觉，随着时间延长这种感觉会加强。费希纳称这种光为augenschwarz（意思是眼中的黑暗），赫尔姆霍茨称其为eigenlicht（眼睛的自发光），通常将其翻译为眼睛或视网膜的自发光或者内在光。爱德华·黑林（edward hering）称其为恒定的灰色，而缪勒（g.e.müller）认为这种光是在视觉适应过程中视网膜完全无法发挥功能时大脑皮层视觉区域的副产物，因此将其命名为皮质灰。更现代的术语是视网膜自发光感或者是视觉兴奋的噪音水平。——译者注

[19] sillim.j.1850.9，p.443.

[20] ophthalmol.，2，p.458.

[21] ophthalmol.，1，p.156.

[22] ophthalmol., p.154.

[23] 格莱费（gräfe）的一篇论文《关于弱视导致的视野遮断现象》，刊载于《格莱费的眼科学纪要》（gräfe's arch.f.ophthalmol.，2，abth.2, p.258），这篇论文研究的结果显示，这些暂时性退化的区域对应的视野只是变暗，而并不是真正的消失。

[24] 名为多纳蒂彗星，由意大利天文学家多纳蒂发现，1858年是它上一次最接近地球的时候。——译者注

[25] pogg.ann., xxvii, p.494.

[26] pogg.ann., lxxxvi, p.513.

[27] 尼科尔棱镜是一块被切开的菱形方解石，穿过它的光会被分为两束，其中正常的那束光被反射至另一个方向之后被吸收，而另一束透过了尼科尔棱镜的光则直接转换为偏振光。洛匈棱镜由两块并列的楔形方解石组成；它能将一束光分成两束光，其中一束是正常的光而另一束是特别的光，阿拉戈使用它来产生两个影像。——译者注

[28] 角度的测量单位之一，1角分为1/60度。——译者注

[29] ueber hemeralopie, p.13.

[30] 人们从很久以前就发现了运动对注意的影响，例如看或用皮肤感觉运动的物体，以及听声音的音高变化，这种运动甚至可能使感觉迟钝的界限降低，使得人可以感觉到原先无法感觉到的刺激。——译者注

[31] arago's werke，由汉克尔编辑。

[32] helmholtz in denberichten der berl.akad., 1855, pp.757 ff.

[33] vierordt's arch., 1856, h.2, p.185；pogg.ann., xcviii.

[34] 事实上，这一结论只有当实验是在自由活动的空间中进行之时才会成立，而该实验是在封闭房间内进行的。

[35] abhandl.d.baier.akad.，7，t.2.

[36] gehler's wört.art.gehör., p.1217.

[37] 如果使用木材，我无法使两个音摆发出相同的声音。

[38] 沙夫豪特认为声音的强度和下落高度的平方根成正比（münchen.abhandl.，7，p.517），但是根据上面的比例我认为这一规则并不正确。

[39] 这是从下面这个著名的公式得出的，即

[40] 如第七章讨论过的，这个定律可以通过本书基本表中r/n值与t=hd之间的关系来进行表达。相应地，在排除了p和q影响的前提下，如果d翻倍，那么t也会翻倍。

[41] 另外还存在一个问题，即：空气阻力作为一个特定值，对于皮肤造成了多大程度的影响？不过可以说，似乎这种因素已经包含在机体，即手臂的重量里了。

[42] 关于这部分内容我还有其他可用的实验系列。

[43] 对于8hd这列而言，对应的可以说是平均为0.06p的结果。更准确地说，其实d＝0.04p和d＝0.08p对应的h值应该分开来在4hd这列中进行计算，这样才能获得最准确的h平均值。

[44] 从表6中对应的4908可知这里的4909是笔误。——译者注

[45] der tasts.und das gemeing.，p.549.

[46] 1c＝5/4°r。费希纳的这部分实验均是采用列氏温标进行读数的，除非有特别注明。——译者注

[47] 这个温度是参考了由利希滕菲尔（lichtenfels）与弗洛里什（fröhlich）在《维也纳学会报告》（abhandl.der wien.akad.）中提到的体温数据而计算出来的。

[48] 这部分叙述疑有误，应是在温度升序实验中总是先浸泡在较冷的水中，而在温度降序实验中先浸泡在较热的水里。——译者注

[49] 我在这里总是引用一对对比温度中较低的那个值。

[50] 此数据疑有印刷错误。——译者注

[51] vierordt's arch.，Ⅺ，pp.844, 853.

[52] 就意义而言，这个误差不能与之前提到的常误混淆起来。它是来源于可变误差的，就如其他误差成分中的表现那样，另外的这部分误差被称为常量的原因仅仅是在通过上述手段进行测定的情况下，当标准间距改变时这个误差却不会变，而且不会如韦伯实验中的可变误差那样会与标准间距成函数关系变化。

[53] 这个误差的特殊分布导致了表（1）中的一些数据比表（2）中的略小。

[54] 最小二乘法从理论上而言要更准确一些，但是实施起来更复杂。而且与已有方法获得的结果相比，两种方法差距并不大，所以并没有必要改用最小二乘法。

[55] 如果还有人出于同样的原因无法信任上述校正方法，那么我想说的是，提到的对均方差的校正已为所有的数学家和天文学家所接受，其中的误差产生原因和我们在这里提到的非常相似。

[56] 更多的细节请参见berichte de sächs.soc., 1858, p.140。

[57] 计算方法是将数据代进线性公式v2+d2w2=（∑δ）2，其中v2和w2是未知的。而后v和w的值可以根据v2和w2开根号得到。v和w的或然误差，可以通过观测而得的（∑δ）2值分别计算出的v2和w2，开方得到v和w值，之后根据统计原理，分别除以2v和2w而得。

[58] 即眼节点。眼中的一个圆形小结节，感光用。——译者注

[59] 未校正误差δ是由两个部分组成的：可变误差δ与常误c。v和w因此对应的是可变误差δ中的组成部分。

[60] 这不是我自己的结论，我只是引用了莫比乌斯教授的观点。

[61] 眼球旋转的中心点。——译者注

[62] 根据wagner's wörterb.art.sehen.，p.234。

[63] 旧时通用于欧洲的银币。——译者注

书友推荐

第九章 韦伯定律

回忆苏格拉底 / 色诺芬

第九章韦伯定律