1969年,马文·明斯基与西摩尔·帕波特出版《感知机:计算几何学导论》。这本书用严格的数学方法研究感知机能够和不能解决的问题,说明特定单层结构无法表示奇偶性、连通性等任务;常被用于讲解的异或(XOR)问题,也是线性不可分能力边界的典型例子。
这项工作纠正了早期宣传中对感知机能力的过度乐观,也让研究者更清楚地看到:仅靠增加单层感知机的训练,并不能自动获得通用智能。但书中分析的主要对象具有明确的结构范围,它并没有证明所有神经网络或多层网络都不可能成功。
在后来的AI史叙述中,《感知机》经常被描述为连接主义失去信心和资金的转折点,甚至被概括为神经网络寒冬的起点。不过,这种单一因果解释存在争议。多层网络、早期训练方法和其他连接主义研究并未完全停止;当时有限的计算能力、数据规模、训练技术、学术路线竞争以及整体资助环境,共同影响了该方向的发展速度。
因此,这一节点的重要性不在于“一本书杀死了神经网络”,而在于它展示了科学进步中的双重作用:严谨批评能够揭示真实边界,但当结论被扩大到其适用范围之外时,也可能影响整个研究共同体的判断。1980年代反向传播重新受到重视后,多层网络以新的训练方法回应了单层感知机无法解决的问题。
【资料来源】
– Perceptrons: An Introduction to Computational Geometry: https://mitpress.mit.edu/9780262630221/perceptrons/
– Annotated History of Modern AI and Deep Learning: https://arxiv.org/abs/2212.11279
– Deep Learning in Neural Networks: An Overview: https://arxiv.org/abs/1404.7828
觉得有用?点个赞