2016年3月,DeepMind的AlphaGo在首尔以4:1击败世界围棋冠军李世石,震惊全球。围棋棋盘上的可能走法超过宇宙原子数,被认为是人类专有的直觉领域。AlphaGo结合了深度卷积网络(识别棋盘形势)和蒙特卡洛树搜索(规划未来走法),通过人类棋谱监督学习后,再用强化学习与自己对弈数百万局。第二局的第37手被称为”宇宙之手”——一步任何人类棋手都不会走却最终被证明是天才之着的棋,现场专家沉默半分钟才反应过来。

【为什么重要?】
AlphaGo彻底打破了”围棋是AI无法企及的人类直觉领域”的神话,证明深度强化学习可以在最复杂的决策问题上超越人类,推动AI向决策智能进化。

【逻辑闭环】
解决了什么:结合感知(CNN)和规划(MCTS)与自我强化,解决了高维直觉决策问题。局限是什么:AlphaGo仍然是特定任务系统,无法迁移到其他游戏(后来的AlphaZero解决了这点)。更重要的是:AlphaGo的胜利让全社会意识到AI已不仅仅是工具——它能学习、能超越,这引爆了全球各国对AI战略的高度重视,大量资金涌入。

觉得有用?点个赞

作者 entai_admin

发表回复

© 2026 EntAI恩钛智能  |  上海市黄浦区人民路879号人民大楼一楼(后) | EntAI@EntAIAI.com
🔑 登录 ✨ 免费注册
友情链接: IAICA 国际智能照护协会 IAICA.NGO® OECD AI UNESCO AI Partnership on AI Stanford HAI MIT CSAIL Berkeley BAIR 清华AIR 北京智源BAAI Hugging Face Papers With Code Google DeepMind Anthropic