AlphaZero“通用棋类AI”问世:完爆AlphaGo?,通用,算法,击败,强化学习,优化,程序,神经网络,对弈, 日前,DeepMind团队发表了最新论文,提出了全新的强化学习算法AlphaZero,它是一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法,堪称“通用棋类AI”。 据了解,AlphaZero算法可以8个小时训练击败李世石版本AlphaGo;12小时训练击败世界顶级的国际象棋程序Stockfish;14小时训练击败世界...
2017-12-07 02:15:00教程通用 击败 算法