当前位置: 首页 > 系统架构设计师 > 综合知识+案例分析+论文 > AlphaGo在围棋比赛中战胜人类冠军,其核心算法中使用了(),该方法通过智能体与环境的交互,根据环境的反馈(奖赏或惩罚)来优化行为策略。

1.【单选题】

AlphaGo在围棋比赛中战胜人类冠军,其核心算法中使用了(),该方法通过智能体与环境的交互,根据环境的反馈(奖赏或惩罚)来优化行为策略。

A

迁移学习

B

强化学习

C

主动学习

D

演化学习

查看答案
获取二级造价工程师定制学习规划
壮壮老师
00:00:00
2334已获取

微信号:hqwxjg1006

系统架构设计师历年真题 更多

下载快题库,随时随地刷题
碎片时间巩固知识点

返回顶部