当前位置：首页 > 系统架构设计师 > 综合知识+案例分析+论文 > AlphaGo在围棋比赛中战胜人类冠军，其核心算法中使用了（），该方法通过智能体与环境的交互，根据环境的反馈（奖赏或惩罚）来优化行为策略。

1.【单选题】

AlphaGo在围棋比赛中战胜人类冠军，其核心算法中使用了（），该方法通过智能体与环境的交互，根据环境的反馈（奖赏或惩罚）来优化行为策略。

A

迁移学习

B

强化学习

C

主动学习

D

演化学习

查看答案

参考答案: B

获取二级造价工程师定制学习规划

壮壮老师

00:00:00

2334已获取

微信号：hqwxjg1006

系统架构设计师历年真题更多

资料下载更多

下载快题库，随时随地刷题
碎片时间巩固知识点

微信扫码安全登录

可进入学习中心查看新用户注册赠礼

扫描即表示同意《网站注册协议》

返回顶部