材料1 1997年,国际象棋大师加里·卡斯帕罗夫败给了电脑“深蓝”;2016年,谷歌人工智能AlphaGo又战胜了韩国棋手李世石,这标志着人工智能终于征服了它在棋类比赛中最后的弱项——围棋,谷歌公司的DeepMind团队比预期提前了整整10年达到了既定目标。 对计算机来说,围棋并不是因为其规则比国际象棋复杂而难以征服——与此完全相反,围棋规则更简单,它其实只有一种棋子,对弈的双方轮流把黑色和白色的棋子放到一个19×19的正方形棋盘中,落下的棋子就不能再移动了,只会在被对方棋子包围时被提走。到了棋局结束时,占据棋盘面积较多的一方为胜者。 围棋的规则如此简单,但对于计算机来说却又异常复杂,原因在于围棋的步数非常多,而且每一步的可能下法也非常多。以国际象棋作对比,国际象棋每一步平均约有35种不同的可能走法,一般情况下,多数棋局会在80步之内结束。围棋棋盘共有361个落子点,双方交替落子,整个棋局的总排列组合数共有约10171种可能性,这远远超过了宇宙中的原子总数——1080! 对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的“暴力”方法,再辅以一些技巧,来寻找对弈策略,也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法。这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高,对围棋或者象棋程序来说是非常困难的,尤其是围棋,从技术上来讲目前不可能做到。 “蒙特卡罗树搜索”是一种基于蒙特卡罗算法的启发式搜索策略,能够根据对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。举例来说,假如筐里有100个苹果,每次闭着眼拿出1个,最终要挑出最大的1个,于是先随机拿1个,再随机拿1个跟它比,留下大的,再随机拿1个……每拿一次,留下的苹果都至少不比上次的小,拿的次数越多,挑出的苹果就越大。但除非拿100次,否则无法肯定挑出了最大的。这个挑苹果的方法,就属于蒙特卡罗算法。虽然“蒙特卡罗树搜索”在此前一些弈棋程序中也有采用,在相对较小的棋盘中也能很好地发挥作用,但在正规的全尺寸棋盘上,这种方法仍然存在相当大的缺陷,因为涉及的搜索树还是太大了。 AlphaGo人工智能程序中最新颖的技术当属它获取知识的方式——深度学习。AlphaGo 借助两个深度卷积神经网络(价值网络和策略网络)自主地进行新知识的学习。深度卷积神经网络使用很多层的神经元,将其堆叠在一起,用于生成图片逐渐抽象的、局部的表征。对图像分析得越细,利用的神经网络层就越多。AlphaGo也采取了类似的架构,将围棋棋盘上的盘面视为19×19的图片输入,然后通过卷积层来表征盘面。这样,两个深度卷积神经网络中的价值网络用于评估盘面,策略网络则用于采样动作。 在深度学习的第一阶段——策略网络的有监督学习(即从 I 中学习)阶段,拥有13层神经网络的AlphaGo借助围棋数据库KGS中存储的3000万份对弈棋谱进行初步学习。这3000万份棋谱样本可以用a、b进行统计。a是一个二维棋局,把a输入到一个卷积神经网络进行分类,分类的目标就是落子向量A。通过不断的训练,尽可能让计算机得到的向量A接近人类高手的落子结果b,这样就形成了一个模拟人类下围棋的神经网络,然后得出一个下棋函数F_go()。当盘面走到任何一种情形的时候,AlphaGo都可以通过调用函数F_go()计算的结果来得到最佳的落子结果b可能的概率分布,并依据这个概率来挑选下一步的动作。在第二阶段——策略网络的强化学习(即从 Ⅱ 中学习)阶段,AlphaGo开始结合蒙特卡罗树搜索,不再机械地调用函数库,而类似于一种人类进化的过程:AlphaGo会和自己的老版本对弈。即,先使用F_go(1)和F_go(1)对弈,得到了一定量的新棋谱,将这些新棋谱加入到训练集当中,训练出新的F_go(2),再使用F_go(2)和F_go(1)对弈,以此类推,这样就可以得到胜率更高的F_go(n)。这样,AlphaGo就可以不断改善它在第一阶段学到的知识。在第三阶段——价值网络的强化学习阶段,AlphaGo可以根据之前获得的学习经验得出估值函数v(s),用于预测策略网络自我对抗时棋盘盘面s的结果。最后,则是将F_ go()、v(s)以及蒙特卡罗树搜索三者相互配合,使用F_ go()作为初始分开局,每局选择分数最高的方案落子,同时调用v(s)在比赛中做出正确的判断。 这就是AlphaGo给围棋带来的新搜索算法。它创新性地将蒙特卡罗模拟和价值网络、策略网络结合起来训练深度神经网络。这样价值网络和策略网络相当于AlphaGo 的两个大脑,策略网络负责在当前局面下判断“最好的”下一步,可以理解为落子选择器;价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器,通过两个“大脑”各自选择的平均值,AlphaGo最终决定怎样落子胜算最大。通过这种搜索算法,AlphaGo和其他围棋程序比赛的胜率达到了99.8%。 AlphaGo的飞快成长是任何一个围棋世界冠军都无法企及的。随着计算机性能的不断增强,遍历蒙特卡罗搜索树将进一步提高命中概率。大量的计算机专家,配合大量的世界围棋高手,在算法上不断革新,再配合不断成长的超级计算能力,不断地从失败走向成功,最终打造出围棋人工智能。在AlphaGo击败李世石后,欧洲围棋冠军樊麾说了这么一句话:“这是一个团队的集体智慧用科技的方式战胜了人类数千年的经验积累。”人和机器其实没有站在对立面上,“是人类战胜了人类”。 材料2 上世纪80年代,M市高温首日经常出现在6月中下旬至7月,到21世纪,往往还没到6月中旬,M市气温就会蹿至35℃以上,仅有两年的高温日到7月才出现,1981年以来,M市6-8月高温日出现越来越频繁,可见,M市首个高温日的出现时间越来越早,21世纪后每年首个高温日出现时间肯定早于上世纪80年代。 在M市,一年中最热的时候莫过于7月,1997年以来,高温日数逐渐增多。截至2018年7月中旬,2018年M市高于35℃的日子已有6个,比往年7月的平均数还多2个。可以确定,这一年M市7月的高温日总数将是1997年以来最多的一年。另外,据统计,M市7月的高温日整体多于6月和8月,照此趋势,2018年8月的高温日可能不会超过7月。 近30年来,M市7月的夜温越来越高,1999年以来7月的夜间最低气温普遍超过23℃,所以2018年7月下旬M市夜间的最低气温不会低于23℃。 同样,近30年来,M市6-8月出现持续3天以上高温的总次数为27次,20次都是在2000年以后出现的,2018年6月和7月,M市已经分别出现了一次持续3天以上的高温。既然2018年M市出现3天以上持续高温的次数已经超过了近30年来的平均值,那么8月份M市不会出现3天以上的持续高温天气。 30年来,M市“城市热岛效应”愈发显著,城区与郊区的平均气温差值越来越大。2018年7月M市各区平均气温偏高,均超过26.7℃。其中市中心2个城区气温最高,其次是环市中心的其他4个城区,2个郊区的气温最低。(注:高温日为日最高气温≥35℃) 材料3 材料一:细菌学家弗莱明的实验室里摆放着许多有毒细菌培养皿。多年来,他试验了各种药剂,力图找到一种能杀灭这些细菌的理想药品,但一直未能成功。1928年的一个早晨,他在检查细菌的变化时,突然发现一个葡萄状球菌的培养皿里长出了一团青色霉菌,并且其周围原来生长着的葡萄状球菌消失了,他进一步研究发现,这种青色霉菌对其他多种有毒细菌同样具有杀灭作用,他把这种青色霉菌分泌的杀菌物质称为青霉素。 材料二:1870年,英国科学家克鲁克斯在做阴极射线管放电实验时,意外发现管子附近的照相底片有模糊阴影,他判断是照相的干板有毛病;1890年美国科学家古德斯柏德在做相同的实验时也发现同样的现象,他归因于冲洗药水和冲洗技术有问题;到了1892年,德国有些物理学家也观察到这一现象,但当时他们的注意力都集中在研究阴极射线的性质上,对此并没有警觉;直到1895年,这一奇特现象才被德国物理学家伦琴敏锐地抓住,他反复研究实验,最终发现了X射线,他也因此获得诺贝尔物理学奖。 材料三:丹麦天文学家第谷三十年如一日观测天象,记录了750颗星相对位置的变化,纠正了以往星表中的错误。但第谷不善于对感性材料进行科学抽象和概括,终究未能揭示行星运动规律。临终前,他把自己所有的材料交给了学生开普勒,要求他继续研究行星运动的理论。起初,开普勒以第谷宇宙体系为基本框架来探讨这个问题,但毫无所获,于是转而以哥白尼日心体系为基本框架展开研究。他精于理论思维和数学推导,根据老师留下的大量一手资料,最终发现了天体运动的三大定律,被誉为“天空立法者”。 二、回答问题 【试题一】 国际象棋的走法不超过35×80种。( ) 【试题二】 结构简单的棋类游戏可以通过对博弈树的“暴力”穷举搜索找出最优走法。( ) 【试题三】 传统的计算机围棋程序能够完成全尺寸棋盘的蒙特卡罗树模拟并计算最大胜率。( ) 【试题四】 函数F_go(n)比F_go(n-1)的胜率更高。( ) 【试题五】 填空题:请根据文意,分别填补文中Ⅰ、Ⅱ两处缺项,每空不超过6个字。 Ⅰ( ) Ⅱ( ) 【试题六】 这篇文章开头认为围棋是人工智能在棋类比赛中最后弱项的原因是( )。 A、围棋每一步可能的下法太多,无法使用穷举搜索 B、围棋的规则对于计算机来说太过复杂,无法理解 C、单一的计算机神经网络难以应对围棋的搜索计算 D、围棋盘面局势的评估缺乏现代计算机技术的支撑 【试题七】 下列关于AlphaGo“两个大脑”的说法正确的是( )。 A、价值网络负责评估盘面优劣 B、策略网络负责判断走法优劣 C、策略网络能够协助价值网络提高运算效率 D、价值网络和策略网络共同确定最终的落子位置 【试题八】 比较分析AlphaGo新算法与蒙特卡罗树搜索的不同之处。 要求:概括准确,层次清晰,文字简洁,不超过250字。 【试题九】 请为本文写一篇内容摘要。 要求:全面、准确,条理清楚,不超过300字。 【试题十】 论证评价题:阅读给定材料2,指出其中存在的4处论证错误并分别说明理由。请在答题卡上按序号分条作答,每一条先将论证错误写在“A”处(不超过75字),再将相应理由写在“B”处(不超过50字)。(40分) 【试题十一】 材料作文题:阅读下列材料,按要求作答。(60分) 参考给定材料3,以“科学发现中的偶然”为话题,自选角度,自拟题目,写一篇议论文。 要求:观点鲜明,论证充分,条理清晰,语言流畅,字数800-1000字。
【试题一】参考答案 第一步——审题 提取题干关键词,预判可能出现的错误。 国际象棋的走法不超过35×80种。 【本题中的“35”和“80”都是数字,可以作为关键词进行定位。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 国际象棋的走法不超过35×80种。 〖通过选项中的“35”和“85”作为关键词可以定位到第3段。〗 段3:围棋的规则如此简单,但对于计算机来说却又异常复杂,原因在于围棋的步数非常多,而且每一步的可能下法也非常多。以国际象棋作对比,国际象棋每一步平均约有35种不同的可能走法,一般情况下,多数棋局会在80步之内结束。围棋棋盘共有361个落子点,双方交替落子,整个棋局的总排列组合数共有约10171种可能性,这远远超过了宇宙中的原子总数——1080!。 〖根据原文“国际象棋每一步平均约有35种不同的可能走法,一般情况下,多数棋局会在80步之内结束”可知,国际象棋的走法应该是第一步35种可能性,第二步同样是35种可能性,最多80步,所以最多需要80个35相乘,即为35的80次方。远远超过了选项表述的“35×80种”。由此得出要点:(1)是错误的。〗 第三步——按题目要求整理要点 国际象棋的走法不超过35×80种。(错误) 【试题二】参考答案 第一步——审题 提取题干关键词,预判可能出现的错误。 结构简单的棋类游戏可以通过对博弈树的“暴力”穷举搜索找出最优走法。 【本题中“暴力”一词带有引号,较为显眼,可以作为关键词进行定位。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 结构简单的棋类游戏可以通过对博弈树的“暴力”穷举搜索找出最优走法。 〖通过“暴力”作为关键词可以定位到第4段。〗 段4:对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的“暴力”方法,再辅以一些技巧,来寻找对弈策略,也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法。这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高,对围棋或者象棋程序来说是非常困难的,尤其是围棋,从技术上来讲目前不可能做到。 〖根据原文“对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的‘暴力’方法……也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法”可知,“对于结构简单的棋类游戏”可以把“所有盘面都进行尝试并给予评价”,即“穷举”,和选项表述一致。由此可以得出要点:(2)是正确的。〗 第三步——按题目要求整理要点 结构简单的棋类游戏可以通过对博弈树的“暴力”穷举搜索找出最优走法。(正确) 【试题三】参考答案 第一步——审题 提取题干关键词,预判可能出现的错误。 传统的计算机围棋程序能够完成全尺寸棋盘的蒙特卡罗树模拟并计算最大胜率。 【本题中的“蒙特卡罗树模拟”属于专有名词,能够帮助定位。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 传统的计算机围棋程序能够完成全尺寸棋盘的蒙特卡罗树模拟并计算最大胜率。 〖通过“蒙特卡罗树模拟”,可以定位到段5。〗 段5:“蒙特卡罗树搜索”是一种基于蒙特卡罗算法的启发式搜索策略,能够根据对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。举例来说,假如筐里有100个苹果,每次闭着眼拿出1个,最终要挑出最大的1个,于是先随机拿1个,再随机拿1个跟它比,留下大的,再随机拿1个……每拿一次,留下的苹果都至少不比上次的小,拿的次数越多,挑出的苹果就越大。但除非拿100次,否则无法肯定挑出了最大的。这个挑苹果的方法,就属于蒙特卡罗算法。虽然“蒙特卡罗树搜索”在此前一些弈棋程序中也有采用,在相对较小的棋盘中也能很好地发挥作用,但在正规的全尺寸棋盘上,这种方法仍然存在相当大的缺陷,因为涉及的搜索树还是太大了。 〖根据原文“虽然‘蒙特卡罗树搜索’……在正规的全尺寸棋盘上,这种方法仍然存在相当大的缺陷,因为涉及的搜索树还是太大了”可知,在正规的全尺寸棋盘上,蒙特卡罗树搜索无法发挥作用。这和选项表述的“能够完成全尺寸棋盘的蒙特卡罗树模拟并计算最大胜率”是不一致的。由此可以得出要点:(3)是错误的。〗 第三步——按题目要求整理要点 传统的计算机围棋程序能够完成全尺寸棋盘的蒙特卡罗树模拟并计算最大胜率。(错误) 【试题四】参考答案 第一步——审题 提取题干关键词,预判可能出现的错误。 函数F_go(n)比F_go(n-1)的胜率更高。 【本题中的函数属于专有名词,能够帮助定位。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 函数F_go(n)比F_go(n-1)的胜率更高。 〖通过函数“F_go(n)”,可以定位到第7段。〗 段7:在深度学习的第一阶段——策略网络的有监督学习(即从 I 中学习)阶段,拥有13层神经网络的AlphaGo借助围棋数据库KGS中存储的3000万份对弈棋谱进行初步学习。这3000万份棋谱样本可以用a、b进行统计。a是一个二维棋局,把a输入到一个卷积神经网络进行分类,分类的目标就是落子向量A。通过不断的训练,尽可能让计算机得到的向量A接近人类高手的落子结果b,这样就形成了一个模拟人类下围棋的神经网络,然后得出一个下棋函数F_go()。当盘面走到任何一种情形的时候,AlphaGo都可以通过调用函数F_go()计算的结果来得到最佳的落子结果b可能的概率分布,并依据这个概率来挑选下一步的动作。在第二阶段——策略网络的强化学习(即从 Ⅱ 中学习)阶段,AlphaGo开始结合蒙特卡罗树搜索,不再机械地调用函数库,而类似于一种人类进化的过程:AlphaGo会和自己的老版本对弈。即,先使用F_go(1)和F_go(1)对弈,得到了一定量的新棋谱,将这些新棋谱加入到训练集当中,训练出新的F_go(2),再使用F_go(2)和F_go(1)对弈,以此类推,这样就可以得到胜率更高的F_go(n)。这样,AlphaGo就可以不断改善它在第一阶段学到的知识。在第三阶段——价值网络的强化学习阶段,AlphaGo可以根据之前获得的学习经验得出估值函数v(s),用于预测策略网络自我对抗时棋盘盘面s的结果。最后,则是将F_ go()、v(s)以及蒙特卡罗树搜索三者相互配合,使用F_ go()作为初始分开局,每局选择分数最高的方案落子,同时调用v(s)在比赛中做出正确的判断。 〖根据原文“先使用F_go(1)和F_go(1)对弈,得到了一定量的新棋谱,将这些新棋谱加入到训练集当中,训练出新的F_go(2),再使用F_go(2)和F_go(1)对弈,以此类推,这样就可以得到胜率更高的F_go(n)”可知,函数F_go(2)比F_go(1)的胜率更高,以此类推,函数F_go(n)比F_go(n-1)的胜率更高,原文表述和选项表述一致。由此可以得出要点:(4)是正确的。〗 第三步——按题目要求整理要点 函数F_go(n)比F_go(n-1)的胜率更高。(正确) 【试题五】参考答案 【参考答案】 Ⅰ(数据库的棋谱) Ⅱ(和老版本对弈) 【题目解析】 第一步——审题 1.填空题:请根据文意,分别填补文中Ⅰ、Ⅱ两处缺项,每空不超过6个字。 Ⅰ( ) Ⅱ( ) 【本题需要填空,并且字数都非常少,只需要通过符号和括号定位原文,找出缺项的位置,再联系上下文,通过文意填补缺项即可。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 Ⅰ( ) Ⅱ( ) 〖浏览原文发现,缺项出现在段7,缺项1出现在段首,缺项2在段中。〗 段7:在深度学习的第一阶段——策略网络的有监督学习(即从 I 中学习)阶段,拥有13层神经网络的AlphaGo借助围棋数据库KGS中存储的3000万份对弈棋谱进行初步学习。这3000万份棋谱样本可以用a、b进行统计。a是一个二维棋局,把a输入到一个卷积神经网络进行分类,分类的目标就是落子向量A。通过不断的训练,尽可能让计算机得到的向量A接近人类高手的落子结果b,这样就形成了一个模拟人类下围棋的神经网络,然后得出一个下棋函数F_go()。当盘面走到任何一种情形的时候,AlphaGo都可以通过调用函数F_go()计算的结果来得到最佳的落子结果b可能的概率分布,并依据这个概率来挑选下一步的动作。 〖(1)根据原文的括号和“即“这个字可知,括号内的内容是对策略网络的有监督学习进行解释,因此从后文中就可以找到答案。(2)再根据“从……中学习”可知,需要填补的缺项内容,指的是学习的方式、途径或者渠道。而后文中的“借助围棋数据库KGS中存储的3000万份对弈棋谱进行初步学习”表达了相同的意思,因此缺项中的内容应为“数据库KGS中储存的三千万份对弈棋谱”,删去修饰词缩短到6个字以内,即可得出答案:数据库的棋谱。〗 在第二阶段——策略网络的强化学习(即从 Ⅱ 中学习)阶段,AlphaGo开始结合蒙特卡罗树搜索,不再机械地调用函数库,而类似于一种人类进化的过程:AlphaGo会和自己的老版本对弈。即,先使用F_go(1)和F_go(1)对弈,得到了一定量的新棋谱,将这些新棋谱加入到训练集当中,训练出新的F_go(2),再使用F_go(2)和F_go(1)对弈,以此类推,这样就可以得到胜率更高的F_go(n)。这样,AlphaGo就可以不断改善它在第一阶段学到的知识。在第三阶段——价值网络的强化学习阶段,AlphaGo可以根据之前获得的学习经验得出估值函数v(s),用于预测策略网络自我对抗时棋盘盘面s的结果。最后,则是将F_go()、v(s)以及蒙特卡罗树搜索三者相互配合,使用F_go()作为初始分开局,每局选择分数最高的方案落子,同时调用v(s)在比赛中做出正确的判断。 〖(1)按照同样的思路处理第二个缺项,从缺项之后的原文中寻找答案,即为“AlphaGo会和自己的老版本对弈”。将之删减到6个字以内,得出答案:和老版本对弈。〗 第三步——按题目要求整理要点 【根据题干,本题需要将答案分别填写在两处括号中。】 Ⅰ(数据库的棋谱) Ⅱ(和老版本对弈) 【试题六】参考答案 第一步——审题 提取题干关键词,定位材料。 这篇文章开头认为围棋是人工智能在棋类比赛中最后弱项的原因是( )。 A.围棋每一步可能的下法太多,无法使用穷举搜索 B.围棋的规则对于计算机来说太过复杂,无法理解 C.单一的计算机神经网络难以应对围棋的搜索计算 D.围棋盘面局势的评估缺乏现代计算机技术的支撑 【本题属于细节查找题。考生需要找出选项中符合题意的选项。题干提示定位位置是在文章开头,可以在文章开头部分中寻找题干主题“围棋”、“人工智能”,也可以借助表示原因的提示词进行定位。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 〖根据题干,从文章开头部分进行定位。〗 A.围棋每一步可能的下法太多,无法使用穷举搜索 〖段3和段4出现选项关键词“下法”和“穷举”〗 段3:围棋的规则如此简单,但对于计算机来说却又异常复杂,原因在于围棋的步数非常多,而且每一步的可能下法也非常多。以国际象棋作对比,国际象棋每一步平均约有35种不同的可能走法,一般情况下,多数棋局会在80步之内结束。围棋棋盘共有361个落子点,双方交替落子,整个棋局的总排列组合数共有约10171种可能性,这远远超过了宇宙中的原子总数——1080!。 〖(1)根据原文“围棋的规则如此简单,但对于计算机来说却又异常复杂,原因在于围棋的步数非常多,而且每一步的可能下法也非常多”可知,围棋每一步的下法非常多。和选项A的前半部分表述一致。〗 段4:对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的“暴力”方法,再辅以一些技巧,来寻找对弈策略,也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法。这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高,对围棋或者象棋程序来说是非常困难的,尤其是围棋,从技术上来讲目前不可能做到。 〖(2)根据原文“这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高……尤其是围棋,从技术上来讲目前不可能做到”可知,A选项中的“无法使用穷举搜索”与原文表述一致。综合(1)和(2)可以得出要点:A选项表述和原文一致,A选项正确。〗 〖此外,根据原文“这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高……尤其是围棋,从技术上来讲目前不可能做到”还可以得出,目前的计算机技术难以应对围棋的搜索计算,和C选项“单一的计算机神经网络难以应对围棋的搜索计算”表述是相同的。可以得出要点:C选项表述和原文一致,C选项正确。〗 B.围棋的规则对于计算机来说太过复杂,无法理解 〖段2提到了围棋的规则〗 段2:对计算机来说,围棋并不是因为其规则比国际象棋复杂而难以征服——与此完全相反,围棋规则更简单,它其实只有一种棋子,对弈的双方轮流把黑色和白色的棋子放到一个19×19的正方形棋盘中,落下的棋子就不能再移动了,只会在被对方棋子包围时被提走。到了棋局结束时,占据棋盘面积较多的一方为胜者。 〖根据原文“对计算机来说,围棋并不是因为其规则比国际象棋复杂而难以征服——与此完全相反,围棋规则更简单”可知,对于计算机来说,围棋规则更简单。原文表述和选项B“围棋的规则对于计算机来说太过复杂”不一致。由此可以得出要点:B选项错误,排除。〗 D.围棋盘面局势的评估缺乏现代计算机技术的支撑 〖段4提到了围棋的盘面。〗 段4:对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的“暴力”方法,再辅以一些技巧,来寻找对弈策略,也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法。这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高,对围棋或者象棋程序来说是非常困难的,尤其是围棋,从技术上来讲目前不可能做到。 〖根据原文“也就是对余下可能出现的所有盘面都进行尝试并给予评价……尤其是围棋,从技术上来讲目前不可能做到”可知,要对围棋的盘面进行尝试和评价,从而找出最优走法,目前的计算机技术是做不到的。原文表述和选项D中“缺乏现代计算机技术的支撑”意思相同。由此可以得出要点:D选项正确,当选。〗 第三步——按题目要求整理要点 【不定项选择题:备选项中至少有一个符合题意。】 【答案】ACD 【试题七】参考答案 第一步——审题 提取题干关键词,定位材料。 下列关于AlphaGo“两个大脑”的说法正确的是( )。 A.价值网络负责评估盘面优劣 B.策略网络负责判断走法优劣 C.策略网络能够协助价值网络提高运算效率 D.价值网络和策略网络共同确定最终的落子位置 【本题属于细节查找题。考生需要找出选项中符合题意的选项。题干中的AlphaGo“两个大脑”可以帮助定位。】 第二步——定位资料,提取要点 根据题干的关键信息找到题目对应的文献位置,进行信息的查找和比对。 下列关于AlphaGo“两个大脑”的说法正确的是 〖根据题干,利用AlphaGo“两个大脑”定位到段8。〗 A.价值网络负责评估盘面优劣 B.策略网络负责判断走法优劣 C.策略网络能够协助价值网络提高运算效率 D.价值网络和策略网络共同确定最终的落子位置 段8:这就是AlphaGo给围棋带来的新搜索算法。它创新性地将蒙特卡罗模拟和价值网络、策略网络结合起来训练深度神经网络。这样价值网络和策略网络相当于AlphaGo的两个大脑,策略网络负责在当前局面下判断“最好的”下一步,可以理解为落子选择器;价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器,通过两个“大脑”各自选择的平均值,AlphaGo最终决定怎样落子胜算最大。通过这种搜索算法,AlphaGo和其他围棋程序比赛的胜率达到了99.8%。 〖(1)原文“价值网络负责评估整体盘面的优劣”和A选项表述一致。由此可以得出:A选项正确,当选。(2)根据原文“策略网络负责在当前局面下判断‘最好的’下一步,可以理解为落子选择器”可知,策略网络判断下一步走法的优劣,和B选项表述一致。由此可以得出:B选项正确,当选。(3)根据原文“价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率”并结合上文可知,“前者”指的是策略网络,原文意为“价值网络协助策略网络提高运算效率”,和C选项表述的“策略网络能够协助价值网络提高运算效率”不一致。由此可以得出:C选项错误,排除。(4)根据原文“通过两个‘大脑’各自选择的平均值,AlphaGo最终决定怎样落子胜算最大”可知,价值网络和策略网络共同决定怎样落子胜算最大,和D选项表述的“价值网络和策略网络共同确定最终的落子位置”是一致的。由此可以得出:D选项正确,当选。〗 第三步——按题目要求整理要点 【不定项选择题:备选项中至少有一个符合题意。】 【答案】ABD 【试题八】参考答案 【参考答案】 一、算法原理不同。AlphaGo利用深度学习的方式,借助价值网络和策略网络自主学习新知识。蒙特卡罗树搜索是一种基于蒙特卡罗算法的启发式搜索策略。 二、工作方式不同。AlphaGo价值网络评估整体盘面优劣,策略网络决定走法,二者共同决定如何落子。蒙特卡罗树搜索根据对搜索空间的随机抽样扩大搜索树,再分析每一步棋的最佳走法,算法步骤较多。 三、适用性不同。AlphaGo可以适用于正规全尺寸棋盘,且胜率高。蒙特卡罗树搜索因搜索树大而无法在正规的全尺寸棋盘应用。 因此AlphaGo新算法更先进。未来人工智能发展应重视深度学习这一方法。 参考答案说明:答案从“算法原理”“工作方式”“适用性”三个角度对两者不同之处进行了对比,最后给出了对比结论。各条要点之间在内容上是并列关系,无交叉。 【题目解析】 第一步——审题 通过勾画题干关键点,明确题目类型、材料范围、答题要素和要求等。 根据材料1【提示我们阅读范围是给定材料1】,回答下列问题: 比较分析AlphaGo新算法和蒙特卡罗树搜索的不同之处【①本题的主题是“AlphaGo新算法”和“蒙特卡罗树搜索”,寻找要点时要紧扣主题,不论二者分别出现还是共同出现,都需阅读,与该主题无关的材料可以略读。②本题的作答目标是“不同之处”,即二者相比较的区别,因此阅读材料时需要关注“相比之下……”“相较而言……”等比较词,若无比较词,需关注材料描述相应主题的角度,在相同角度下进行比较。③本题要求对二者进行“比较分析”,所以在比较不同之后,需进行分析......
|