123/A, Miranda City Likaoli Prikano, Dope
+0989 7876 9865 9
+(090) 8765 86543 85
info@example.com
example.mail@hum.com
两台阿尔法狗对奕会怎样?
这个问题就不用如果了,网上已经放出了50盘两狗互掐的棋局。直接说结果,黑棋胜了12盘,白棋胜了38盘。从这个统计数据可以看出很多问题。
其一,白棋胜率远远高于黑棋说明现在的贴目规则并不“科学”。现在的围棋规则是黑贴7目半,根据阿尔法狗的互掐测试说明黑棋贴目贴多了,理论上来讲,如果可以让两只狗在贴6目半或者5目半的前提下再各下50盘,黑白胜率基本相同的时候就是相对科学的贴目。
其二,中盘胜的盘数是19盘,另外31盘都下到了最后。这说明了围棋还是太深奥了。比如说一盘棋的终局手数是230手左右,双方水平越高,就越可能在越早的手数时知道最终的胜负(共识)。既然阿尔法狗的”互掐“大部分也需要在终局决出胜负,说明阿尔法狗还远远未到”围棋上帝“的水平,只能说咱们老祖宗发明的这个围棋太伟大了,太深奥了。现在才知道当年日本著名棋手藤泽秀行先生的那句“棋道一百,我只知七”并非谦言。
其三,从放出的50盘棋来看,棋局中已经有很多招数人类已经看不懂。这里说的人类指的是人类中的顶尖围棋高手。现在已经有很多顶尖高手在模仿阿尔法狗的下法,但仅仅是模仿,也许个别的招法人类有一些理解,但显然还没有理解透彻。就像人类所说的定式,某一个定式有的人知道5种变化,有的人知道50种变化,但无论知道多少,并不妨碍使用。知道这样下是高招,但里面蕴含的千万变化还要通过千万盘实战去试着理解。
其四,阿尔法狗放出的50盘“左右互搏”将掀起一场围棋革命,人类对围棋的理解也许能从原来的7%有一个质的飞跃。
这是个很有意思的问题,但其实已经发生过了。
10月19日凌晨某国际期刊指出,谷歌新智能“阿尔法元”:在仅仅知道围棋规则的情况下,从0开始自学,不看人类棋谱,仅仅3天时间,通过自己和自己下棋的方式,进行了490万盘博弈。
然后,这个本名叫阿尔法元的机器与“前辈”---阿尔法狗进行了50盘较量,并以38:12的战绩获胜。而“前辈”阿尔法狗其实是在通过几个月时间,学习了大量人类棋谱之后,才战胜了人类围棋冠军。
也就是说,阿尔法元的完全是依靠自己的的算力,根据规则进行大量运算,并且学习自己左右互搏的经验从而取得了胜利。
不过,很多围棋高手在看过棋谱之后,发现自己记不住,也看不懂。而所有人类高手都学过棋谱,这说明人工智能完全按照自己的方法,通过算力想出来的方法,基本都没有人类棋谱的样子。
要知道,围棋高手超越普通人的地方,是他们可以把围棋看成一个一个具体的模块,而我们普通人眼里,则是一颗颗棋子。既然高手都看不懂阿尔法元的套路,说明它的下的棋谱,没有历史渊源可寻,不是可以被人类高手高手辨识的围棋模块。
这再一次从侧面说明,这个阿尔法元其实有着被阿尔法狗更强大的算力。以至于,它根本就不需要看棋谱学习。但有关专家表示,阿尔法元其实并没有产生人类思维。
阿尔法狗自己跟自己对决,这就是养蛊啊。最新的蛊王已经出来了,开发阿尔狗的英国“深度思维”(Deepmind)公司10月18日在《自然》(Nature)上发表论文,介绍了新一代的“阿尔法狗-零”(Alphago Zero)。
论文链接见:https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
那些艰深晦涩的学术名词咱们就不管了,反正他们把阿尔法狗分成了四个阶段:第一个是战胜樊麾的那个,叫“阿尔法狗-樊”(AlphaGo Fan);第二个是战胜李世石的那个,叫“阿尔法狗-李”(AlphaGo Lee);第三个是曾以Master名称出来将一众人类高手打得找不着北,并战胜了现世界排名第一的柯洁那个,叫“阿尔法狗-大师”(AlphaGo Master)。
现在最新一代的“阿尔法狗-零”,为什么叫“零”呢?因为研究人员强调它是从零开始学围棋,之前几代都还是要先输入一点人类摸索到的围棋知识,而“阿尔法狗-零”是完全从头开始,只让它认棋盘和棋子,然后就自己摸索去吧。
“深度思维”公司说,这个“阿尔法狗-零”就是靠自己和自己下,凭借强大的人工智能算法,很快就成长为阿尔狗中的“蛊王”。从它开始接触围棋,只用了3天,就可以战胜“阿尔狗-李”,并且战绩是100比0;而只过了40天,它就超越了“阿尔法狗-大师”。要知道在今年5月,“阿尔法狗-大师”就已经展示出了人类棋手完全不能企及的水平,它不仅赢了柯洁,多名有世界冠军头衔的顶尖棋手联手大战也中盘告负,遭遇完败。
所以两个阿尔狗彼此对决,它们谁胜谁负我不知道,在棋盘上反正是狗赢人负。不过在棋盘之外,如果狗链拴得好,阿尔狗今后也许能凭其智能帮人类解决一些问题,我们也可以自我安慰说赢在棋盘外。
这和两个人下围棋有什么区别吗?如果两个阿尔法狗是同一类型的,当然就和人与人之间的对弈一样,有胜有负。人类之所以无法和阿尔法狗抗衡,是因为其算法远超人类的思维,而且可以穷举后续步骤,迅速找出最优的下法。人脑虽然也有选择较优算法的功能,但效率很低且容易出错。阿尔法狗和人之间的对弈,就像猴子挑战老虎,但阿尔法之间的对弈,就是老虎和老虎的决斗了。
但如果阿尔法狗之间也有升级换代,其运算速度、算法差异恐怕就会影响其对弈的胜负,换句话说,科学和技术的进步,将放大微小的差异,使之对结果产生根本性的影响。比如先进武器对战争的影响,汽车发动机制造工艺对性能和使用寿命的影响,网络速度对股票交易的影响等等,往往会使最后的结果呈现一边倒的趋势。阿尔法狗之间的对决也是,最先建立起深度学习优势的狗恐怕会所向披靡。
会有一种怀疑人生的态度,作为人类再厉害的高手都是要休息大脑的,生理反应也会督促你要去睡觉,而阿尔法狗只要蓄能够可以不眠不休地进行复盘,不断学习,所以可以多赢阿尔法狗也是实力的见证。人类睡觉按每天六小时计算,就比阿尔法狗少了六小时的复盘学习时间,这是还没有算上其它时间的。但作为围棋本身来说,阿尔法狗这种反人类的设定出现本身也是对围棋竞技的一种伤害。
两个阿尔法狗下棋,比一个人自己拿黑白棋对下(智力较量),或者左右手互搏(体力较量)都没有悬念,即:如果不贴目的话,黑棋必胜。如果贴目的话,就很复杂了,后面会提到 。
二狗相争,不贴目执黑必胜的道理很简单:两个一模一样的智能机器,每一步棋都经过海量计算和智能学习比对,因此“不会犯错”是必须的,既然在“同级别智能状态”下不犯错,那么,先行获胜岂不是必然事件吗?
阿尔法狗落子如飞,是其应用了新算法中的“走子网络”,智能强度与载体的GPU性能息息相关。懂电脑的人都知道GPU是图形处理器,主要负责图形计算。而图形计算和普通的CPU数据计算不同,是一种图形匹配技术。这是阿尔法狗的一个技术关键。
阿尔法狗是进行围棋图形大数据检索,即调用自己的围棋图形的的数据,通过图形匹配,找出当前围棋图形下的近似解,并以胜率进行选择。这个“当前围棋图形”,应该是基于整个棋盘的。阿尔法狗的棋形数据库应该是经过长时间深度学习后融入其的神经网络的一部分,相当于人的记忆部分。其与人类不同的是,这个记忆非但不会磨灭,而且通过学习,对弈,还在不断自我增强,爆炸式增强,并且两狗都一样,同步增强。
这倒是扯出一个新问题,执黑先行的“便宜”到底有多大?这才是决定狗狗谁胜谁负的关键:既然技术无瑕疵,那么先行的优势和其应该付出的代价(贴目)就至关重要了。
不要以为这是废话,黄龙士,本因坊秀哉,木谷实,坂田荣男,赵治勋,李昌镐,李世乭,柯洁等等这些曾经各领风骚数百天数千天的棋坛霸主,甚至,在不贴目时代的棋圣吴清源,十二岁即崭露头角,翌年在国内无敌手,二十岁创围棋新布局法,在日期间尽败日本高手,被誉为古今第一人的吴清源,也没有做到不贴目执黑全胜。
历史上从不贴目(互先),然后贴三目五目半……六目半七目半的都存在过。现行的日本韩国贴六目半,中国以及台湾应氏杯等价于贴七目半。到底多少合适?恐怕没人能说清!
无论如何,从三十年代到迄今为止的发展趋势,贴目负担是越来越重。棋盘空着的时候一手棋(黑方先手的优势)的价值有多少?这在职业棋手中也众说纷纭。陈祖德评棋,认为一手棋有十目价值;而沈果孙七段则认为有贴目的二倍也即是十五目左右,当然还有各种各样更小更大的说法……有趣的是,贴目规则的原理是先手优势。但是贴目多少的指定更多的是大数据下的统计胜率,而非像理论家这样去想先手价值与次一手的价值差。
只有明确了这个贴目的最合理数字,才能真正知道一盘棋定胜负的“二狗相争”是谁能笑到最后,这个真的真的很关键。
“想一万年也不会想明白啊”……木谷实语。
我有一个问题,狗下的是我们认为的围棋吗?它知道这是围棋吗?围棋应该是哲学吧!不只是胜负!
加一点,它知道黑白的意思吗?为什么棋子是圆的而棋盘是方的。什么是道?如果只是胜负,我们和野兽有何区别?
围棋与其说计算得出最优解,还不如说是在众多选择中排除恶手。水平高的就能正确地排除更多的错误选择。谁的效率更好,谁的准确度越好,谁的胜率就越大。
面对一个局面,外行、爱好者和初入门新手可能只能排除一部门选择,留下十几种深入思考,而九段高手可能非常熟练地用更短的时间就留下两三种变化进而分析。这就能解释为什么刚入段的小朋友为什么三两步摆定式就能把十多年野棋经验的业余选手弄得手足无措。也能解释为什么大高手错算一步就导致大龙遭屠。
再进一步,我认为人工智能的优势有两个。一是计算深度。这个不用过多解释。在明确规则限制下,计算机可以快速演算模拟接近于穷尽的所有变化。再辅以选择策略,可以大幅提升效率和准确度。夸张地说,人工智能可以用普通人一生的精力去计算一步棋,人是做不到的。二是人工智能几乎不受情绪波动的干扰。胜不骄败不馁。不会因为一处得失而影响后续行棋。不会因为前一天和旁人争执而影响现在的对局。更不会因为性格而产生爱杀伐或者爱造势的棋路派别。简而言之就是务实到可怕。
最后就是总结,我感觉两个完全一样的程序在运算,结果必然是一样的。但毕竟有先后手的区别,所以每一步面对的实际上是不同的局面。因此,影响结局的会是规则。也就是让子数量会影响判断依据。现在的让子标准也是估算出来的,是否准确有待商榷。
引申一下,是否可以考虑让人工智能海量对战,调整让子标准。让胜负更加客观公正。
感谢邀请!对人机大战有所了解的人,都会惊叹阿尔法狗实在是厉害了。我当时就特意去查了一下阿尔法狗的工作原理,不得不感叹人工智能的强大。
阿尔法围棋的主要工作原理是“深度学习”,通过两个不同神经网络“大脑”合作来改进下棋。第一大脑落子选择器,主要负责观察棋局企图找到最佳的下一步;第二大脑棋局评估器,主要负责预测每一个棋手赢棋的可能,再给定棋子位置。
阿尔法狗通过分布式电脑的顶尖运行速度,短时间内可以产生百万甚至千万的自我对弈局数,且随着时间的增长,能够持续通过自我对弈提升自己的水平。
用两个阿尔法狗彼此对决,若两个版本完全一致,肯定是有输有赢,但输赢应该会非常接近。
若版本不一致,最新版本的阿尔法狗赢的机率大,这是它的工作原理决定的。
去年deepmind团队就在网上公布了两个alfago对战棋谱。50盘棋,胜负比例记不住了,但很多招法完全颠覆了人类的围棋下法,从alfago和人类的战绩看,应该是压倒性优势,只有李世石赢了一次,更可怕的是alfago还有自我学习能力,最新版本的alfazreo就是例子,甚至可让alfago两到三子。所以个人认为alfago的对战胜负不重要,重要的是人类棋手从它们的招法中学到东西,重新认识围棋理念,重塑大局观,激活脑洞,尝试更多的可能性。这就是人工智能带来的机遇和挑战。
10人回答
宠来也
2021-12-20 02:16:46这个问题就不用如果了,网上已经放出了50盘两狗互掐的棋局。直接说结果,黑棋胜了12盘,白棋胜了38盘。从这个统计数据可以看出很多问题。
其一,白棋胜率远远高于黑棋说明现在的贴目规则并不“科学”。现在的围棋规则是黑贴7目半,根据阿尔法狗的互掐测试说明黑棋贴目贴多了,理论上来讲,如果可以让两只狗在贴6目半或者5目半的前提下再各下50盘,黑白胜率基本相同的时候就是相对科学的贴目。
其二,中盘胜的盘数是19盘,另外31盘都下到了最后。这说明了围棋还是太深奥了。比如说一盘棋的终局手数是230手左右,双方水平越高,就越可能在越早的手数时知道最终的胜负(共识)。既然阿尔法狗的”互掐“大部分也需要在终局决出胜负,说明阿尔法狗还远远未到”围棋上帝“的水平,只能说咱们老祖宗发明的这个围棋太伟大了,太深奥了。现在才知道当年日本著名棋手藤泽秀行先生的那句“棋道一百,我只知七”并非谦言。
其三,从放出的50盘棋来看,棋局中已经有很多招数人类已经看不懂。这里说的人类指的是人类中的顶尖围棋高手。现在已经有很多顶尖高手在模仿阿尔法狗的下法,但仅仅是模仿,也许个别的招法人类有一些理解,但显然还没有理解透彻。就像人类所说的定式,某一个定式有的人知道5种变化,有的人知道50种变化,但无论知道多少,并不妨碍使用。知道这样下是高招,但里面蕴含的千万变化还要通过千万盘实战去试着理解。
其四,阿尔法狗放出的50盘“左右互搏”将掀起一场围棋革命,人类对围棋的理解也许能从原来的7%有一个质的飞跃。
宠来也
2021-12-20 02:16:46这是个很有意思的问题,但其实已经发生过了。
10月19日凌晨某国际期刊指出,谷歌新智能“阿尔法元”:在仅仅知道围棋规则的情况下,从0开始自学,不看人类棋谱,仅仅3天时间,通过自己和自己下棋的方式,进行了490万盘博弈。
然后,这个本名叫阿尔法元的机器与“前辈”---阿尔法狗进行了50盘较量,并以38:12的战绩获胜。而“前辈”阿尔法狗其实是在通过几个月时间,学习了大量人类棋谱之后,才战胜了人类围棋冠军。
也就是说,阿尔法元的完全是依靠自己的的算力,根据规则进行大量运算,并且学习自己左右互搏的经验从而取得了胜利。
不过,很多围棋高手在看过棋谱之后,发现自己记不住,也看不懂。而所有人类高手都学过棋谱,这说明人工智能完全按照自己的方法,通过算力想出来的方法,基本都没有人类棋谱的样子。
要知道,围棋高手超越普通人的地方,是他们可以把围棋看成一个一个具体的模块,而我们普通人眼里,则是一颗颗棋子。既然高手都看不懂阿尔法元的套路,说明它的下的棋谱,没有历史渊源可寻,不是可以被人类高手高手辨识的围棋模块。
这再一次从侧面说明,这个阿尔法元其实有着被阿尔法狗更强大的算力。以至于,它根本就不需要看棋谱学习。但有关专家表示,阿尔法元其实并没有产生人类思维。
宠来也
2021-12-20 02:16:46阿尔法狗自己跟自己对决,这就是养蛊啊。最新的蛊王已经出来了,开发阿尔狗的英国“深度思维”(Deepmind)公司10月18日在《自然》(Nature)上发表论文,介绍了新一代的“阿尔法狗-零”(Alphago Zero)。
论文链接见:https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
那些艰深晦涩的学术名词咱们就不管了,反正他们把阿尔法狗分成了四个阶段:第一个是战胜樊麾的那个,叫“阿尔法狗-樊”(AlphaGo Fan);第二个是战胜李世石的那个,叫“阿尔法狗-李”(AlphaGo Lee);第三个是曾以Master名称出来将一众人类高手打得找不着北,并战胜了现世界排名第一的柯洁那个,叫“阿尔法狗-大师”(AlphaGo Master)。
现在最新一代的“阿尔法狗-零”,为什么叫“零”呢?因为研究人员强调它是从零开始学围棋,之前几代都还是要先输入一点人类摸索到的围棋知识,而“阿尔法狗-零”是完全从头开始,只让它认棋盘和棋子,然后就自己摸索去吧。
“深度思维”公司说,这个“阿尔法狗-零”就是靠自己和自己下,凭借强大的人工智能算法,很快就成长为阿尔狗中的“蛊王”。从它开始接触围棋,只用了3天,就可以战胜“阿尔狗-李”,并且战绩是100比0;而只过了40天,它就超越了“阿尔法狗-大师”。要知道在今年5月,“阿尔法狗-大师”就已经展示出了人类棋手完全不能企及的水平,它不仅赢了柯洁,多名有世界冠军头衔的顶尖棋手联手大战也中盘告负,遭遇完败。
所以两个阿尔狗彼此对决,它们谁胜谁负我不知道,在棋盘上反正是狗赢人负。不过在棋盘之外,如果狗链拴得好,阿尔狗今后也许能凭其智能帮人类解决一些问题,我们也可以自我安慰说赢在棋盘外。
匿名网友
2021-12-20 02:16:46这和两个人下围棋有什么区别吗?如果两个阿尔法狗是同一类型的,当然就和人与人之间的对弈一样,有胜有负。人类之所以无法和阿尔法狗抗衡,是因为其算法远超人类的思维,而且可以穷举后续步骤,迅速找出最优的下法。人脑虽然也有选择较优算法的功能,但效率很低且容易出错。阿尔法狗和人之间的对弈,就像猴子挑战老虎,但阿尔法之间的对弈,就是老虎和老虎的决斗了。
但如果阿尔法狗之间也有升级换代,其运算速度、算法差异恐怕就会影响其对弈的胜负,换句话说,科学和技术的进步,将放大微小的差异,使之对结果产生根本性的影响。比如先进武器对战争的影响,汽车发动机制造工艺对性能和使用寿命的影响,网络速度对股票交易的影响等等,往往会使最后的结果呈现一边倒的趋势。阿尔法狗之间的对决也是,最先建立起深度学习优势的狗恐怕会所向披靡。
宠来也
2021-12-20 02:16:46会有一种怀疑人生的态度,作为人类再厉害的高手都是要休息大脑的,生理反应也会督促你要去睡觉,而阿尔法狗只要蓄能够可以不眠不休地进行复盘,不断学习,所以可以多赢阿尔法狗也是实力的见证。人类睡觉按每天六小时计算,就比阿尔法狗少了六小时的复盘学习时间,这是还没有算上其它时间的。但作为围棋本身来说,阿尔法狗这种反人类的设定出现本身也是对围棋竞技的一种伤害。
匿名网友
2021-12-20 02:16:46两个阿尔法狗下棋,比一个人自己拿黑白棋对下(智力较量),或者左右手互搏(体力较量)都没有悬念,即:如果不贴目的话,黑棋必胜。如果贴目的话,就很复杂了,后面会提到 。
二狗相争,不贴目执黑必胜的道理很简单:两个一模一样的智能机器,每一步棋都经过海量计算和智能学习比对,因此“不会犯错”是必须的,既然在“同级别智能状态”下不犯错,那么,先行获胜岂不是必然事件吗?
阿尔法狗落子如飞,是其应用了新算法中的“走子网络”,智能强度与载体的GPU性能息息相关。懂电脑的人都知道GPU是图形处理器,主要负责图形计算。而图形计算和普通的CPU数据计算不同,是一种图形匹配技术。这是阿尔法狗的一个技术关键。
阿尔法狗是进行围棋图形大数据检索,即调用自己的围棋图形的的数据,通过图形匹配,找出当前围棋图形下的近似解,并以胜率进行选择。这个“当前围棋图形”,应该是基于整个棋盘的。阿尔法狗的棋形数据库应该是经过长时间深度学习后融入其的神经网络的一部分,相当于人的记忆部分。其与人类不同的是,这个记忆非但不会磨灭,而且通过学习,对弈,还在不断自我增强,爆炸式增强,并且两狗都一样,同步增强。
这倒是扯出一个新问题,执黑先行的“便宜”到底有多大?这才是决定狗狗谁胜谁负的关键:既然技术无瑕疵,那么先行的优势和其应该付出的代价(贴目)就至关重要了。
不要以为这是废话,黄龙士,本因坊秀哉,木谷实,坂田荣男,赵治勋,李昌镐,李世乭,柯洁等等这些曾经各领风骚数百天数千天的棋坛霸主,甚至,在不贴目时代的棋圣吴清源,十二岁即崭露头角,翌年在国内无敌手,二十岁创围棋新布局法,在日期间尽败日本高手,被誉为古今第一人的吴清源,也没有做到不贴目执黑全胜。
历史上从不贴目(互先),然后贴三目五目半……六目半七目半的都存在过。现行的日本韩国贴六目半,中国以及台湾应氏杯等价于贴七目半。到底多少合适?恐怕没人能说清!
无论如何,从三十年代到迄今为止的发展趋势,贴目负担是越来越重。棋盘空着的时候一手棋(黑方先手的优势)的价值有多少?这在职业棋手中也众说纷纭。陈祖德评棋,认为一手棋有十目价值;而沈果孙七段则认为有贴目的二倍也即是十五目左右,当然还有各种各样更小更大的说法……有趣的是,贴目规则的原理是先手优势。但是贴目多少的指定更多的是大数据下的统计胜率,而非像理论家这样去想先手价值与次一手的价值差。
只有明确了这个贴目的最合理数字,才能真正知道一盘棋定胜负的“二狗相争”是谁能笑到最后,这个真的真的很关键。
“想一万年也不会想明白啊”……木谷实语。
宠来也
2021-12-20 02:16:46我有一个问题,狗下的是我们认为的围棋吗?它知道这是围棋吗?围棋应该是哲学吧!不只是胜负!
加一点,它知道黑白的意思吗?为什么棋子是圆的而棋盘是方的。什么是道?如果只是胜负,我们和野兽有何区别?
匿名网友
2021-12-20 02:16:46围棋与其说计算得出最优解,还不如说是在众多选择中排除恶手。水平高的就能正确地排除更多的错误选择。谁的效率更好,谁的准确度越好,谁的胜率就越大。
面对一个局面,外行、爱好者和初入门新手可能只能排除一部门选择,留下十几种深入思考,而九段高手可能非常熟练地用更短的时间就留下两三种变化进而分析。这就能解释为什么刚入段的小朋友为什么三两步摆定式就能把十多年野棋经验的业余选手弄得手足无措。也能解释为什么大高手错算一步就导致大龙遭屠。
再进一步,我认为人工智能的优势有两个。一是计算深度。这个不用过多解释。在明确规则限制下,计算机可以快速演算模拟接近于穷尽的所有变化。再辅以选择策略,可以大幅提升效率和准确度。夸张地说,人工智能可以用普通人一生的精力去计算一步棋,人是做不到的。二是人工智能几乎不受情绪波动的干扰。胜不骄败不馁。不会因为一处得失而影响后续行棋。不会因为前一天和旁人争执而影响现在的对局。更不会因为性格而产生爱杀伐或者爱造势的棋路派别。简而言之就是务实到可怕。
最后就是总结,我感觉两个完全一样的程序在运算,结果必然是一样的。但毕竟有先后手的区别,所以每一步面对的实际上是不同的局面。因此,影响结局的会是规则。也就是让子数量会影响判断依据。现在的让子标准也是估算出来的,是否准确有待商榷。
引申一下,是否可以考虑让人工智能海量对战,调整让子标准。让胜负更加客观公正。
匿名网友
2021-12-20 02:16:46感谢邀请!对人机大战有所了解的人,都会惊叹阿尔法狗实在是厉害了。我当时就特意去查了一下阿尔法狗的工作原理,不得不感叹人工智能的强大。
阿尔法围棋的主要工作原理是“深度学习”,通过两个不同神经网络“大脑”合作来改进下棋。第一大脑落子选择器,主要负责观察棋局企图找到最佳的下一步;第二大脑棋局评估器,主要负责预测每一个棋手赢棋的可能,再给定棋子位置。
阿尔法狗通过分布式电脑的顶尖运行速度,短时间内可以产生百万甚至千万的自我对弈局数,且随着时间的增长,能够持续通过自我对弈提升自己的水平。
用两个阿尔法狗彼此对决,若两个版本完全一致,肯定是有输有赢,但输赢应该会非常接近。
若版本不一致,最新版本的阿尔法狗赢的机率大,这是它的工作原理决定的。
宠来也
2021-12-20 02:16:46去年deepmind团队就在网上公布了两个alfago对战棋谱。50盘棋,胜负比例记不住了,但很多招法完全颠覆了人类的围棋下法,从alfago和人类的战绩看,应该是压倒性优势,只有李世石赢了一次,更可怕的是alfago还有自我学习能力,最新版本的alfazreo就是例子,甚至可让alfago两到三子。所以个人认为alfago的对战胜负不重要,重要的是人类棋手从它们的招法中学到东西,重新认识围棋理念,重塑大局观,激活脑洞,尝试更多的可能性。这就是人工智能带来的机遇和挑战。