繼IBM“深藍(lán)”在象棋對決中戰(zhàn)勝卡斯帕羅夫,Waston在危機(jī)邊緣戰(zhàn)勝Ken和Brad,Eugene挑戰(zhàn)圖靈的“TheImitation Game”后,人工智能在一個更加復(fù)雜的領(lǐng)域—圍棋中再次超過了人類的水平,AlphaGo以4:1的比分戰(zhàn)勝了圍棋李世乭,其升級版Master更是在弈城網(wǎng)上取得60:0:1的不敗戰(zhàn)績。同樣是在對弈比賽中戰(zhàn)勝選手,“深藍(lán)”到Master的發(fā)展充分體現(xiàn)出了人類科技進(jìn)步在計(jì)算和計(jì)算資源上的長足進(jìn)步。如果說“深藍(lán)”是憑借其運(yùn)算速度通過遍歷戰(zhàn)勝了人類,那么Master是在此基礎(chǔ)上通過的搜尋算法,決策支持和計(jì)算架構(gòu)遍歷了當(dāng)時覺得不可能實(shí)現(xiàn)的所有可能。Master所用到的Deep Reinforcement Learning結(jié)合了當(dāng)今AI領(lǐng)域研究的兩大前沿Deep Learning(DL)和Reinforcement Learning(RL),創(chuàng)造性的使用DL的,通過棋局的圖片評估落子的優(yōu)先級,再結(jié)合RL,通過自我“對弈”的更新深度元網(wǎng)絡(luò)的參數(shù),帶領(lǐng)人類站在了“智能”的門口。AlphaGo重要的成就并不是采用了性能多么的電腦,而是次讓程序可以近似人類的去感知、學(xué)習(xí)、思考和決策。
倍德立(廈門)科技有限公司【歡】【迎】【咨】【詢】