亚洲日韩久久|国偷自产一区二区三区蜜臀国|国产一区二区日韩|99热这里只亚洲无码,无码

浙江大學(xué)人工智能專家:麻將AI和阿爾法狗類似,有助于解決實際問題

日期:2020-04-13 來源:錢江晚報閱讀:551
核心提示:浙江大學(xué)人工智能專家:麻將AI和阿爾法狗類似,有助于解決實際問題
   從最早的AI在國際象棋中戰(zhàn)勝人類開始,AI先后攻克了中國象棋、德州撲克、圍棋、DOTA、星際爭霸等多種游戲,為什么AI研究者都喜歡挑戰(zhàn)游戲領(lǐng)域呢?
 
  在去年的世界人工智能大會上,時任微軟全球副總裁沈向洋表示,游戲一直是人工智能研究的最佳試驗田,訓(xùn)練游戲AI的過程可以不斷提升人工智能的算法和人工智能處理復(fù)雜問題的能力。在現(xiàn)實世界中,金融市場預(yù)測、物流優(yōu)化等很多問題與麻將游戲有著相同的特點,包括復(fù)雜的操作/獎勵規(guī)則、信息的不完全性等等。
  微軟全球副總裁沈向洋
 
  那么這次戰(zhàn)勝人類的麻將AI的出現(xiàn)有什么意義呢?記者采訪了浙江大學(xué)人工智能研究所所長吳飛。他告訴記者,很多AI的研發(fā)都是針對某個領(lǐng)域或某個具體任務(wù)進行的研究,這些AI的誕生的目的當(dāng)然不僅僅在某個游戲勝過人類這么簡單,都是為了應(yīng)用到我們實際生活中去。
 
  吳飛告訴記者:“微軟這款麻將AI所采取的策略其實和圍棋當(dāng)中的Alphago是類似的,框架還是基于強化學(xué)習(xí)、深度學(xué)習(xí)和蒙特卡洛樹搜索。只不過它是針對麻將這個具體問題進行優(yōu)化,如針對麻將中不同出牌的策略專門進行學(xué)習(xí)。圍棋的難主要體現(xiàn)在狀態(tài)空間非常復(fù)雜,它是19×19 的棋盤上每一個位置都有“黑、白、無”三種狀態(tài),這樣的復(fù)雜度差不多是10的172次方。在完美信息下只要算力足夠,就能通過搜索采樣的方式找到最優(yōu)的策略,AlphaGo就是利用蒙特卡洛樹搜索和深度強化學(xué)習(xí),成功解決了這一難題。而麻將這種屬于不完全信息,有個序貫決策問題,它雖然所需要探索的空間相比圍棋要小,但是序貫決策問題難在你的每一步對后續(xù)產(chǎn)生的結(jié)果都是未知的。”
  浙江大學(xué)人工智能研究所所長吳飛
 
  在吳飛看來,不論是圍棋還是麻將,現(xiàn)有的規(guī)則和標準都是可以用機器語言描述出來的,屬于“大數(shù)據(jù)小任務(wù)”,因此只要有足夠多的數(shù)據(jù)的支撐,加上在該特定領(lǐng)域內(nèi)強化學(xué)習(xí)和深度學(xué)習(xí),AI戰(zhàn)勝人類在大部分棋牌類游戲中都是可以實現(xiàn)的,但這不代表現(xiàn)在的AI就比人類厲害了,因為人類行為是“小數(shù)據(jù)大任務(wù)”,不只是單一問題的集合,實際的應(yīng)用場景比游戲要復(fù)雜的多。
 
  “比如現(xiàn)在大家關(guān)注度比較高的自動駕駛、城市大腦,這些場景更加復(fù)雜,沒有足夠多的數(shù)據(jù),也沒有足夠準確的機器語言去描述,因此目前的人工智能在實際使用中還很局限。不過這類AI的出現(xiàn)對我們解決序貫決策問題還是很有幫助的,比如對經(jīng)濟活動的調(diào)整的預(yù)測和分析,來幫助經(jīng)營者作出更好的決策;在交通、物流領(lǐng)域進行效率優(yōu)化,降低成本提高收益等。”
打賞
聯(lián)系客服 投訴反饋  頂部