當前位置:首頁(yè) > 活動(dòng) > 重要會(huì )議 > 雙周財經(jīng)論壇 > 文章詳情

徐君:從Alpha Go 到智能搜索:淺談人工智能的任務(wù)和方法

發(fā)表于

   

  2018年5月22日,中國社科院財經(jīng)戰略研究院2018年度第8期“雙周財經(jīng)論壇”在財經(jīng)院九層第二會(huì )議室召開(kāi)。本期論壇特邀中國科學(xué)院計算技術(shù)研究所徐君研究員作題為“從Alpha Go 到智能搜索:淺談人工智能的任務(wù)和方法”的學(xué)術(shù)報告。財經(jīng)院副院長(cháng)夏杰長(cháng)研究員主持了本次學(xué)術(shù)報告會(huì )。

  徐君研究員主要從人工智能任務(wù)和方法上介紹Alpha Go的技術(shù)創(chuàng )新以及其對當前智能搜索技術(shù)發(fā)展的重要貢獻。整個(gè)學(xué)術(shù)報告包括“人工智能”、“Alpha Go 和Alpha Zero”、“人工智能在智能搜索中的應用”和“結語(yǔ)”四個(gè)部分。

  首先,徐君研究員對“人工智能”的概念進(jìn)行了闡釋?zhuān)J為盡管人工智能成為最熱門(mén)的領(lǐng)域,其科學(xué)概念有諸多討論但到底什么是人工智能并沒(méi)有形成共識,很大原因在于人類(lèi)對自身智能的理解非常有限,對構成人的智能的必要元素也了解有限。在這種情況下,當前對人工智能判斷的主要方法之一是依據外在表現判定是否具有“智能”,即“圖靈測試”。圖靈測試避免了從哲學(xué)意義上對機器是否能夠擁有智能上的爭論,但是也存在很多不足。

  在對人工智能概念和圖靈測試進(jìn)行分析后,徐君研究員介紹了人類(lèi)的棋類(lèi)游戲成為人工智能測試任務(wù)的發(fā)展歷程。IBM的超級電腦深藍戰勝?lài)H象棋世界冠軍卡斯帕羅夫是Alpha Go之前,人工智能在棋類(lèi)游戲測試上的成功案例,計算機通過(guò)近似窮舉的方式戰勝人類(lèi)代表了高性能計算機技術(shù)取得了突破性進(jìn)展,但窮舉搜索并不意味著(zhù)“深藍”實(shí)現了“智能”。圍棋是人工智能棋類(lèi)測試任務(wù)中最為復雜的棋類(lèi)游戲,由于圍棋的落子可能性很多而且棋局很長(cháng),也就是搜索的寬度很寬,深度很深,現有計算機技術(shù)無(wú)法進(jìn)行窮舉搜索。Deep Mind研發(fā)的Alpha Go、Alpha Zero能夠戰勝人類(lèi)頂尖棋手,一方面是有其強大的計算機系統支撐,但主要的技術(shù)突破在于搜索算法的突破,實(shí)現了機器的深度強化學(xué)習和自學(xué)習。

  徐君研究員認為Alpha Go的深度學(xué)習實(shí)現了以過(guò)程為中心的傳統精確算法向以?xún)?yōu)化為中心的模糊算法轉變。圍棋是一種完全信息下交替選擇的馬爾科夫博弈游戲(Fully observed state alternating Markov game)。Alpha Go通過(guò)智能體-環(huán)境交互建模決策序列進(jìn)行深度強化學(xué)習,其馬爾科夫決策過(guò)程(MDP)包括了狀態(tài),動(dòng)作,短期獎勵,策略和長(cháng)期回報五個(gè)過(guò)程;通過(guò)深度強化學(xué)習,Alpha Go建立了其策略網(wǎng)絡(luò )(估算每一個(gè)落子位置的概率)和價(jià)值網(wǎng)絡(luò )(估算當前棋局的勝率)。Alpha Go以及完全通過(guò)自學(xué)習形成的Alpha Zero的出現和取得的成功代表了計算機在深度強化學(xué)習能力上的巨大突破,計算機可以在極少的專(zhuān)業(yè)領(lǐng)域知識,無(wú)人類(lèi)積累的數據和指引下完成學(xué)習任務(wù),并可以在能力上超越人類(lèi)。但徐君研究員并不認為Alpha Go的人工智能擺脫了對人類(lèi)知識的依賴(lài)。

  最后,徐君研究員分析了Alpha Go的技術(shù)突破對智能搜索發(fā)展的貢獻。他認為利用深度強化學(xué)習技術(shù)建模的智能搜索技術(shù)可以更好更快地為用戶(hù)提供所需要的搜索結果,大大提高了用戶(hù)的便利度。當前領(lǐng)先的互聯(lián)網(wǎng)公司都在利用計算機進(jìn)行深度強化學(xué)習,提高信息流處理效率,為用戶(hù)提供更好的使用體驗。

  30余名所內外研究人員、在校研究生參加了此次“雙周財經(jīng)論壇”。會(huì )后,多位與會(huì )研究人員與徐君研究員進(jìn)行了交流。與會(huì )者對本次學(xué)術(shù)報告給予了高度評價(jià),認為獲益良多。

  (執筆:趙京橋)