中國科學報

媒體認證
2017年6月12日 13:29

#來了!科報君# 【當機器人有了好奇心[並不簡單]】在一場關於人工智慧的轉折中,計算機科學家對機器進行編程,使其變得具有好奇心——能自己探索周圍環境並且為了學習而學習。目前在位於英國倫敦的谷歌深度思維公司就職的計算機科學家Todd Heste和德克薩斯大學計算機科學家Peter Stone開發了一種名為TEXPLORE-VENIR、依賴於強化學習技術的新演算法。在強化學習中,程序會嘗試一些事情。如果一個舉動使其離某個最終目標(比如迷宮的盡頭)更進一步,它會收到一個小小的獎勵並且更有可能在將來再次嘗試這一操作。深度思維公司利用強化學習,使程序通過隨機試驗掌握雅達利遊戲和圍棋遊戲的玩法。不過,和其他具有好奇心的演算法一樣,TEXPLORE-VENIR同樣設置了一個內在目標。如果它理解了一些新事物,就會獎勵自己,即便這些知識並未使其離最終目標更進一步。http://t.cn/RS3xHc9