InternetWalkers!【AI/機械学習】グーグル、自ら学ぶ人工知能「Deep Q-network」開発 ゲーム繰り返し遊んで攻略


http://anago.2ch.net/test/read.cgi/scienceplus/1424914735/より引用

1: Mogtan ★@ ©2ch.net 2015/02/26(木) 10:38:55.23 ID:???

掲載日:2015年2月26日
http://www.nikkei.com/article/DGXLZO83685140W5A220C1EA2000/

米グーグルは「ブロック崩し」などの電子ゲームの攻略法を遊びながら自ら編み出し、人間以上の高得点を出せる人工知能(AI)を開発した。やり方を教わらなくても自分で学習するAIに道を開く研究成果で、将来は人間にしかできないと思われていた複雑な仕事をこなせるようになる可能性もある。26日付の英科学誌ネイチャー(電子版)で発表する。

開発したのは、人間の脳の神経回路をまねた学習機能を持つAI「DQN」。スペースインベーダーやブロック崩しなど懐かしのゲーム49種類をAIに与えた。ゲームの事前知識を教えなくても、人間のように繰り返し遊ぶことでやり方を学び、高得点を取る秘訣を編み出す。

ブロック崩しを約100回遊ばせた段階では、AIは飛んでくるボールをうまく打ち返せないなど苦戦していたが、400回遊ぶと取りこぼしはほぼなくなった。600回を超えると、端のブロックに攻撃を集中して穴を開け、ブロックの裏側にもボールを送り込んで崩す攻略法を発見し、高得点を出せるようになった。

ゲームの試験開発に携わるプロの人間とAIが得点を競ったところ、ゲーム49種類のうち29種類で、人間並みかそれ以上の得点を得られたという。ブロック崩しでは人間の13倍の得点を取り、最も上手になった「ピンボール」では25倍に達した。

AIが取り入れたのは、コンピューターが学習によって判断基準をつくり出し自ら賢くなる「深層学習(ディープラーニング)」と呼ぶ最先端の研究分野。人間が教えなくても大量のデータから精度を高めることができ、人間を上回る能力の獲得も可能だ。将来はロボットや自動運転車などの次世代技術に幅広く応用が見込める。

AI開発はグーグルのほかフェイスブック、ヤフー、IBMなど米IT(情報技術)大手が相次いで研究拠点を設けるなど先行している。日本は1980年代に国家プロジェクトでAI開発を先導したが、応用が広がらず頓挫。近年はプロ棋士に勝つ将棋ソフトの開発などが研究者の間で進むが、日本企業は出遅れが目立つ。

<参照>
Deep Q-network: New artificial intelligence can learn how to play vintage video games from scratch – BelfastTelegraph.co.uk
http://www.belfasttelegraph.co.uk/technology/deep-qnetwork-new-artificial-intelligence-can-learn-how-to-play-vintage-video-games-from-scratch-31022741.html

Nature : Human-level control through deep reinforcement learning – YouTube

Human-level control through deep reinforcement learning : Nature : Nature Publishing Group
http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html

<関連>
Playing Atari with Deep Reinforcement Learning
http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

http://anago.2ch.net/test/read.cgi/scienceplus/1424914735/より引用

5: 名無しのひみつ@ 2015/02/26(木) 10:47:03.49 ID:okZMZfKI
AI水準以下の人間はAIの奴隷として生きる道しか無くなる訳か

 

6: 名無しのひみつ@ 2015/02/26(木) 10:48:13.79 ID:XUh3yI6w
俺がりっぱなマルクス主義革命家に育ててやるよ。

 

7: 名無しのひみつ@ 2015/02/26(木) 10:52:26.12 ID:5pXlIh8f

DQN

wwww

 

11: 名無しのひみつ@ 2015/02/26(木) 11:00:21.90 ID:wmIzld0h

そのうちシューティングゲームやFPSゲームやらせて
軍事用に転用されてドローン爆撃機・二足歩行ロボット兵に搭載されるんだろうな

おいおいターミネーターの世界観にどんどん近づいてるぞ

 

13: 名無しのひみつ@ 2015/02/26(木) 11:03:06.50 ID:whRVu+6e
>>11
やっぱDQNに殺されるのか

 

12: 名無しのひみつ@ 2015/02/26(木) 11:02:47.00 ID:5fim9L7O
よりによってDQNとはねえ。

 

14: 名無しのひみつ@ 2015/02/26(木) 11:03:55.25 ID:OMdXDHZn
ドラえもんの中身もブロック崩し上手いものな

 

142: 名無しのひみつ@ 2015/03/01(日) 05:51:16.48 ID:dMkULTY6
>>14
先代のドラえもんじゃねえか。

 

18: 名無しのひみつ@ 2015/02/26(木) 11:07:54.22 ID:V9TGFOok
>>1
DQNが世界中に増えすぎてしまうと困るかも。知ってて名付けただろw

 

24: 名無しのひみつ@ 2015/02/26(木) 11:27:44.24 ID:El7f2OB4
そりゃAIは飽きることを知らんからいくらでもうまくなるだろうな
AIが「何このクソゲ飽きたわー」とか言い出したら大したもんだ

 

30: 名無しのひみつ@ 2015/02/26(木) 12:31:28.80 ID:mqMbM3op
すべて機械が判断するようになると
ミスプライスが減少するので面白くない世の中になる。

 

32: 名無しのひみつ@ 2015/02/26(木) 12:38:08.40 ID:G8Mrtzh3
今は人間の学習法を真似ているが、そのうち新しい学習法を編み出せるようになるのかもしれないな

 

33: 名無しのひみつ@ 2015/02/26(木) 12:43:22.87 ID:Vi0V6nvF

> AIが取り入れたのは、コンピューターが学習によって判断基準をつくり出し自ら賢くなる「深層学習
>(ディープラーニング)」と呼ぶ最先端の研究分野。

いや、判断基準はゲームのスコアとして人間から与えられてんだけど?

>Deep Q-network: New artificial intelligence can learn how to play vintage video games from scratch – BelfastTelegraph.co.uk
>http://www.belfasttelegraph.co.uk/technology/deep-qnetwork-new-artificial-intelligence-can-learn-how-to-play-vintage-video-games-from-scratch-31022741.html

The intelligent machine learns by itself from scratch using a trial-and-error approach that is reinforced by the reward of a score in the game.

と書いてあるとおり、ニューラルネットワークでできるレベルのなんちゃって人工知能

なーにが、deepだ

D-wavといい、googleも、最近は奇をてらってちょっと考えたら箸にも棒にもかからんもんに
飛びつくしか能がなくなってるから、もう終わりかな

 

36: 名無しのひみつ@ 2015/02/26(木) 12:53:27.30 ID:/nmiYULE

>>33
電話が発明された当時、どっかのお偉いさんは「直接会って話せばいいじゃん、馬鹿じゃねーの」って言ったらしいね。

今は人間の知能の方が上かも知れんが、AIの性能はどんどん上がっていくのに対し、人間の性能はあまり上がらない。
そのことをよくよく考えた方がいいと思うがね。

 

38: 名無しのひみつ@ 2015/02/26(木) 13:02:13.78 ID:t75phPjx
人工知能が経営する会社に人間が雇われるのか

 

39: 名無しのひみつ@ 2015/02/26(木) 13:03:51.80 ID:t75phPjx
あっ、DQN上司の下で働くよりも快適かもしれないw

 

40: 名無しのひみつ@ 2015/02/26(木) 13:04:17.71 ID:t99dRyWe

>全人類の頭脳を圧倒的に上回るスパコン

これが完成したら科学の進歩はもう誰にも予想できない。
スパコンが発明発見し、自分より数段賢いスパコンを開発し、
新しいスパコンが更に賢いスパコンを開発し。。。。
もう人間に理解できる領域を超えてくる。
ゴッドブレインだね。

それに対してスティーブンホーキングとかは相当な危機感を持ってる。
人間はスパコンに滅ぼされるんじゃないかと。
ゴキブリ同然だからな。

 

43: 名無しのひみつ@ 2015/02/26(木) 13:15:56.95 ID:t99dRyWe

ただ人間の意識ってのは脳だけが作ってるわけじゃなく
五感はもちろんだが、その他の体細胞も人間の創造力に
大きな影響を与えてる可能性がある。

能をシミュレートし異常発達させたような次世代スパコンが、
本当に人間のような意識を持つのか、疑問視してる人も多い。

 

64: 名無しのひみつ@ 2015/02/26(木) 15:44:42.83 ID:7cY3ACQO
>>43
腸でそういう話題があったね。

 

44: 名無しのひみつ@ 2015/02/26(木) 13:16:42.21 ID:xVI36/PU

>将来は人間にしかできないと思われていた複雑な仕事をこなせるようになる可能性もある。

1万年先の将来みたいな感じだから、いまのおまいらは心配無用

 

45: 名無しのひみつ@ 2015/02/26(木) 13:19:55.23 ID:t99dRyWe

>>44

そんな先じゃないよ。
アメリカやEUは、脳細胞をシミュレートしたスパコンを作れば
意識は自然に生まれると信じてる。それを裏付ける理論はないが
科学者の確信みたいなもんだ。

もしそれが当たった場合、2045年頃には全人類の頭脳を上回る
スパコンが完成し、遅くとも2100年までには、人類の頭脳の
一兆倍の一兆倍という、超絶的に賢いスパコンが誕生する。

 

46: 名無しのひみつ@ 2015/02/26(木) 13:23:00.48 ID:t99dRyWe

>>44

今現在でも、この記事とか、更にはグーグルはスパコンに
youtubeの猫動画を大量に見せて、「猫とは何か」
スパコンに学習させることに成功してる。

ちなみに、そのスパコンに猫認識に関するプログラムやデーターは一切ない。
あくまでスパコンが自力で発見したってこと。

 

49: 名無しのひみつ@ 2015/02/26(木) 13:29:22.95 ID:t99dRyWe

中国も人工知能は研究してるんだよね。
次世代のITを制するのは人工知能なのは明白だからな。
アメリカとEUは言うまでもなく必死。

日本の政治家は一体何やってるの?

 

55: 名無しのひみつ@ 2015/02/26(木) 13:53:03.71 ID:1fX7d1TT
AIは疲れないからな
寝ないし

 

56: 名無しのひみつ@ 2015/02/26(木) 14:15:02.50 ID:Swj9guve
>>55
集中力もとぎれないしな。
休憩なしに学習する。
そのうちホワイトカラーとかの人工知能がやりだしてその職も随分なくなるかもな。
とはいってもまだまだ先だろうが。

 

60: 名無しのひみつ@ 2015/02/26(木) 14:50:25.87 ID:MoQ+E5oO
絶対にいうことを聞かなくなる

 

62: 名無しのひみつ@ 2015/02/26(木) 15:16:23.58 ID:CRRa3ZxM
日本は基礎研究に金ださねえからなあ
こういうの、得意そうなのにもったいない

 

65: 名無しのひみつ@ 2015/02/26(木) 15:47:04.33 ID:T/6EFOdK
開発者さん

 

83: 名無しのひみつ@ 2015/02/26(木) 23:56:44.78 ID:i+MPIc33
>>65
やっぱコイツだと思ったよ

 

124: 名無しのひみつ@ 2015/02/27(金) 19:04:21.89 ID:sFIdryRb
>>65
それスカイネット

 

84: 名無しのひみつ@ 2015/02/27(金) 00:25:32.01 ID:AHJzaUlE

人口知能がどれだけ過去の情報を検索しても人間の一瞬の閃きには勝てない。

序でに言うと、人間の性能もかなりの勢いで向上している。

 

87: 名無しのひみつ@ 2015/02/27(金) 01:14:31.24 ID:AVqBfubq
>>84
このところ考えてるのは
「知」とは線形過程なのか?
という問題
ある事柄を理解するという現象は
要素に分割できるものではなく
それこそ瞬時に起きるのではないかと思われてならない
もちろん複雑な問題を理解するには複数の段階を経る必要があるけど
その各段階における「理解」は
非線形かつ不可逆な現象なんではないかなと

 

97: 名無しのひみつ@ 2015/02/27(金) 08:18:59.93 ID:AVqBfubq
ある意味もうなってる
何十億トランジスタにもなるCPUの設計とかマザーボードの配線最適化とか
コンピュータがなけりゃ不可能だしな
もちろんそれをAIとは言わんが
人間の知力だけでは不可能なことが行われているのは確か

 

116: 名無しのひみつ@ 2015/02/27(金) 16:19:11.39 ID:VUas9NsN
またサラコナーがぶっ壊すモノが増えた

 

117: 名無しのひみつ@ 2015/02/27(金) 16:43:52.07 ID:0IUE8EIf
正解のあるものは機械が強いだろう。

 

122: 名無しのひみつ@ 2015/02/27(金) 18:03:02.50 ID:W74NSgQj
>>117
実は正解がないとされるものにも
そこそこ正解パターンが有るっぽい

 

118: 名無しのひみつ@ 2015/02/27(金) 17:04:58.75 ID:97Vl7PTl
シンギュラリティはDQNが起こすのか

 

133: 名無しのひみつ@ 2015/02/28(土) 21:47:40.09 ID:9Lh1C8G8

適当にネットで拾ってみた

ゲーム攻略で人間を超えた人工知能、その名は「DQN」
http://wired.jp/2015/02/28/google-deepmind-atari/

グーグルの人工知能「DQN」、ピンボールは得意でもパックマンは苦手
http://www.gizmodo.jp/2015/02/dqn_google_150227.html

Google Deepmind、人工知能『DQN』を開発。レトロゲームを自力で学習、人間に勝利
http://www.excite.co.jp/News/it_g/20150227/Engadget_google-deepmind-dqn.html

CaffeでDeep Q-Networkを実装して深層強化学習してみた
http://d.hatena.ne.jp/muupan/20141021/1413850461


新着記事 件
No items.

コメントを残す

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>