헬조선

반헬센2016.03.06 07:18

(음모론이 될지도 몰겠지만은..여튼)
.
.
▲ 알파고의 딥러닝 알고리즘은 2016년 1월 28일자의 네이처(Nature)지에 논문으로 발표됐다. 알파고가 사용한 것은 바둑판의 위치를 판단하는 가치 네트워크(Value networks)와 어디를 두어야 할지를 선택하는 폴리쉬 네트워크(Policy networks)로 구성된 딥뉴럴네트워크(DNN, Deep Neural Networks)이다. 이 DNN을 학습시키는 방법에는 사람에 의한 지도학습(Supervised learning)과 데이터 기반의 비지도학습(Unsupervised learning)이 있다.

그런데 이번에 알파고의 DNN은 전문 바둑기사들(human expert games)에 의한 지도학습과 스스로 바둑 게임(self-play)을 하면서 배우는 강화 학습(reinforcement learning)이라는 새로운 콤비(a novel combination)라는 방식으로 학습했다.

 

▲ 결국 사람에 의한 지도학습의 폴리쉬 네트워크(SL. policy network)로 먼저 학습을 하고 그 이후에 스스로 하는 강화학습 폴리쉬 네트워크(RL. policy network)를 통해 폴리쉬 네트워크(Policy networks)와 가치 네트워크(Value networks)를 구성한 것이다.

그 결과 이 DNN은 스스로 바둑 게임을 하면서 수천 건의 게임을 시뮬레이션하는 몬테칼로 나무 서치 프로그램(Monte Carlo tree search programs)의 수준에 올랐다.

또한 몬테칼로 시뮬레이션과 가치 네트워크와 폴리쉬 네트워크를 합쳐 새로운 서치 알고리즘(algorithm)도 개발했다. 이 새로운 서치 알고리즘을 이용해, 알파고의 DNN은 다른 유사한 인공바둑프로램들을 대상으로 게임한 결과 승률이 99.8%에 달했으며, 결국 유럽 챔피언인 판후이(Fan Hui) 2단을 5:0으로 이길 수 있었다.

 

▲ 데미스 하사비스(Demis Hassabis) CEO는 "규칙은 간단할지 몰라도 사실 바둑은 굉장히 복잡한 게임이다. 돌을 놓는 위치에 있어 경우의 수가 우주에 있는 원자의 수보다 많으며, 체스와 비교할 때 경우의 수가 *10의 100제곱 이상 많다"라며, “이러한 복잡성은 컴퓨터가 바둑을 두는 것을 아주 어렵게 만들었으며, 따라서 바둑을 인공지능을 연구하는 사람들에게 아주 매력적인 도전과제로 만들었다”고 말했다.

 

[김들풀 기자  [email protected]] 2016년 2월 6일


==================================================================================
*10의 100제곱 = 10100 = 1'구골(Googol)' 이다.

※ 검색 Site 구글(Google)은 10100을 뜻하는 구골(Googol)을 일부러 변경 표기한 것에서 유래되었다.(1998년에 'BackRub'이라는 이름으로 설립되었음).

매우 큰 유한수를 의미하는 이 단어는 '그 만큼 많은 정보를 모아서 체계화하여, 엄청난 규모의 검색엔진을 만들겠다'는 설립자들의 목표와 맞아 떨어졌으나-정확히는 숀이 구골플렉스(10^{googol})를, 래리가 구골을 제안했지만,- 당시 이미 '구골(Googol)'이라는 사이트가 존재하여 구글(Google)이 되었다. '왓박스'(whatbox)라는 이름도 고려되었으나 포르노 사이트인 웻박스(watbox)와 유사해 제외되었다. 비공식 표어이자 모토는 "Don't be evil. (사악해지지 말자.)"이다.

본사 사옥 이름도 구골플렉스(Googolplex)에서 따온 구글플렉스(Googleplex)이다.

==================================================================================

한데, 데미스는 체스선수로 활동할 정도로 체스에 재능있었고 잘한다. 하지만, 그에 비해 바둑은 아마 1단 정도밖에 안된다.

위의 기사 마지막 문단에서처럼 바둑은 체스와 비교했을 때 경우의 수가 10100 , 즉 1구골(Googol)이상 더 많다.

체스 전공인 데미스는 바둑 전공인 이세돌에 비해 월등히 게임지능측면에서 비교가 안된다는 것이다.

구골을 구글로 대치하면, 체스와 바둑간 경우의 수 차이는 약 1구글정도 된다는 것이다.

즉, 바둑이라는 미명아래 이세돌과 인공지능 프로그램을 게임에 접목시킨 데미스간의 대결, 아니 이것은 결국 딥마인드社 또는 나아가 구글社와의 대결이기도 하다.

데미스는 이 경기가 상당한 중의적 의미를 가지고 있으며 -아마 그도 그렇단 것을 알기에-, 그 경기에서 이기려고 알파고 진화에 열정을 낼 것이다.

지금까지 보드게임에서 컴퓨터가 체스마저도 최고 수준의 인간을 이겼는데, 데미스의 아바타인격인 인공지능 알파고가 가장 어려운 마지막 보드게임이란 바둑에서 최고 수준의 기사인 이세돌을 1구골이상 차이가 나는 경우의 수 처리를 넘어서 이기게 된다면, 궁극적으로 데미스는 물론이거니와 딥마인드와 구글社 또한 업그레이드 되는 격이라 할 수 있다.

이것은 결국 다시 알파고라는 인공지능 컴퓨터 프로그램을 가장 돋보이게 하는 것으로, 결국 인간들이 이런 기계에게 지게 될 거란 것을 암시해주려고 하는 것이기도 하다.

만일, 알파고가 이 경기에서 완패하거나 지게 된다면, 전 세계 최고의 프로기사들을 모두 이길 수 있게끔 다시 더욱 더 업그레이드한 인공지능 프로그램을 만들어서, 아마도 -그들이 좋아할 숫자상-올해 11월쯤안에 재경기를 하지 않을까 한다. 알파고승~으로

사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 용량 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )