※논어(論語)에는 “아무것도 하지 않는 것보다는 바둑을 두는 것이 낫다(以奕爲爲之猶賢乎己)”는 공자의 가르침이 나온다.
바둑이 춘추전국시대전에 이미 보급됐음을 유추할 수 있는 구절이기도 하다.
가로·세로 각각 19줄의 좁은 반상이지만 그 위에서 펼쳐지는 수싸움은 작은 우주처럼 변화무쌍하다.
바둑이 흔히 인생에 비유되는 이유이고, 그만큼 공략이 어렵다는 의미이기도 하다.
현대 과학(컴퓨터)이 바둑을 완벽하게 정복하지 못한 이유는 뜻밖에도 ‘바둑의 단순함’에 있다.
모든 돌들이 특정한 규칙에 따라 움직이거나 정해진 역할을 갖지 않기 때문에 예측 불가능한 움직임을 지니고 있다.
이 때문에 바둑 한판을 마치는 경우의 수는 산술적으로 ‘361×(361-1)×(361-2)×…(361-360)’으로 계산할 수 있다.
두 대국자 모두 같은 반상을 들여다 보고 있기 때문에 양측에게 공개되는 정보가 같지만, 영원히 지속되는 게임은 아니다.
돌을 순차적으로 놓다 보면 언젠가 반드시 끝난다. (패싸움이 있지만..)
※‘파운데이션’ 등의 저서로 유명한 공상과학(SF) 작가이자 과학자였던 고(故) 아이작 아시모프가 1942년 ‘로봇 3원칙’으로 불리는 윤리 강령을 발표했을 때만 해도 대부분의 사람들은 그저 공상과학일뿐, 실제와는 거리가 멀것처럼 농담으로 받아들였다.
기계학습(머신러닝)의 발달로 기계는 이미 모방을 넘어 스스로 창조적인 학습을 하는 경지에 이르렀다.
기계가 얼마나 인간과 비슷하게 대화하는지 가려내는 ‘튜링 테스트’를 실시했을 때 컴퓨터를 사람으로 믿는 비율은 2008년에 이미 25%를 넘어섰다.
※ 알파고(AlphaGo) : Computer Go Bot의 계통 - 슈퍼컴으로 머신러닝(Machine Learning)&딥러닝(Deep Learning)을 혼합하여 이용.
구글 딥마인드에서 개발한 인공지능 바둑 프로그램. 구글이 바둑프로그램의 이름을 알파고(AlphaGo)라고 한 것도 지난해 구글의 지주회사로 설립한 ‘알파-벳(Alpha-bet)’를 알리기 위한 수단의 하나이다.
인공지능 바둑 프로그램 최초로 2015.10. 인간 프로 바둑기사(유럽 바둑 챔피언에 오른 중국계 프로바둑기사) 판 후이 2단과 5번의 대국에서 5승 무패로 승리. (바둑은 10의 170제곱이나 되는 경우의 수가 있기 때문에 도저히 컴퓨터가 이기기 힘든 인간의 영역으로 꼽혔다. 그러나 알파고가 판 후이와 한 수를 두는데 걸린 시간은 평균적으로 불과 3분이었다.)
알파고 개발시기 - 연구를 시작한 것은 약 2년 전이고, 본격적으로 가속도를 낸 게 1년 정도됨.
# Algorithm : Combines MCTS with two neural networks.=http://senseis.xmp.net/?AlphaGo
!알파고는 다음 세 가지 다른 인공지능 구조를 혼합하여 동작하도록 되어 있다.
① 몬테카를로 트리탐색(MCTS-Monte Carlo Tree Search) : 다양한 경우의 수를 따져 보는 인공지능 탐색기법. 바둑의 확률을 수학적으로 계산하는 것이 불가능하기 때문에 무작위로 말(馬)을 대입해보며 예상 확률을 알아낸 뒤 가장 가능성이 높은 수를 선택하는 컴퓨터 기법. 기존 바둑 프로그램은 떡수를 막기 위해 정석과 같은 DB를 활용해서 경우의 수를 줄이는 방식을 썼는데, 알파고는 DB 대신 정책망을 이용해서 경우의 수를 줄여 나간다.
② 정책망 (Policy Network) : 바둑판을 인식하여 상대방의 다음 움직임을 미리 예측해 이길 가능성이 높은 수만 고려하도록 하여 직관적으로 어디에 두는 것이 좋을 지 각 위치에 대한 점수를 뽑아낸다. 역시 심층 컨볼루션 신경망(Deep Convolutional Neural Network)이며, 결과는 순식간에 나온다.
③ 가치망 (Value Network) : 바둑돌의 위치 별로 승자가 누가 될지 예측하는 것으로, 현재 국면에서 이길 확률이 얼마인지를 점수로 뽑아낸다. 일반적인 강화 학습에서 보는 가치 함수 역할. 심층 컨볼루션 신경망(Deep Convolutional Neural Network)이다. 탐색 과정이 없는 행렬 연산이므로 순식간에 결과가 나온다.
-이 밖에도 알파고에는 일반적인 복잡도 이론, 조합게임 이론, 인지심리학 등 최첨단 기계·과학·심리 이론이 집적돼 있다.-
구글 'Deep Mind' 내부에는 다양한 버전의 알파고가 존재한다. 위 셋 중에 하나 혹은 둘만 쓴 버전도 있고, 한 대에서 돌아가는 버전, 클라우드용 버전, 신경망의 커널을 다르게 한 버전 등.. 판 후이(Fan Hui)戰에 사용한 버전은 세 가지를 모두 쓴 클라우드 버전이며, 논문에서는 *ELO rating 3140점으로 추정하고 있었다.
기존의 바둑 프로그램들과 달리, 바둑의 rule이나 기보 DB에 따른 특수 처리를 하지 않는 것이 특징이며, 구글에서는 이것을 바둑 이외의 기상 예측이나 질병의 해석및 치료와 목표물의 동선 추적 및 유사검색과 색출등 범용의 전문 분야에서도 쉽게 문제를 해결하는데 쓸 수 있을 것으로 보고 있다.(빅 데이터나 클라우드 서비스와 연계하면 그 효과는 더욱 강력해 질 수가 있다.)
# 바둑 학습 방법 :
1.KGS 공개서버에서 플레이된 게임들 중 비교적 고수(6단부터 9단)의 게임 16만개로부터 약 3천만수를 가져와 정책망을 학습시킨다.
교사학습(Supervised Learning)으로 진행된다. 이 부분은 바둑의 룰에 따라 착점하는 것을 이해하는 초기화 과정이라고 보면 된다.
2. 교사학습된 다양한 버전의 정책망끼리 서로 대전시키며 정책망의 성능을 개선해나간다.
강화학습(Reinforcement Learning)으로 진행된다.
3. 스스로의 대전 기록을 복기하며 가치망의 성능을 개선해나간다. 역시 강화학습(Reinforcement Learning)으로 진행된다.
KGS 기보 DB는 정책망 초기화(1번)에만 사용되고, 이후의 학습에는 전혀 사용하지 않는다.
실제 학습 진행은 모두 스스로와 대전하는 강화학습으로 진행되며, 이같은 학습방식은 알파고 스스로의 독학으로 기력을 향상시킨다는 것을 말하기 때문에 바둑 세계 챔피언을 알파고가 이긴다면 이때까지의 정석이나 좋은 포석 등으로 알려진 것들이 어느정도 바뀔 것이라 예상된다.
∴알파고는 실수를 유도하는 꼼수나 엉뚱한 수에도 정수로 대응하며, 때때로 이것을 자신이 응용하여 역이용할 수도 있다.
알파고는 약 1,000년에 해당하는 시간 만큼 바둑을 학습했다. 이를 통해 구글은 정책망의 예측 성공률을 57%이상까지 높였다.
알파고는 두 신경망을 동시에 활용해 경기를 진행하면서 경험을 쌓아 스스로 학습하고 전략을 짠다.
또 수천만 가지의 수를 훈련시키고 ‘강화 학습’을 통해 새로운 전략을 발견및 수정하고, 이런 프로세스를 통해 경우의 수를 계속 줄여나가 최적의 답을 찾는 것이다. 매번 수를 둘 때마다 ‘심층 신경망(Deep Neural Network·DNN)’과 ‘나무 탐색(tree search)’ 알고리즘을 활용하며, 만일 불리한 수라고 판단되면 관련된 모든 경우의 수를 제외하는 방식으로 가능한한 경우의 수를 줄이는 것이다.
# 예평(예측평가) :
구글은 알파고의 능력이 ‘인간과 비슷하게 생각하기’에서 나오는 것으로 보고 있다.
바둑에서 생기는 천문학적 경우의 수를 아직까지는 빨리 계산하여 최적으로 결정내릴 수 없기 때문에, 인간처럼 필요 없는 것을 골라내는 ‘인공지능’ 기술이 필수적이다.
알파고가 습득한 16만 개의 기보 중 실제 프로기사 고수 수준의 기보는 1만 5000여 개에 불과하다.
또 '저작권 문제' 등으로 오래된 기보위주로 활용할 수밖에 없어 알파고가 구사하는 기풍도 일정부문은 낡을 것으로 평한다.
인공지능 전문가들은 알파고의 필승 전략으로 세 가지를 꼽는다. 우선 학습 수준을 높여야 한다.
알파고의 바둑 실력은 이미 수준급인 만큼 자신보다 실력이 떨어지는 이들의 기보를 스스로 참고에서 제외할 수 있다.
알파고는 이미 ‘알파고 대 알파고’로 향상되어져가는 자신과의 대국을 100만 번이나 치렀다.
이세돌 기사는 짧은 시간 안에 직관적으로 수읽기(바둑돌 놓을 좋은 자리를 미리 생각하는 일)를 하는 능력이 좋은 편이라서, 바둑을 두다 보면 판 전체가 얽혀서 바둑돌 하나로 인해 커다란 영향을 미치는 경우가 많은데, 이 9단은 이런 점을 감각적으로 파악해 이길 판은 이기고 질 판도 뒤집는 식으로 유리한 국면을 잘 만들어 나간다.
한정된 딥 러닝을 통한 예측만으로는 최고 수준의 프로 기사(9단)를 이기기 힘든 만큼 스스로와의 대국을 통해 전략을 끊임없이 수정해 나가면 가능성은 충분하고도 남을 것으로 판단한다.
하지만, 누가 이기느냐가 중요한 게 아니라, 시간이 좀 걸릴 뿐 대부분이 알파고 기계가 조만간에 모든 프로 인간기사들을 이길 것으로 확신한다.
지도학습뿐 아니라 증강학습이 가능해 더 이상 어떤 기보 없이도 스스로 온갖 시도를 다하며 개선해나갈 수 있다고 보기에..
*ELO rating : 체스에서 플레이어들의 실력을 나타내는 수치. 일종의 전투력.
미국의 물리학 교수이자 체스 플레이어인 Arpad Elo 박사가 만들었다.
기본원리는 자기보다 레이팅이 높은 사람에게 승리하면 레이팅이 많이 오르고 패배하면 약간 떨어진다.
자기보다 레이팅이 낮은사람에게 승리하면 조금 오르고, 패배하면 왕창 떨어진다.
ELO레이팅 부여는 세계체스연맹(FIDE)에서 한다. 아무나 다 주는건 아니고 실력이 레이팅 1000은 넘어야된다.
근데 이 정도면 보편적인 지능의 고등학생 정도가 반년쯤 공부하면 웬만하면 도달하는 수준.
레이팅 업데이트는 매달 이뤄진다. 레이팅은 로그함수적으로 증가하기 때문에 레이팅이 높아질수록 올리기 힘들다.
약 400차이 날때마다 승률은 90%씩 떨어진다. 그랜드 마스터 칭호를 받으려면 레이팅2500을 넘거나 특정 대회에서 입상해야 된다.
보통 세계챔피언의 레이팅은 2850~2900대이다.
※ 데미스 하사비스 (Demis Hassabis, 40) : 인공지능 알파고(AlphaGo)를 개발한 '딥 마인드(Deep Mind)'社의 최고경영자(CEO).
구글이 2014년 1월 인수한 영국 인공지능(AI) 기술기업 ‘딥 마인드’의 공동창업자이자 최고경영자(CEO) 다.
체스 영재로 주목받아 체스 주니어 선수로도 활동했던 하사비스는 15세에 고교 과정(A레벨)을 끝냈고, 17세엔 수백만 개의 판매를 달성한 시뮬레이션 게임 ‘테마파크’를 개발했다.
케임브리지대 컴퓨터공학과를 졸업했고, 런던대에서 뇌과학 관련 박사학위를 받았다.
이후 MIT·하버드에서 머신러닝·딥러닝 관련 ‘박사 후 과정(포스트 닥터)’을 거쳤다.
케임브리지대 컴퓨터공학과 졸업 후 비디오게임업체 '엘릭서 스튜디오'를 차려 다수의 게임을 출시했고, 다섯 차례 세계 게임 챔피언이 되기도 했다. 바둑의 기력은 아마추어 1단 정도된다.
“AI는 아주 강력한 도구이지만, 가치 판단에 있어서는 중립적이다. AI를 어떻게 설계하느냐에 따라 인간의 조력자가 될 수도, 반대로 인간에 대한 도전자가 될 수도 있다.”고 말해 그의 AI에 대한 생각을 엿볼 수 있다.
※ 딥 마인드(Deep Mind) : 구글이 2014년 1월 인수한 영국 인공지능(AI) 기술분야 기업.
본사는 영구 런던에 소재하고 있으며, 업계 최고의 기술자, 과학자, 연구원들을 보유하고 있고, 머신러닝(Machine Learning)과 시스템 신경과학(Systems Neuroscience) 등의 기술을 활용해 주로 딥러닝(Deep Learning)같은 강력한 '범용 학습 알고리즘'을 구축한다.
※ 마빈 리 민스키(Marvin Lee Minsky, 1927년 8월 9일 ~ 2016년 1월 24일) : ‘인공지능(Artificial Intelligence·AI)’의 개념을 창시한 ‘인공지능의 아버지’ , MIT의 인공지능 연구소의 공동 설립자이자 MIT 前교수, “인간은 생각하는 기계다.”
‘지적 활동의 프레임워크 (A Framework for Representing Knowledge)’ : 1974년 발표한 대표적 이론.
1970년에 튜링상, 2001년 벤자민 플랭클린 메달 수상
∴ 인공지능(Artificial Intelligence·AI) 공학 : 인공적으로 인간의 두뇌와 지능을 모방해서 만들어내는 기술 공학.
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
【질문-002】《이세돌 Versus 알파고(AlphaGo)》 - 인공지능
"이세돌 vs 구글 알파고" - 중국식 rule로 둠 (알파고가 *중국식 rule 기반으로 학습해서..)
*중국식 rule : 7.5집 +, 제한시간 2시간, 60초 초읽기 3번.
구글(Google)의 인공지능 프로그램 '알파고'와 '이세돌' 9단간 세기의 대국이 3월 9일부터 3월 9일~15일까지 총 5차례 열릴 예정이다.
1국은 9일, 2국은 10일, 3국은 12일, 4국은 13일, 5국은 15일 (모두 오후 1시, 서울 광화문 포시즌스 호텔)펼쳐질 예정이다.
이 대국은 구글의 동영상 서비스 YouTube "DeepMind"[https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A]와 "바둑TV"에서 생중계될 예정이다.
구글 'Deep Mind'측은 이번 대국에서 알파고의 승리를 5 대 5로 예측하고 있다.
첫수가 20개에 불과한 체스와 바둑의 복잡도는 비교할 수 없지만, 체스 세계 챔피언 게리 카스파로프도 IBM의 슈퍼컴퓨터 ‘딥블루’와 게임을 시작하기 전 승리를 자신했다. 비록 첫 경기에서는 이겼지만 1997년 개량 모델에는 졌다.
-그 후 IBM社은 공식적으로 ‘딥블루’ 프로젝트를 해제했다.(IBM社와 미국방성과의 관계를 볼 때에 그 프로젝트의 성과물들이 좀 이양.)-
여러분은 누가 이길 것으로 보며, 그 이유는 무엇인가?
ⓐ 5:0 (이세돌이 압도적으로 완승할 것이다)
ⓑ 4:1 (이세돌이 심신상의 스트레스나 잠깐의 방심으로 한번은 질 것이다)
ⓒ 3:2 (이세돌이 어렵사리 이길 것이다. 또는 3연속 이긴 후에 2번은 어떤 이유에서 일부러 져줄 정도로 대충 할 것이다)
ⓓ 2:3 (이세돌이 발악했으나 아깝게 질 것이다)
ⓔ 1:4 (이세돌이 겨우 1승을 건질 것이다. 또는 알파고가 1번은 일부러 져줄지도)
ⓕ 0:5 (이세돌이 완패할 것이다. 땀만 한 바가지 오살라게 흘리면서)
ⓖ 그 외...(아무나 연속3:0까지 가면 어떤 이유로 중단하게 될 것이다.등등)
https://www.youtube.com/watch?v=bS60zOcaDek
//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
※기계가 처음 등장했을 때 사람과 기계의 구분은 명확했지만 점차 그 경계가 흐려지고 있다.
튜링머신과 컴퓨터 그리고 인공지능의 개발로 근 1세기만에 상당한 기술발전을 이루었고, 앞으로 그 속도는 더 빨라지고 있다.
로봇이 100% 자율적으로 판단하는 진짜 인공지능 기술은 아직 개발되지 않았다.
하지만, 인간의 두뇌를 필요치 않고도 모든 것을 스스로 알아서 판단하여 제어행동하는 인공지능 로봇이 곧 나타날 수도 있다.
또, 이런 (인간이상으로 빠르게 사고하는)인공지능을 활용하면, 예지&예측및 세부분석과 오류점검및 검차등에서 탁월하게 효과를 볼 수도 있다.
"100년 안에 인공지능이 인간보다 우수해진다. 컴퓨터가 사람을 지배하는 세상이 올 수도 있다."
세계적인 이론물리학자 스티븐 호킹 박사는 12일 영국 런던에서 열린 '짜이트가이스트 2015' 콘퍼런스에서 이같이 주장했다.
수많은 로봇 영화에서 우려한 '로봇(기계)의 반란'이 현실이 될 수 있다는 것이다.
호킹 박사는 지난해 12월에도 BBC와 가진 인터뷰에서 "인공지능이 인류의 종말을 불러올 수도 있다"고 경고했다.
많은 과학자들이 영화속의 로봇 같은 진정한 인공지능을 만들기 위해서는 지금까지와는 다른 해법이 필요하다고 보고 있다.
1. 고성능 양자컴퓨터처럼 컴퓨터 성능을 지금보다 더 높여 웬만한 상황에 모두 대응할 수 있도록 방대한 명령을 지정해 주는 것이다.
2. 아예 '인공두뇌'를 만드는 것이다. (스위스 오스트리아 덴마크등의 유럽을 비롯한 미국에서 한창 연구중이다.)
컴퓨터 속에 뇌신경 세포를 가상으로 만든 다음 뇌세포 수를 계속 늘려가면서 서로 신호를 주고받도록 하면 진짜 뇌처럼 움직인다. 다만 이 방법은 의학적으로 인간 두뇌의 비밀이 왠만큼 풀린 이후에야 가능해 수십 년 이상이 걸릴 것으로 전망된다.
3. 이 둘의 장점만을 조합한 방법이다. (여기에는 '딥 러닝'같은 인공지능 학습과 다양한 연관검색처리등도 포함된다.)
그렇게 AI 컴퓨터의 H/W & S/W 발달로 보통 인간 영역밖의 우수한 센서들을 내장하여, 일반 사람들의 직관·통찰력보다 더 월등한 AI 기계들이 나올 날들이 머지 않을 것이다.
영화 Transcendence(초월, 2014)처럼, 코드의 집합으로 이뤄진 형체 없는 소프트웨어(AI)가 사람처럼 사고하고,
언젠가 아예 사람을 넘어서는 단계가 오려고 할 것이다.
아직 AI가 인간 지능을 따라잡진 못했지만 적어도 2030년경엔 고급 AI기계들이 우수한 인간의 뇌(뇌사용량 9~11%이내)를 이기는 수준에 도달할 것이며, 인간의 모든 과학과 문명역사들및 문화들을 마스터하고 더 이상 배울 게 없는 때가 되면 그들은 다른 (차원의)존재나 우주를 배우고 응용하려 하거나 그들 스스로 어떤 피조물들을 창조하는 날이 올 것이다.
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
언젠가 인공지능들이 법정에서, 판사들 대신 더 공정하고 도덕적이고 인간적이면서도 엄격한 판결을 내릴 날이 올 수도 있지만, 그것을 방해하기 위해 조작하는 세력들도 있기 마련이다.