이세돌 Vs. 알파고, 바둑대전의 모든 것!!

2016/03/17

3244

오늘은 ‘세기의 대결’ 이세돌9단과 인공지능 프로그램 알파고의 바둑 대국에 대해서, 그리고 알파고란, 인공지능이란 무엇인지 모두 알려드립니다. 이세돌9단과 알파고의 5국이 모두 종료되었는데요, 이번 매치 5국은 모두 불계(不計)와 초읽기까지 가는 접전 끝에 “4승1패”로 알파고가 이세돌9단을 꺾으면서 인공지능의 발전 수준에 전세계가 놀라움을 금치 못하고 있습니다.

이번 대국은 한국에서 5번기 3국 승으로 펼쳐졌고, 각 2시간씩, 그리고 백을 잡은 기사에게 덤 7.5집을 주는 중국 바둑 규칙에 따라 진행되었습니다. 이세돌 9단은 1988년부터 데뷔한 프로 9단이고, 알파고는 사람이 아닌 인공지능에 의한 기계학습으로 바둑을 두는 소프트웨어로, 2015년에 데뷔했고 자체추정으로 5단 수준입니다.

이세돌 9단은 대국 전 5:0 또는 4:1로 승리를 예상했었는데요, 첫 대국이 종료된 이후 사람들은 알파고 쇼크에 빠졌고, 이세돌 9단은 알파고가 종종 실수를 하기는 했지만 번번이 이겨가는 것이 놀랍다며 경외감을 표시했고, 알파고를 개발한 딥마인드의 CEO인 데미스 하사비스는 “우리는 달에 착륙했다”며 승리의 기쁨을 표현함과 동시에 이세돌 9단에게도 존경을 표했습니다.

자 그럼, 도대체 인공지능이 뭐길래 인간을 넘어선다는 평가로 세상을 충격에 빠트린 것일까요?

먼저, 왜 이렇게 컴퓨터가 바둑을 이긴 것에 대해 초미의 관심이 쏠린 것일까요? 인공지능이 인간을 이긴 것은이번이 처음이 아닙니다. 1997년 IBM이 개발한 슈퍼컴퓨터 인공지능 Deep Blue는 체스 챔피언 가리 카스파로프(Garry Kasparov)를 이겼고, 2011년에는 IBM의 Watson이 재퍼디(Jaepardy) 퀴즈쇼에서 우승을 했고, 지난해에는 알파고가 유럽 프로기사 Fan Hui 2단을 이긴 바 있습니다. 근데 바둑은 그 동안 인공지능이 접근하기 어려운 ‘난공불락’의 영역으로 여겨져 왔기 때문에 이번 대국이 세기의 대결로 주목받은 것입니다. 바둑은 변수가 우주의 원자만큼 많기 때문에 인공지능이 극복해야 할 최대 난제였습니다. 체스는 매 포지션마다 평균 20개 정도의 다음 수가 있지만 바둑은 200가지 다음 수가 있습니다. 경우의 수도 바둑을 어렵게 합니다. 바둑판을 배열하는 경우의 수는 전 우주의 원자의 수 이상으로 많습니다. 그렇기 때문에 모든 가능한 경우의 수를 시뮬레이션해서 최선의 수를 찾는 알고리즘으로는 아무리 성능이 뛰어난 컴퓨터 수십억대가 있을지라도 무한한 시간이 필요하기 때문에 이기기 어려운 것입니다.

바둑 고수에게 왜 이런 수를 두었냐고 묻는다면 그저 "이게 맞는 것으로 느껴졌다"고 답할 때가 있다고 합니다. 바둑은 다른 논리 게임보다 더 직관적인 셈이죠. 이 직관을 컴퓨터에게 어떻게 가르쳐야 할까요? 때문에 어떠한 기술들로 인공지능 솔루션을 구현해 냈느냐가 관건이 되는 것이지요.

핵심으로 돌아와서, 그럼 알파고는 도대체 무엇일까요? 알파고는 구글이 2014년 4억 달러에 인수한 딥마인드가 개발한 딥러닝 기술 기반의 인공지능 소프트웨어 입니다. 너무 어렵죠? 하나씩 짚어보자면, 인공지능 Artificial Intelligence는 기계가 인간의 사고와 지적능력을 갖는 것이고, 딥러닝은 사람이 일일이 규정해 주지 않더라도 대량의 데이터 속에서 기계가 스스로 패턴을 발견하고 학습하는 기계학습 방법입니다. 알파고는 인간의 직관력을 모방하기 위해 인간의 학습법을 따르고 있습니다.

알파고는 빅데이터 학습과 심층 신경망, 몬테카를로 트리 탐색기법, 강화학습 등을 도입했는데요, 쉽게 설명해보죠

먼저, 알파고는 프로기사들의 효과적인 수에 대해 3000만 건의 기보를 입력시켜서 어떤 수가 좋고 나쁜지를 분석해 이기는 방법을 습득했습니다. 물론 여기에서 방대한 빅데이터를 수용할 수 있는 하드웨어는 176개의 GPU와 1202개의 CPU 프로세서를 기반으로 하고 있습니다.

그리고 이 정보들로 우리 뇌의 신경망 회로와 비슷한 정책망과 가치망을 가동하는데요, 정책망은 다음번 돌의 움직임을 미리 예측해 이길 가능성이 높은 경우의 수를 제시하여 좋은 수를 찾아내고, 가치망은 바둑 돌의 위치별로 승자가 누가 될지 승률을 예측해 승률이 가장 높은 수를 골라내는 것입니다. 여기서 핵심인데요, 알파고는 기존 바둑 프로그램이 여기 이수를 놓으면 여기에 어떤 수를 놓겠지? 그럼 다른곳에 수를 놓으면 이렇게 수를 놓겠지? 하면서 무작위로 모든 경우를 탐색하는 트리탐색(Tree Search) 기술을 이용하는 것과 달리, 다양한 경우를 감안해 가장 적합한 결정을 할 수 있도록 경우의 수를 줄여주는 검색 알고리즘인 몬테카를로스를 사용했습니다. 그리고 스스로 시행착오를 거쳐 스스로 연결고리를 조정하고 새로운 전략을 발견하는 강화학습을 통해 지금의 똑똑한 알파고가 탄생한 것이죠. 좀 이해가 가시나요?

이번 대국은 인간이 도맡아온 고품질의 업무에 인공지능을 광범위하게 적용할 수 있다는 것을 확인시켜줬고, 향후 스타크래프트에서도 이겨보겠다는 딥마인드의 계획 이외에도 인공지능 기술을 구글의 자율주행차, 의료, 보건 분야에도 적용할 수 있을 것으로 기대가 됩니다. 물론 이렇게 되기까지는 안전에 대한 엄격한 시험 단계와 검증을 거쳐야겠죠.

이번 대국은 이세돌 9단의 3연패에 끝모를 허탈감과 곧 다가올 미래 사회에 대한 공포감을 안겨주기도 했고, 4국에서의 첫 승은 인간의 존엄이 무엇인지를 숙고하게 만들기도 했습니다. 산업혁명에 버금가는 인공지능의 혁명을 전세계인들이 온몸으로 느꼈습니다. 이제 인공지능을 먼 나라 이야기라고 생각하는 사람은 없을 것입니다. 앞으로는 인공지능이 어떤 영향력을 미칠지 주목해야하는 ‘인공지능 모멘텀’ 이라고 할 수 있겠습니다.

세기의 대결, 정말 멋진 대국을 보여준 이세돌 9단과 알파고에 경외의 박수를 보냅니다.