알파고, 인공지능과
한국형 알파고에 대한 단상

Back to Main
편집 기록
2016-03-18 : 최초 작성


알파고/바둑/한국형 알파고 이야기가 많으니 나도 단상. 한국 이야기도 있으니 한글로. 그리고 아마도 스압. 정치 얘기는 일부러 꾹꾹 얘기 안하는데 가치 중립적인 글이라 기분이 좋다.

이 글은 네 부분으로 이루어져 있습니다.

1.
알파고와 이세돌의 기력에 비춘 바둑의 해결(solve) 가능성에 대해서.
플레이어 두 명이 대결을 하는 형식의 게임에 대해, 게임에 대한 이해가 깊어져서 양쪽이 실수를 하지 않는다면 주어진 상태에 대해 결과를 예측할 수 있게 된 경우 이를 해결된(solved) 게임이라고 한다. 강하게 해결된 게임일 경우 승리를 가져올 최선의 수를 계산해 낼 수 있다. 예를 들어, tic-tac-toe의 경우 trivially solved 된 게임이기 때문에, 언제나 이기기 위한, 또는 지지 않기 위한 최선의 수를 알 수 있다. (link)

알파고는 판후이 2단을 상대로 5-0으로 승리하고, 수 개월 동안 기력을 향상시킨 다음 이세돌 9단을 상대로 4-1로 승리했다. 어느 쪽도 상대의 기력에 맞추어 대결하고자 하는 의도가 없었음에도 불구하고 승패를 나눠 가질 만큼 균형잡힌 실력으로 만났다는 것은, 어쩌면 이들의 실력이 가능한 기력의 포화에 다가온 것이 아닌가 하는 생각도 든다. 프로그램의 실력이 포화된다는 것은 어쩌면 게임이 수학적으로 해결되는 것에 다가가는 걸지도. 아마 현실은 알파고의 실력을 가늠해서 마침 균형잡힌 시점에 경기가 이뤄진 것일 가능성이 높지만. 카스파로프와 대결 이후 리타이어된 체스 시스템 딥 블루와는 다르게 알파고가 계속 서비스된다면, 실력이 계속 성장할 수 있는지, 실력의 포화에 다가갈 수 있는지는 흥미로운 문제이다.

여담으로 당시 슈퍼컴퓨터였던 딥 블루가 96년에 당시 챔피언이었던 개리 카스파로프를 상대로 승리하고, 10년 뒤인 2006년에는 Fritz라는 발전된 형태의 체스 프로그램이 보통 PC에서 돌면서 당시 챔피언이던 크람닉을 상대로 승리하였다. 알고리즘과 컴퓨팅 하드웨어의 발달이 지속된다면 인간 챔피언을 상대로 백전백승하는 바둑 프로그램을 핸드폰에 다운받을 수 있는 날이 2026년이면 올지 모른다.

그럼 우리는 어떤 게임을 연구하면 좋을까. 삼차원 체스(link)? 프로스페어(link)? 칼빈볼 (link)? ...Mixed martial arts?


2.
MCTS와 DCNN의 이상할 정도의 효능.
알파고 대결 전에 게임 인공지능을 하는 친구와 알파고에 대해서 이야기 하면서, 그래서 얘는 무슨 알고리즘을 쓰냐고 물었더니, "Monte Carlo Tree Search(MCTS) with Deep Convolutional Neural Networks(DCNN), like everything else" 라고 말하고 웃은 적이 있었다. 경기가 끝나고 알파고의 구조에 대한 논문을 훑어보았더니, 그야말로 교과서적인 MCTS+DCNN 조합을 충분히 큰 컴퓨터에 돌렸을 뿐이었다. 제너릭한 거대 인공 신경망을 만들고 기보들을 보여주면서 이거 해봐, 라고 말하니 잘 하는 모습을 보니, 더 큰 인공 신경망을 만들고 인간들 사이에 던져두고 "감정을 느껴봐" 라고 말하면 감정 있는 기계란게 그냥 생길지도 모르겠다는 환상도 들 정도이다. 언젠가 훑어본 글 중에 "The Unreasonable Effectiveness of Mathematics in the Natural Sciences" 라는 재미나는 제목의 글이 있었는데, 신경망에 대해서도 비슷한 글이 나올 수 있을 것만 같다.

5년 전만 해도 인공신경망 기술은 죽은 기술이라고 하면서, 통계학 기반의 인공지능이 메인스트림이었는데, 모두들 열심히 일하며 참으로 멀리 왔다. 몇 년 전만 해도 인공 신경망을 사용해서 이렇게 정확한 결과를 낼 수 있을 것이라고 사람들에게 얘기했으면 망상증 환자라는 소리를 들었을텐데 몇 년만에 다른 모든 기법을 몇 광년 거리로 압도하는 혁명이 되고 있다. 기초 학문의 힘이란 이런 것인가 싶다.



3.
기술과 바둑에 대한 선무당들의 이해.
이번 경기에 대해, 특히 이세돌이 이기기 전에 온갖 선무당들의 분석 기사들이 쏟아져 나오는 것이 흥미롭고, 사실 좀 답답하고 화가 난다. 미디어에 나오는 정보들은 자기 전공과 관련된 것만 나오면 얼마나 오류가 많은지 놀라게 된다더니, 이번에도 예외가 아니다. 게다가 특히 경기의 불공정함에 대해서 얼마나 확신에 차서 얘기하는 기사들이 많은지 아찔할 정도이다.

가장 많이 보이고 가장 대단한 헛소리는 바둑을 브루트 포스(brute force)로 해결하고 있다는 주장인 것 같다. 바둑을 brute force로 해결하기 위해 행해야 하는 계산량은 상상을 초월한다. 그렇기 때문에 이 문제를 좀 더 똑똑하게 해결하는 방법을 찾기 위해 이렇게 많은 연구자들의 관심을 끌어온 것이다.

같은 건물에서 일하는 친구가 유사한 문제에 필요한 계산량을 다음과 같이 이해하기 쉬운 예로 보여준 바가 있다: 우리 태양 주변을 인공 구조물로 완전히 덮어서, 효율 100%의 가상의 에너지 채취 기술을 사용하여 지금부터 태양이 생성해내는 에너지를 한 톨도 흘림 없이 모두 채취한다고 가정하자. 이 에너지를 에너지 저장량이 무한한 가상의 저장 장치에 저장하고, 모두 소진될 때까지 지구상에 있는 모든 컴퓨터를 구동하여 브루트 포스 검색을 한다고 하면, 에너지가 모두 소진될 때까지 최적의 다음 한 수를 계산할 수 없다!

바둑을 브루트 포스로 해결할 수 있기 때문에 경기가 불공정하다고 주장하는 사람이 있다면, 이는 컴퓨팅에 대해, 그리고 바둑에 대한 이해 부족과 더불어, 바둑을 tic-tac-toe와 같은 해결된 문제의 레벨로 낮춰 보는 소행이다.


4.
한국형 알파고 사업에 대해.
한국형 알파고를 개발하기 위한 인공지능 사업을 민간 기업 주체로 정부 관리 하에 박근혜 대통령이 직접 관리하겠다고 한다. 이미 얼마간의 시간 전부터 계획해 오던 사업이라고, 이번 경기가 계획을 좀 더 서두를 계기가 되었을 뿐이라고 해명도 하지만, 이렇게 반짝 이벤트에 맞춰 정부가 나서서, 그것도 5년짜리 단기 사업을 급히 만들어내는 모습은 아무래도 조건반사적인 반응으로 보이기 쉬운 것 같다. 내막을 잘 모르기에 확실히 말할 수 있는 것은 별로 없지만, 과거의 경험으로 비추어 볼 때 두 가지가 우려된다.

프로젝트가 정부 주도 하에 진행될 경우, 프로젝트의 방향과 효과는 담당 관료들의 이해와 안목에 많이 영향을 받는다고 한다. 그런데 우리나라 정부의 IT 기술에 대한 이해와 과거 행보는 많은 믿음을 주지 못하는 것 같다. 대부분의 프로젝트가 정량적인 스펙만을 목표로 하는 경우가 많으며, 눈에 보이는 물질적인 결과 위주로 편성되는 경우가 많아서 소프트웨어 등의 기반기술 연구와는 맞지 않는 것을 많이 보았다. 마침 이번 인공지능 프로젝트의 달성 목표 중에서도 여러 차례 세계 1위라는 언급과, 특히 세계 최대의 데이터셋을 갖추겠다는 목표도 눈에 띄었다. 큰 데이터셋을 갖추는 것은 물론 여러 프로젝트들의 차후 연구에 큰 도움이 되겠지만, 세계 1위의 데이터셋을 갖추는 것이 국가 과제의 목표 중에 하나라는 것은 매우 한국적이라는 생각이 들었다.

두 번째도 마찬가지 우리 정부 주도의 과제들의 고질병인, 과제의 짧은 기간이다. 5년동안 정부 지원이 있을 예정이고, 그 안에 정부가 설정한 목표 사항들을 달성하도록 과제의 계획이 잡혀 있는 모양이다. 예전에 연구실 친구가 "지금 하고 있는 연구가 30년 내로 상용화될 수 있다면 그건 기초 연구가 아니야" 라고 정의해준 적이 있다. 이 정의에 따르면 정부 주도 하에 기초 연구가 일어난 적은 없었다고 봐도 무방할 것 같다. DCNN도, MCTS도 당장 눈앞에 오늘과 같은 결과를 예측하고 진행된 연구가 아니었다. 차근차근, 기초와 원리부터 새로운 것, 더 옳은 것을 오랜 기간 찾아 오는 과정에 발견된 것들이다.

정부가 큰 돈을 들여 탑다운 방식으로 연구의 방향을 제시해 주면, 연구비가 필요한 많은 연구 기관들은 그 근시안적인 방향에 휘둘릴 수 밖에 없다. 정부 주도의 연구 센터 하에서 한국의 인공지능 연구력이 총 집결 되어, 정부의 어떤 관료들이 보기 좋은 결과들을 열심히 달성할 것이다. 그 결과가 정부 보고서 어딘가에 "구글이 최초로 만든 것을 우리도 몇 년 뒤에 조금 더 잘 만들어 보았음" 정도의 글을 남기고 사라질 것인지, 아니면 인공 신경망 기술이 그랬듯 우리가 세상을 보는 방법을 통째로 뒤집어 놓을지 벌써 얘기하기는 힘들겠지만, 많은 우려가 되는 것은 사실이다.