반응형
'알파고마스터' 태그의 글 목록 :: 건강한 지식바다
반응형

알파고 뛰어넘은 알파고 탄생


구글의 딥마인드에서 우리가 알고있는 바둑 프로그램인 알파고를 뛰어넘는 최신 버전인 알파고 제로가 공개 되었다고 합니다 


우리가 알고있는 것은 인공지능하면 딥 러닝만 알고있었는데요 이번에 공개된 알파고 제로에 적용된 학습방법으로는 강화학습이라고 합니다 


강화학습이란 것은 인간으로부터 요령을 배우는 것이 아니라, 인공지능이 스스로 수많은 시행착오를 통해서 요령을 터득하는 방법을 말합니다 


알파고 제로는 바둑의 규칙 외에는 아무런 사전의 지식이나 그런것이 없는 상태에서 스스로 대국을 하면서 어마어마한 전적을 자랑하는 수많은 고수들을 이긴 알파고의 버전들을 압도했다고 합니다 


더욱 대단한 것은 다들 아실텐데 이세돌 9단과 알파고의 대결에서 대국을 한 버전의 알파고의 능력을 강화학습을 통한 독학을 36시간을 한 결과 이미 넘어섰다고 합니다 

이 강화학습의 더욱 대단한 점은 같은 알파고 제로를 비교했을때 초반에는 강화학습을 통한 독학을 하는 알파고 제로의 경우 어리버리하는 경우가 있었는데 며칠 후에 사람의 도움을 받는 것을 넘어섰다고 합니다 


그리고 72시간의 독학을 거친후에 이세돌 9단과의 대국을 한 알파고와 대국을 한 결과 100전 100승의 무패를 기록했다고 합니다

그리고 현 세계 최강인 커제 9단을 3대0 으로 꺾었던 기존 알파고의 최강 버전인 알파고 마스터의 실력마저 40일 동안의 2천 900만 판의 홀로 대국으로 넘어섰고 알파고 제로와 알파고 마스터의 경우 전적이 100전 89승 11패로 알파고 제로의 압승이라고 합니다 


이러한 것에 대해서 알파고 제로가 왜 기존의 알파고에 비해서 더 강력한가에 대해 사람의 도움을 받는 경우는 인간 지식의 한계에 속박이 될 수 있지만 강화학습을 통한 독학의 경우 그렇지 않기 때문이라고 합니다 


정말 이런 것을 보면 정말 인공지능이 참 생각보다 멀리 와 있구나 하는 생각이 드네요 

그러면서 뭔가... 아 이제 진짜 영화의 세상이 실현되는구나 하는 기대감과 뭔가 현실의 괴리감도 같이 느껴 지네요  

반응형

+ Recent posts