1. 서론
최근 전 세계적으로 기계학습(Machine Learning)에 대한 관심이 급격히 높아지고 있다. Google, Microsoft, Facebook, Apple, Baidu 등의 글로벌 IT 기업들에서는 기계학습을 이용한 다양한 제품들을 경쟁적으로 출시하고 있다. 기계학습은 인공지능에 있어 ‘학습’에 관한 분야로, 정제된 데이터로부터 유의미한 정보를 추출함으로써, 기존에 관측되지 않은 새로운 데이터에 대해 예측을 수행하는 기술이다. 기계학습에 대한 연구는 오랜 세월 전 세계의 수많은 연구자들에 의해 수행되어 오고 있는데, 왜 하필 지금 전례없는 큰 주목을 받고 있는 것일까? 그 핵심은 인간 뇌의 정보처리 메커니즘을 모방한 ‘딥 러닝(Deep Learning)’ 기술의 성공 사례에서 찾아볼 수 있다.
2. 기계학습의 역사와 기본 원리
기계학습은 인공지능(Artificial Intelligence) 연구 중 패턴 인식(Pattern Recognition)과 계산적 학습 이론에 대한 연구로부터 파생됐다. 1940년대에 뉴런의 작동 원리를 모방해 개발된 인공신경망(Artificial Neural Network)이 그 시초라 할 수 있다. 초기에는 학습을 위해 간단한 통계학 기법에 바탕을 두었으나, 곧 한계에 봉착하게 됐고, 이후 데이터의 불확실성과 구조적인 관계 표현에 효과적인 확률 이론과 그래프 이론 등과 결합해 발전한 결과, 오늘날의 딥 러닝 기술에까지 이르게 됐다[1].
기계학습의 핵심은 입력값 또는 관측치에 대한 반응(출력) 규칙을 데이터로부터 기계가 스스로 학습하게 하는 것이다. 그리고 학습된 지식 또는 정보를 이용해 새로운 입력에 대응하는 출력을 결정하거나, 미래의 변화를 예측하도록 하는 것이다. 카메라로 획득한 사진에서 과일 중 사과와 배를 구분하는 분류 시스템을 개발한다고 가정하자. 컴퓨터는 모든 데이터를 수치화해 처리하므로, 학습하고자 하는 데이터(과일)를 수치화하는 과정이 필수적이다. 학습 대상(사과 또는 배)의 여러 특성 중 ‘모양’과 ‘크기’ 두 가지만을 고려할 경우, 사과는 대체로 동그란 모양을 가지지만, 배는 상대적으로 울퉁불퉁한 모양을 가지며, 배의 크기가 사과보다 큰 것이 일반적이다. 이를 수치화해서 2차원 공간(모양, 크기)에 나타낸 것이 그림 1의 그래프이다. 이때 가로축은 둥근 정도를 나타내는데, 원점에 가까울수록 울퉁불퉁한 외형을, 멀어질수록 원형을 의미한다. 세로축은 크기를 나타내며, 원점에 가까울수록 작은 크기를, 멀어질수록 큰 크기를 의미한다.
이렇게 수치화된 데이터를 학습하는 과정에서 교사(혹은 감독관)가 제공하는 부가적인 정보의 유무에 따라 학습 방법이 달라진다. 먼저 학습 과정에서 감독관이 데이터의 레이블(주어진 과일이 사과인지 배인지) 정보를 함께 제공하는 교사 학습(Supervised Learning) 방법이 있다. 이 방법의 목적은 주어진 데이터(사과 또는 배)를 가장 잘 분류할 수 있는 결정 경계를 찾는 것이다. 그림 1(a)는 교사학습 결과의 한 예로써, 두 과일을 가장 잘 분류할 수 있는 결정경계가 직선의 형태로 학습된 결과의 예이다.
다음으로 부가적 레이블 정보 없이, 데이터만 주어진 상황에서 학습하는 비교사 학습(Unsupervised Learning) 방법이 있다. 이 방법의 목적은 데이터의 내부 구조를 이해하는 것으로써, 대표적인 예가 비슷한 특성을 가지는 데이터를 묶는 군집화이다. 그림 1(b)는 2차원 공간상에서 거리가 가까운 것을 기준으로 군집화한 결과의 한 예이다.
마지막으로 그림 1(c)와 같이 데이터의 레이블은 주어지지 않지만, 학습 결과에 대한 교사의 보상(긍정 혹은 부정)이 주어지는 강화학습(Reinforcement Learning) 방법이 있다. 이 경우, 기계는 데이터 레이블을 입력 받지 않아 어떻게 분류하는 것이 잘 분류하는 것임을 알 수 없기 때문에, 임의의 학습 결과를 출력하게 된다. 이 때, 교사는 그 결과에 대해 긍정적 혹은 부정적인 보상을 제공하며, 기계는 보상이 긍정적일 경우 과거의 학습 성향(결정 경계를 이동하는 방향)을 유지하게 되고, 보상이 부정적일 경우에는 과거의 학습 성향을 바꾸는 행동을 하게 된다. 강화 학습 방법은 교사 학습에 가까운 방법으로써, 현실 세계에서 이루어지는 학습법과 유사하다. 인간의 학습은 처음부터 어떤 판단이 최적의 결과를 만들어내는지 모르지만, 매번 판단에 대한 결과(예시 : 집에서 뛰어 놀 경우, 부모님에게 혼남)를 바탕으로 판단 규칙을 갱신하는 과정의 연속으로 생각할 수 있다.
3. 딥 러닝
딥 러닝은 앞서 언급한 학습 방법 중 비교사 학습의 형태로 볼 수 있다. 그 시작은 과거의 인공신경망 연구이다. 인공신경망은 계층화된 뉴런의 정보 처리 구조를 모방한 기술로, 다층 퍼셉트론(Multi-Layer Perceptron)이 대표적이다. 1980년대 후반, 처음 제안된 다층 퍼셉트론은 이론적으로 잘 정립되어 많은 사례들에 응용됐고, 학습 능력을 향상시키기 위해 구조적으로 퍼셉트론 계층을 늘려 심층(Deep) 네트워크를 구성하고자 하는 연구가 진행됐다. 하지만 당시 컴퓨터의 처리 속도의 제약과 학습에 필요한 데이터양의 절대적 부족으로 곧 한계에 부딪혔다.
20여 년이 지난 오늘날 CPU, GPU와 같은 하드웨어의 성능이 급성장하였고, 인터넷을 통해 전 세계에서 공유되고 있는 데이터의 양 또한 무척 방대해졌다. 이와 더불어, 캐나다 토론토 대학의 Geoffrey Hinton 교수는 2006년 심층 네트워크를 효율적으로 학습시키기 위한 방안으로 각 계층을 분할해 학습하는 ‘사전훈련(Pre-training)’ 기법[2]을 개발하였다. 이러한 시대적·기술적 변화에 힘입어 잊혀가던 인공신경망 기술은 딥 러닝이라는 이름으로 새롭게 부각됐다. 학습 능력을 더욱 일반화시킬 수 있도록 하는 ‘뉴런 제거(Drop-out)’ 기법과 대용량 계산을 보다 효율적으로 처리하는 고성능 컴퓨팅 기술 발전에 따라 작게는 딥 러닝, 크게는 기계학습의 부흥기를 맞이하고 있다.
딥 러닝으로 인한 성능 향상의 핵심은 바로 비교사 학습을 통한 데이터의 특징 학습에 있다. 지금까지 기계학습은 데이터에서 나온 판단 규칙을 학습하기 위해 ‘필요한 정보(특징)’를 전문가의 정의에 의존하였다. 예를 들어, 과거의 얼굴 인식의 경우, 전문가가 기계에게 얼굴 인식의 중요한 특징은 ‘피부색’, ‘얼굴의 윤곽선’, ‘눈의 모양’, ‘눈썹의 모양’ 등임을 사전에 정의해 주고, 기계는 이 특징들만을 이용해 학습하였다. 하지만 이러한 특징은 얼굴이 비스듬하거나 선글라스를 쓴 상황 등에서는 성능이 급격히 저하되는 것이 발견됐다. 전문가는 다시 이러한 상황에 유용한 특징을 새로 추가해 학습하고, 그 후에 또 다른 문제점이 발견하면 또다시 추가하는 과정을 반복하게 된다. 이처럼, 다양한 환경 하에서 얼굴 인식에 유용한 특징을 전문가가 모두 발견해 내는 것은 불가능에 가까운 일인데 딥 러닝 기술을 이용하면 얼굴 인식에 유용한 특징 자체, 즉, 비교사 학습의 목표인 데이터의 내부 구조를 기계가 이해할 수 있게 된다. 그 결과 기계는 전문가가 정의해 주었던 특징 외에도 유용한 특징을 자동적으로 학습할 수 있게 됐고, 이는 기존 방법의 인식 성능을 월등히 뛰어넘는 결과로 이어졌다.
4. 향후 방향
영상 인식, 자연어 처리, 음성 인식, 생물정보학 등 기계학습과 연관된 연구 분야에서는 딥 러닝을 이용해 기존의 한계를 극복하기 위한 연구가 활발히 진행 중이다. 오늘날의 딥 러닝으로 대표되는 기계학습 기술은 독립적으로 발전한 기술이 아니다. 기계학습의 기원 격인 인공신경망도 생물 물리학에서 시작됐으며, 이후의 여러 기계학습 기술들이 신경과학, 인지과학, 뇌공학 등 다양한 분야에서 영감을 얻어 발전했다. 이렇듯 앞으로의 기계학습 기술 역시 다양한 분야와의 융합을 통한 발전 흐름을 이어 갈 것으로 보인다.
글로벌 IT 기업들은 딥 러닝을 이용한 기술 연구에 막대한 예산을 투자하고 있으며, 국내 대표 IT기업들 또한 기계학습 관련 기술과 인력을 확보하기 위해 파격적인 행보를 이어 가고 있다. 현재까지 파악된 바로는 전 세계 약 2600여 개의 기업이 기계학습 기술을 핵심 원동력으로 삼고 있으며, 이를 기반으로 원천 기술 개발부터 의료, 금융, 교육, 군사 등의 다양한 산업 분야뿐만 아니라, 기계학습 기술을 응용한 미술, 음악 작곡 등 다양한 엔터테인먼트 분야까지 진출하고 있다[3].
다양한 학문 분야 전문가들이 예측하듯이, 기계학습, 구체적으로 딥 러닝은 향후 세상을 변화시키는 주류 기술이 될 것이 분명해 보인다. 국내 학계도, 한국정보과학회 인공지능소사이어티 산하에 머신러닝연구회가 설립되는 등 기계학습 분야에 대한 학술 활동은 더욱 활발해지고 있다.
이성환 본교 교수‧뇌공학과
사진출처│네이버 영화
참고문헌
[1] “Machine Learning,” Wikipedia, https://en.wikipedia.org/wiki/Machine_learning.
[2] G. Hinton, R. Salakhutdinov, “Reducing the Dimensionality of Data with Neural Networks,” Science, 2006.
[3] S. Zilis, “The Current State of Machine Intelligence,” Medium, 2014.
고대신문 news@kukey.com