뉴욕 대학 Gary Marcus가 와이어드에 기고한 글을 읽고

2019년 8월 14일 게리 마커스가 와이어드에 ‘DEEPMIND’S LOSSES AND THE FUTURE OF ARTIFICIAL INTELLIGENCE‘라는 글을 기고했다. 본 글은 이 기사를 읽고 정리한 입장이다.

게리 마커스는 뉴욕 대학의 심리학과 뇌 과학 교수이다. 그는 꾸준히 딥러닝 만의 방식으로는 우리가 생각하는 지능의 문제를 풀기 어려울 것이라는 비판적 입장을 고수했다. 사람들이 그렇게 하지 않기 때문이다. 이 기고문에서도 마지막에 나오듯이 아이는 훨씬 적은 에너지와 데이터를 갖고 언어를 습득하는 능력이 있기 때문이다.

그가 이번 글에서 지적하는 문제는 딥마인드의 경제적 측면에서 출발했지만 (작년에만 5억 달러 이상의 적자), 심층강화학습이라는 하나의 방법으로 모든 문제를 접근하고 있는 연구 방법론의 문제를 지적한다. 심층강화학습이 너무 과대 평가 되어 있을 수 있고, 이에 몰리는 돈으로 차라리 지능에 대한 다양한 접근과 방법에 투입되는 것이 낫다는 입장이다. 물론 알파벳의 매출 규모로 10억 달러 수준의 투자는 큰 투자 규모는 아니다. 힉스 보존을 발견한 LHC에 투입된 자금이 지금까지 100억 달러 정도로 본다면, 아직 AI에 투입된 돈이 거대한 규모는 아닐 수 있다는 점이다.

다만, 아직 실제 세계에 적용해서 의미있는 결과를 내놓지 못하는 여러 연구는 결국 또 한 번의 ‘AI 겨울’을 초래할 가능성이 있다 (나 역시 요즘 이런 우려가 생기고 있다. 80-90년 초까지 인공지능이 세상을 뒤집어 놓을 것이라는 열풍을 한 번 겪어 봐서 안다). 게리는 저커버그가 청문회에서 페이크 뉴스 문제를 AI로 풀겠다고 한 것에 대해서도 ‘못할 것’이라는 컬럼을 뉴욕타임스에 기고한 적이 있다.

심층강화학습 모델이 미래의 트랜지스터가 되기 보다는 그냥 널리 사용되는 도구는 되겠지만 세상을 바꾸지는 못할 것이라는 것이 그의 평가이다. 이미 우리는 왓슨 모델이 생각보다 범용적이지 못하다는 것을 확인했다.

범용 인공지능을 얘기하는 것은 쉽지만 구현하는 것은 너무 어려운 문제이다. 자율주행차, 의료 문제, 페이크 뉴스 등등은 여전히 도전적 과제일 뿐이다. 20-30만년 동안 진화한 사피엔스의 브레인은 그 만큼 능력이 출중하다. 개인적으로 이런 측면 때문에 유발 하라리 책을 읽으면 SF 소설 같게 느끼는 것이다.

마지막으로, 이제 슬슬 10여 년을 해보고 나서 딥러닝 등 현재 강력하게 지지받는 AI 모델의 실제 유용성에 대해 조심스러운 회의가 등장하는데, 우리는 이제 불타오르는 것 같아서 남들이 다른 방향을 달릴 때 가서야 여기가 아닌가벼? 할까봐 또 걱정된다.

엣지 컴퓨팅과 인공지능

엣지 컴퓨팅과 인공지능의 만남은 자연스러운 진화

인공지능 기술이 점차 컴퓨팅 엣지에 해당하는 기기에서 생성되는 데이터를 실시간으로 분석하고 이를 기반으로 인사이트를 얻는 데에 활용하는 방안이 떠오르면서 엣지 컴퓨팅과 인공지능의 연계가 큰 관심을 끌고 있다.
클라우드와 사물인터넷이 처음 만났을 때는 주류 모델은 중앙 집중적이었다. 많은 기기가 단순 모델로 데이터를 코어 데이터 분석 시스템에 공급하는 일이었기 때문이다. 그러나 이제 엣지로 지능이 이동하고 엣지에 있는 시스템에서 추론과 패턴 매칭을 위해 데이터를 빠르게 처리할 수 있게 되었다. 궁극적으로 스마트 사물인터넷 기기의 시스템이나 센서는 가장 최신 데이터에 기반 해서 내부 알고리듬을 적응하는 비지도 학습을 지원할 것이다.

이는 일단 엣지 기기의 하드웨어 특히 파워와 기능의 수준이 인공지능 알고리듬을 지원할 만큼 강력해졌고, 센서들도 아주 작지만 의미 있는 메모리와 처리 능력을 갖게 되었고, 중앙 서버로 데이터를 전송할 필요가 줄어 들었기 때문이다.
특히 4차 산업혁명 흐름에 따른 사물 인터넷 기반의 스마트 공장, 스마트 모빌리티, 스마트 홈, 스마트 시티 등이 비즈니스와 기술 전략의 최전방이나 중심에 놓이면서 엣지 컴퓨팅 기기와 시스템을 통한 데이터 스트리밍 분석은 전체 네트워크에서 발생하는 이벤트의 가시성과 인지 능력을 크게 발전시킬 것이다.

딜로이트의 특별 보고서에 따르면, 사물인터넷 기기가 점점 더 스마트해지면서, 머신 러닝을 통해 자동으로 스마트 센서와 기기가 생성하는 데이터에 있는 패턴을 확인하고 이상을 감지할 것이다 [1].
이런 정보에는 온도, 압력, 습도, 공기 질, 진동, 소리 등이 포함될 수 있다. 이를 통해 예상하지 못한 가동 중단 회피, 운영 효율의 증가, 새로운 제품과 서비스 제공, 위험 관리 향상을 이룰 수 있다.

트랙티카의 보고서에 따르면 인공 지능 엣지 기기는 출하량을 기준으로 2018년 1억 6140만 개에서 2025년에는 26억 개가 되어 그 잠재성이 광범위함을 얘기하고 있다 [2].
기기 볼륨을 기준으로 보면 모바일 폰, 스마트 스피커, PC/태블릿, 헤드 마운트 디스플레이, 자동 센서, 드론, 소비자용과 기업용 로봇, 보안 카메라 순서로 규모가 클 것으로 본다. 이 밖에도 웨어러블 헬스 센서, 빌딩이나 설비 센서, 그리고 도시를 포함한 설비 전반에 심어지는 센서의 네트워크 등이 엣지 기기의 영역에 들어간다.

그림 1 인공지능 엣지 기기별 출하량

그림 1 인공지능 엣지 기기별 출하량

인공지능과 엣지 컴퓨팅이 만나야 하는 이유는 클라우드 자체의 규모가 증가하면서 지나치게 중앙화되고, 규모의 경제와 자율적 서비스는 클라우드에 내재할 수 있는 문제를 해결하는 방향이기 때문이다. 특히 엣지에서 인공지능 기능에 대한 요구는 점점 커질 수밖에 없다. 다양한 컨텍스트에서 발생하는 데이터를 이해하기 위해서는 인프라, 데이터, 애플리케이션의 요구 다양성을 다룰 수 있는 많은 플레이어가 등장해야 한다.

엣지에서 인공지능 인프라를 구축하는데 초점을 맞추고 있는 ‘스윔 AI’의 CTO 사이몬 크로스비는 모든 제조 공장이 같은 장비를 사용하더라도 내용이 달라질 수 없고, 이에 따라 하나의 모델이 동작할 수 없다고 주장한다 [3].
때로는 엣지는 클라우드에 연결되지 않을 수도 있기 때문이다. 더군다나 학습이나 실시간 결정을 위해 다량의 데이터를 클라우드로 전송하는 것이 어려울 수도 있다.

RT 인사이츠에서는 엣지에서 인공지능으로 강화된 의사 결정이 갖는 장점은 다음과 같이 정리하고 있다 [4].

  • 엣지 기반의 인공지능은 매우 반응이 빠르다 – 전형적인 중앙화된 사물인터넷 모델보다 실시간에 가깝게 반응할 수 있으며, 대부분 인사이트가 같은 하드웨어나 기기 안에서 즉각적으로 전달되고 처리될 수 있다.
  • 엣지 기반 인공지능은 더 강화된 보안을 보장한다 – 데이터를 보내고 받는 과정은 위험에 노출될 수 있다. 엣지에서 처리를 이런 위험을 최소화할 수 있다.
  • 엣지 기반의 인공지능을 매우 유연하다 – 스마트 기기들이 에너지 관리에서 의료 모니터링 같은 산업에 특정한 또는 위치에 특정한 요구 조건을 지원할 수 있다.
  • 엣지 기반 인공지능은 운영하기 위해 고도의 이론이나 고급 기술을 필요로 하지 않는다 – 자체 내에서 해결하기 때문에 인공지능 기반 엣지 기기들은 유지하기 위해서 데이터 과학자나 인공지능 개발자까지 필요로 하지는 않는다.
  • 엣지 기반 인공지능은 더 뛰어나 고객 경험을 제공한다 – 위치 인지 서비스를 통한 즉응성을 가능하게 하거나, 지연이 생길 때 경로를 재구성함으로써 기업들이 고객으로부터 신뢰를 얻거나 친밀함을 갖게 만들 수 있다.

주요 클라우드 기업의 인공지능 엣지 서비스

여러 퍼블릭 클라우드 서비스 기업은 인공지능 기능을 클라우드 차원에서 제공하면서도 엣지 컴퓨팅 프레임워크에서 인공지능과 결합하는 방안을 제시하고 있다. 대표적으로 마이크로소프트는 인텔리전트 엣지라는 개념으로 일찌감치 이 영역에서 자사의 전략을 소개했다.
인텔리전트 엣지는 지속적으로 확장하는 커넥티드 시스템과 기기의 집합을 의미하며 이를 통해 최종 사용자와 가까운 곳에서 생성되는 데이터를 모으고 분석함을 가정한다 [5].
동시에 고객들에게 새로운 클래스의 분산되고 연결된 애플리케이션을 만들어 내는 능력을 제공하고자 한다.

이를 위해 애저 코그니티브 서비스 콘테이너에 대한 프리뷰를 2018년 11월에 발표했으며, 이를 통해 클라우드와 엣지를 모두 포함하는 인텔리전트 애플리케이션 제작이 가능하게 했다. 기존의 애저 코그니티브 서비스는 인공지능이나 데이터 과학 기술이나 지식을 직접 갖지 않더라도 객체 탐지, 시각 인식, 언어 이해 등의 인지 기능을 쉽게 애플리케이션에 추가할 수 있도록 한다. 이미 120만 명이 넘는 개발자들이 이를 활용했다.
이를 콘테이너로 제공하는 것은 소프트웨어나 애플리케이션이 패키지화되어 거의 수정없이 콘테이너 호스트에 채택될 수 있게 만드는 소프트웨어 배포를 위한 접근이다. 또한, 사용자들이 데이터가 어디에 있더라도 애저의 지능형 코그니티브 서비스를 사용할 수 있다는 의미이다. 이는 얼굴 인식, 문자인식, 텍스트 분석 등을 위해 콘텐트를 클라우드로 보내지 않아도 된다는 뜻이고, 인텔리전트 앱은 엣지에서나 애저에서 모두 더 큰 지속성을 갖고 이식이 되거나 확장될 수 있다는 것이다.

그림 2 마이크로소프트 애저의 지능형 엣지를 위한 컨테이너 서비스

그림 2 마이크로소프트 애저의 지능형 엣지를 위한 컨테이너 서비스

사용 예로는 사이어리(Psiori)는 의료용 실험실 보고서나 이미지를 엣지에서 바로 분석해 보험 청구를 자동화 하며, 어배네이드 (Avanade)는 새로운 지능형 엣지 애플리케이션을 만들어 먼 바다의 유전 시추선 등에서 네트워크 연결이 제약을 받을 때 사용할 수 있도록 했다.

아마존은 세이지메이커 네오를 2018년 ‘리인벤트(Re:Invent)’에서 발표하면서 머신 러닝 모델를 한 번 학습시키면 클라우드는 엣지에서 이를 동작하게 할 수 있는 기능을 발표했다 [6].
머신 러닝 모델을 다중의 하드웨어 플랫폼에 최적화는 일은 쉬운 일이 아니며, 특히 엣지 기기와 같이 컴퓨터 파워나 저장 공간에 제약을 갖는 기기에서는 더 도전적인 일이다. 더군다나 소프트웨어 차이가 생기면 모델과 기기와의 호환 문제 때문에 개발자들은 모델과 딱 맞는 기기에만 적용하고자 한다.

그림 3 아마존의 세이지메이커 네오 작동 방식

그림 3 아마존의 세이지메이커 네오 작동 방식

네오-AI는 이런 튜닝 문제를 해결해 다양한 플랫폼에서 텐서플로우, MXNet, 파이토치, ONNX, XGBoost 모델을 자동으로 최적화하고 이를 오리지널 모델보다 속도를 두 배 빠리게 한다고 주장한다. 특히 자원에 제약을 갖는 기기에서 복잡한 모델이 동작할 수 있도록 지원하기 때문에, 자율 주행차, 홈 보안, 비정상 판독 등의 영역에서 사용할 수 있다고 한다. 네오-AI는 현재 인텔, 엔비디아, ARM을 지원하며 곧 자이링스, 케이던스, 퀄컴 플랫폼을 지원할 예정이다.

네오-AI의 코어는 머신 러닝 컴파일러와 런타임 모듈이며 이는 LLVM이나 할라이드 (Halide) 기술을 기반으로 한다. 또한 워싱턴 대학에서 오픈 소스로 개발한 TVM과 트리라이트 (Treelite)를 사용하는데, TVM은 딥 러닝 모델을 컴파일하고 트리라이트는 의사 결정 트리 모델을 컴파일 한다.

네오는 아파치 소프트웨어 라이선스를 기반으로 네오-AI 프로젝트 방식의 오픈 소스 코드로 사용할 수 있다. 따라서 개발자와 하드웨어 공급업체가 애플리케이션 및 하드웨어 플랫폼을 사용자에 의해 지정하고 네오의 최적화 및 리소스 사용량 축소 기술을 활용할 수 있다.

구글은 지능형 기기를 위한 제품을 두 가지로 제공한다. 첫 번째는 ‘엣지 TPU’라는 하드웨어이고, 또 하나는 ‘클라우드 IoT 엣지’라는 소프트웨어 스택이다. 이를 통해 클라우드에서 머신 러닝 모델을 구축/학습한 다음, 엣지 TPU 하드웨어 가속기의 파워를 통해 클라우드 IoT 엣지 기기에서 모델을 동작하도록 한다 [7].

그림 4 구글의 클라우드 IoT 엣지 지원 환경

그림 4 구글의 클라우드 IoT 엣지 지원 환경

엣지 TPU는 구글이 만든 ASIC 칩으로 텐서플로우 라이트 ML 모델이 엣지에서 동작하도록 디자인 했다. 작은 면적에서 왓트 당 성능, 비용 당 성능에 최적화하게 디자인 했다고 한다. 이를 통해 클라우드에서 클라우드 TPU로 학습시킨 다음 엣지에서 매우 빠른 머신 러닝 추론을 할 수 있게 함으로써, 센서가 단지 데이터 수집기가 아닌 로컬, 실시간, 지능형 의사 결정을 할 수 있게 했다.

클라우드 IoT 엣지는 구글 클라우드의 데이터 처리와 머신 러닝 기능을 게이트웨이, 카메라 등의 최종 기기로 확장하는 소프트웨어로 이를 통해 사물인터넷 애플리케이션을 더 스마트하고 안전하고 신뢰할 수 있게 만들고자 한다. 클라우드 IoT 엣지는 안드로이드 씽즈나 리눅스 기반 기기에서 동작할 수 있으며, 주요 컴포넌트는 다음과 같다.

  • 게이트웨이 클래스 기기를 위한 런타임 – 최소 하나의 CPU를 갖고 엣지에서 얻은 데이터를 저장, 번역, 처리, 지능 유도 할 수 있으며, 나머지 클라우드 IoT 플랫폼과 상호 동작할 수 있다.
  • 엣지 ioT 코어 – 엣지 기기를 더 안전하게 클라우드에 연결하며, 클라우드 IoT 코어와 소프트웨어나 펌웨어 업데이트와 데이터 교환을 관리한다.
  • 텐서플로우 라이트 기반 엣지 ML 런타임 – 사전에 학습된 모델윽 사용해 로컬 머신 러닝 추론을 수행하며, 이를 통해 지연을 확실히 줄이고 엣지 기기의 융통성을 증진한다.

구글이 확보한 파트너들은 반도체 회사 NXP, ARM, 게이트웨이 기기 회사 액톤, 하팅, 히타치 밴태라, 넥스콤, 노키아, 그리고 엣지 컴퓨팅 기업인 애드링크 테크놀로지, 켈빈, 올리 엣지 애널리틱스, 스마트 캣치, 트랙스 등이 있다.

참고 자료

[1] Deloitte Insights, “Intelligent IoT: Bring the power of AI to the Internet of Things,” Dec 12, 2017

[2] Tractica, “Artificial Intelligence Edge Device Shipments to Reach 2.6 Billion Units Annually by 2025,” Sep 13, 2018′

[3] Forbes, “Why AI At The Edge Is The Next Goldmine,” Apr 4, 2018

[4] RT Insights, “The Emerging Role of AI in Edge Computing,” Nov 27, 2018

[5] Eric Boyd, “Bringing AI to the edge,” Microsoft Azure blog, Nov 14, 2018

[6] Amazon, “AWS launches open source Noe-AI project to accelerate ML deployments on edge devices,” Jan 23, 2019

[7] Google Cloud Blog, “Bring intelligence to the edge with Clout IoT,” Jul 26, 2018

본 글은 한국정보화진흥원의 지원을 받아 작성되었으며, 클라우드스토어 씨앗 이슈리포트에 동시 게재합니다.

2018 ‘AI 인덱스’ 보고서가 제시하는 주요 의미 (KISA REPORT 2019년 2월)

AI 인덱스 보고서란?

2017년 12월에 필자가 작성한 KISA 리포트의 주제는 ‘2017년 AI 인덱스의 의미’였다. 당시 이 인덱스 보고서에 대한 설명을 다음과 같이 했다.

“스탠포드의 인공지능 100년 연구의 한 프로젝트로 시작한 ‘AI 인덱스’ 프로젝트는 개방된 방식의 비영리 과제로 인공지능 관련 활동과 진보를 추적하기 위한 과제이다. 또한 이 과제를 위해 수집한 모든 데이터는 ‘aiindex.org’ 사이트에 공개해 다른 사람도 추가 데이터를 제공하거나, 모인 데이터를 분석하고, 어떤 주제를 추적하기 원하는지 주고받을 수 있는 더 큰 규모의 커뮤니티 구성 프로젝트이다.”

2018년에도 12월에 보고서가 나왔다. 그러나 2018년 보고서는 AI100 산하의 프로젝트에서 독립해서 스탠포드 대학의 ‘인간 중심 인공지능 연구소 (HAI)’가 주관하는 노력으로 변화했으며, AI100와 HAI의 공동 협력으로 수행했다.
이번 보고서를 작성한 전문가들은 하버드, MIT, 스탠포드, 오픈AI, PAI (인공지능 파트너십) 소속 전문가들이며, 보고서의 미션은 마찬가지로 인공 지능과 관련된 데이터를 추적, 수집, 정제하며, 시각화 하는 노력이며, 정책 입안자, 연구자, 임원, 저널리스트 등과 대중이 데이터와 분석에 대한 광범위한 자원을 갖고 인공지능이라는 복잡한 영역에 대한 직관을 갖게 하는 것이다.
보고서는 아래와 같이 4개 부분으로 이루어져 있다.

    1. 활동량과 기술적 성과에 대한 데이터
    2. 최근 정부 정책들, 파생 측정 지표와 인간 수준에 도달한 다양한 성과 등 추가 지표
    3. 우리가 무엇을 놓치고 있는가에 대한 토의
    4. 부록

양적 데이터에 해당하는 것은 활동 규모를 측정하는 학계, 기업, 기업가, 일반 대중에 의한 인공지능 활동과 참여 수준을 의미한다. 학부 학생이 인공지능 수업에 얼마나 참여하는지, 인공지능 직업에 도전하는 여성 지원자의 비중, 인공지능 스타트업에 대한 벤처 캐피털의 투자 규모 성장 등이 대표적인 지표들이다.
기술 성과 지표는 시간에 따른 인공지능 성능의 개선 변화에 초점을 맞췄다. 질의 응답 수준, 개체 확인을 위한 학습 속도 등을 측정한 결과이다.
2018년 인덱스는 전 년보다 각 나라 수준의 변화와 지표를 측정했다. 로봇 설치 대수나 인공지능 컨퍼런스 참가자 수, 특허, 로봇 운영 체제 다운로드, 대규모 객체 파악 성능 수준을 비교하는 COCO 리더보드 같은 지표도 추가했다.
다음 절부터 주요 측정 데이터와 확인된 변화를 하나씩 살펴보도록 하자.

2018년의 주요 지표들 – 연구 분야

인공지능 관련 논문 발표는 ‘스코퍼스(Scopus)’ 를 통해 확인된 결과 1996년 기준으로 8배 이상 증가했으며, 이는 컴퓨터 사이언스 논문 증가 (약 6배), 모든 논문 증가에 비해 급속한 성장이다. 흥미로운 점은 유럽이 전체 28%로 가장 많은 비중을 차지하고 있고, 중국은 2007년에서 2017년 사이 150%가 증가해 25% 비중을, 미국이 17%를 차지했다. 그러나 인용 지수로 보면 미국 저자들이 글로벌 평균보다 83% 더 많이 인용되고 있다.
영역 별로는 머신 러닝과 확률 추론, 뉴럴 네트워크, 컴퓨터 비전, 검색과 최적화, 자연어 처리와 지식 표현 등의 순서이다. 2010년 이후 아카이브(arXiv)에 올라온 공개된 논문을 범주 별로 보면 컴퓨터 비전과 패턴 인식이 가장 많은 비중을 차지하고 그 다음이 머신 러닝이며 컴퓨테이션과 언어 비중의 증가가 눈에 띈다. 이 얘기는 언어 지능 문제에 도전하는 연구가 많아지고 있다는 추세를 말하고 있다.
글로벌 연구 활동과 비교하는 상대 활동 인덱스를 미국, 유럽, 중국에 대해 확인한 결과는 재미 있는 동향을 보인다. 미국이 인문학과 의료 부분이 강한 것에 비해 (유럽도 유사한 동향), 중국은 공학 분야와 농업 과학 쪽의 상대 인덱스가 크게 나온다. 즉 세계 평균을 1로 놓았을 때, 1보다 큰 수는 다른 나라에 비해 더 많은 연구가 이루어지고 있음을 말한다.

그림 1 각 국가별 상대적 활동 인덱스

그림 1 각 국가별 상대적 활동 인덱스

논문 출간자의 소속을 기준으로 하면 중국과 유럽은 정부 관계 기관 소속이 많지만, 미국은 기업이 높은 비중을 차지한다. 2017년 기준으로 미국의 기업에서 나온 인공지능 논문은 중국의 6.6배에 달한다.
2018년 미국 인공지능 학회에 제출한 논문과 채택된 논문의 비중을 보면 제출 논문의 70%, 채택 논문의 67%가 미국과 중국에서 나온 논문들이다. 한국은 60개 제출에 14개가 채택된 나라로 이스라엘과 이태리보다 약간 많은 수준이다.
작년 보고서에서도 언급된 상황이지만, 2017년에는 2012년에 비해 머신 러닝 개론 과목을 수강하는 학생이 5배 늘었다. 특히 인공지능과 머신 러닝을 포함하면 중국의 칭화대학은 16배로 급증했다. 이를 가르칠 수 있는 교수 요원의 확보는 이제 각 나라 주요 대학의 큰 과제이다. 왜냐하면 점점 더 많은 교수 요원이 기업으로 옮기거나 창업을 하고 있기 때문이다.

2018년의 주요 지표들 – 산업 분야

샌드 힐 이코노메트릭스 자료에 따르면, 2015년 1월부터 2018년 1월까지 활동하는 미국 내의 인공지능 스타트업은 113% 늘었다. 타 분야가 28% 증가한 것에 비해 매우 큰 차이를 보이는데, 이는 2013년부터 2017년까지 인공지능 분야에 대한 벤처 캐피털 투자가 350% 증가한 것의 결과일 수 있다.

그림 2 인공지능 스타트업의 증가

그림 2 인공지능 스타트업의 증가

인공지능 인력에 대한 수요 증가 역시 눈에 띄게 변했는데, 몬스터닷컴에 올라온 일자리 증가를 보면 수요 자체는 머신 러닝 기술과 딥러닝이 주도했으며, 성장을 보면 딥러닝의 증가는 2015년에 비해 30배 이상 늘어났다. 그러나 데이터를 보면 여전히 71%의 지망자는 남성이라는 통계가 나온다.

그림 3 AI 기술자 영역별 구인 증가 추세

그림 3 AI 기술자 영역별 구인 증가 추세

이번 보고서에 새로 등장한 지표는 매킨지가 2천여 명에 대한 서베이 조사로 얻은 자료로, 분야별 각 지역의 역량 수준 비교인데, 아직은 북미, 유럽, 아시아 태평양 지역 별로 크게 다른 모습을 보이지는 않는다. 다만, 가장 역량을 갖추었다는 분야가 로봇 자동화, 컴퓨터 비전, 머신 러닝, 그리고 물리적 로봇공학 분야이다.
인공지능 기술 도입에서 산업별 영역별을 통해서 보면 통신의 서비스 운영, 하이테크의 제품/서비스 개발, 리테일의 마케팅/세일즈 등이 가장 많이 인공지능 기술이 도입되어 있는 분야로 나타난다.
공공 관심 수준을 정량화 한 지표도 발표되었는데, 요약하면 다음과 같다.

  • 미디어에서 인공지능에 대한 언급은 2016년부터 2018년까지 긍정적인 글이 1.5배 나타나 과거에 비해 바뀐 흐름을 알 수 있다.
  • 미국, 캐나다, 영국 의회에서 머신 러닝이나 인공지능에 대한 언급이 2016년 이후 급격히 증가했다. 이는 정책이나 법률 담당자들의 관심이 크게 늘어난 것으로 볼 수 있다.

주요 기술 성과들

2018년에 확인한 주요 기술 지표들을 시각, 언어 처리 등의 분야 별로 여러 챌린지나 성능 확인이 가능한 연구 결과를 통해서 정리하면 다음과 같다. 그러나 전체 기술 성과를 총 망라하지 못하고 있으며, 분야별 기술에 대한 정리가 아직 많이 부족한 상황이다.

  • 객체 인식의 표준으로 활용되고 있는 이미지넷의 학습 시간은 2017년 6월과 2018년 11월을 비교하면 16배 빨라졌다.
  • 구 구조 구문분석 (constituency parsing) 성능은 2003년에 비해 10% 증가했다.
  • 기계 번역에서 영어를 독일어로 번역한 BLEU 점수 는 2008년에 비해 3.5배 향상되었다.
  • 알렌 인공지능 연구소에서 발표한 자료에 따르면, 질의 응답을 위한 ARC (AI2 추론 챌린지) 기준으로 쉬운 셋에서는 2018년 4월 63%에서 2018년 11월 69%로 향상되었고, 도전 셋에서는 27%에서 42%로 크게 개선되었다.
  • 질의 응답의 또 다른 벤치마크인 GLUE 에서는 80% 수준의 정확도 점수를 얻었는데, 현재 비전문가 인간 수준을 90% 정도 수준으로 판단하고 있다.

기타 다른 지표와 보고서에 언급된 내용

‘AI 인덱스’가 기본적으로 정량적 지표를 측정해 전 세계 인공지능 연구 수준과 산업 현황, 기술 성과를 파악하자는 의미이기 때문에 지속적으로 같은 지표를 통해 발전을 확인하는 것이 가장 핵심이다.
그러나 산업계의 변화 흐름이나 정부 정책의 중요성 역시 확인할 필요가 있으며, 이에 따라 2018년 보고서에서는 주요 국가의 정부 정책 수립 현황이 정리되어 있다. 특히 미국 보다 유럽의 다양한 협력과 보고서, 프로그램 채택 내용과 중국의 움직임을 정리했다는 것이 그동안 미국 중심의 보고서에서 탈피하고자 하는 노력으로 보인다.
유럽에서 발간된 2018년 4월 ‘인공지능을 위한 협력 선언’, 유럽 집행부의 ‘인공지능 커뮤니케이션’, 그리고 ‘호라이즌 2020’ 프로그램에서 향후 10년 동안 200억 유로를 인공지능 연구에 투자한다는 내용을 언급했다. 6월에는 유럽집행부가 제안한 ‘디지털 유럽’ 프로그램에 인공지능 기술 발전과 활용이 강조되어 있음을 언급한다.
또 다른 흥미를 끄는 국가 정책으로는 미국 DARPA의 ‘AI 넥스트’ 프로그램으로 20억 달러 이상을 인공지능 기술 한계를 넘어서기 위해 집행한다는 것과 미 하원의 정보 기술 소위원회가 발표한 백서 ‘기계의 부상: 인공지능이 미국 정책에 미치는 영향 증가’가 관심을 끈다.
이번 보고서에 새로 등장한 것은 인간 수준에 도달한 인공지능 기술의 다양한 성과를 정리하기 시작했다. 2018년에 확인한 것들은 다음과 같다.

  • 중국어 – 영어 번역: 마이크로소프트 기계 번역 시스템
  • 딥마인드의 퀘이크 III 아레나 ‘깃발 뺏기 (Capture the Flag)’
  • 오픈AI 팀이 ‘도타 2’에서 아마추어 인간 팀을 이긴 사례 (일부 제약)
  • 구글 딥 러닝 시스템이 전립선 암 판정 정확도를 70% 수준으로 올려, 인간 수준 61%를 넘긴 것

이는 앞으로도 매우 다양한 영역에서 발표되고 검증될 것이며, 인공지능 기술 성장 평가에서 아주 흥미로운 결과 리스트가 될 것이다.

아직 부족한 부분

‘AI 인덱스’ 보고서가 계속 진화하지만 인공지능 전 분야의 상태를 정확히 파악하기에는 아직 부족하거나 더 추가해야 하는 요소들이 많이 남아 있다. 인공지능 전문가들이 말하는 추가해야 하는 부분은 다음과 같다.

  • 상식 추론과 자연어 이해 – 대화를 유지하기 위한 깊이 있는 자연어 이해는 아직 도전 영역이다. 대화 기반 인공지능 시스템의 역량을 측정하고 상식 추론을 위한 지표 개발이 필요하다.
  • 인간과의 협력 수준 평가
  • 인공지능 요소를 갖는 로봇
  • 정부 예산 지출과 군사적 목적에 대한 파악

그러나 이런 분야를 모두 확인하고 평가하기 위해서는 보다 객관적인 데이터, 성과에 대한 표준 평가, 상호 검증을 위한 노력이 같이 이루어져야 한다.
국내에서도 우리 수준을 단지 전문가들의 주관적 평가가 아닌 실증 데이터와 객관적 지표를 통한 평가 분석을 위한 노력이 있어야 하며, 이를 위한 공공의 협력과 지원이 필요하다. 다행히도 지난 2018년 12월 10일 정보화진흥원(NIA)에서 나온 보고서 ‘데이터로 측정하는 우리나라 인공지능 분야 수준’은 2017년 ‘AI 인덱스’ 보고서에서 제시한 지표를 갖고 현재 우리 수준을 평가한 보고서이다. 이런 노력이 매년 지속적으로 이루어질 수 있어야 의미를 갖는다고 본다.