Home > #기획 #칼럼 > [IFA2017] 화웨이 기린 970, 인공지능 모바일 AP로 달아나는 화웨이

[IFA2017] 화웨이 기린 970, 인공지능 모바일 AP로 달아나는 화웨이

t_IFA2017_Kirin_970_03IFA에서 늘 새로운 모바일 제품을 발표했던 화웨이가 이번 만큼은 제품 공개 행사를 진행하지 않기로 하면서 조금 실망했던 것은 사실이다. 하지만 화웨이가 제품 공개 행사 대신 고른, 9월 2일 IFA 키노트는 CES나 그 밖의 행사에서 화웨이의 이름을 걸었던 키노트보다 훨씬 중요한 내용이 들어 있었다. 화웨이가 스마트폰의 핵심이 되는 새로운 프로세서를 발표했기 때문이다.

이야기를 계속 잇기에 앞서 혹시나 싶은 노파심에 한마디 하자면, 화웨이의 모바일 프로세서는 갑자기 툭 튀어나온 것은 아니다. 우리나라에서 화웨이의 모바일 프로세서를 채택해 생산하는 스마트폰이나 스마트 장치가 거의 없는 까닭에 관심 밖이었겠지만, 화웨이는 지난 몇 년 동안 모바일 프로세서에 상당한 투자를 해온 업체다. 퀄컴 스냅드래곤, 삼성 엑시노스, 미디어텍 헬리오에 비해 우리나라에서 상대적으로 덜 알려졌을 뿐, 화웨이 스마트폰에 꾸준히 탑재되면서 자체 경쟁력을 끌어올리는 데 적지 않은 공을 세워왔다.

기린 970의 다이어그램. NPU의 구성이 이채롭다

기린 970의 다이어그램. NPU의 구성이 이채롭다

IFA 키노트에서 리차드 위 컨슈머 부문 사장이 손에 든 모바일 프로세서의 이름은 ‘기린 970′(Kirin 970)이다. 이 프로세서가 다른 모바일 프로세서보다 더 빠른 처리 능력과 더 발전된 미세 공정과 더 나은 전력 효율성 등 비교 우위를 자랑했다면 아마도 주목도는 떨어졌을 것이다. 이 프로세서가 관심을 받은 데는 딱 하나의 전환점으로 삼을 만한 요소를 다른 프로세서보다 먼저 넣어서다. 인공지능의 추론을 위한 신경 처리 프로세서, NPU(Neural Processing Unit)를 통합한 첫 프로세서다.

물론 기린 970 안에는 CPU와 GPU가 들어 있다. CPU는 4개의 코어텍스 A73과 A53으로 이뤄진 빅리틀 구조의 옥타 코어로 구성했고, 말리 G72 기반 12코어 GPU를 담았다. 여기에 NPU라 부르는 새로운 처리 유닛을 더해 10nm 공정으로 TSMC에서 생산한다.

NPU에 의한 성능 차이. 이미지 인식 속도에서  최대 25배까지 벌어진다고 화웨이는 주장한다.

NPU에 의한 성능 차이. CPU보다 성능에서 최대 25배, 효율성에서 50배의 효율성을 보인다고 화웨이는 주장한다.

명령에 의해 순차적으로 데이터를 처리하는 CPU나 다중 명령으로 데이터를 동시 처리하는 GPU와 달리 NPU는 다중 행렬 곱셈 계산을 효율적으로 처리하기 위한 유닛이다. 보통 직접 데이터를 입력하지 않고 인공 지능이 사물이나 상황을 이해하려면 기존의 방대한 데이터를 통해 신경망 훈련(Training)을 거치게 되고, 이를 기반으로 새로운 데이터가 입력되면 그것이 무엇을 의미하는지 추론(Inferencing)을 한다. 인공 지능의 추론을 위한 다중 행렬 곱셈 계산은 지금까지 병렬로 처리하던 GPU를 활용해왔지만, 행렬 곱셈 계산에 최적화된 코어가 아니기 때문에 이를 더 빨리 처리하기 위한 전용 코어를 만들어왔다. 구글의 텐서 프로세싱 유닛(TPU)나 엔비디아의 볼타 아키텍처에 텐서 코어를 추가함으로써 추론을 가속함으로써 인공지능이 좀더 사물이나 상황을 더 빠르게 인식할 수 있도록 만든다.

화웨이 기린 970의 NPU가 바로 추론을 위한 가속 코어로, 모바일 프로세서에 가속 코어를 적용한 것은 처음이다. 물론 지금까지 퀄컴이나 삼성에서 인공 지능에 활용할 수 있다고 밝힌 모바일 프로세서는 이러한 추론을 위한 가속 코어를 내장하지 않고, 개발 도구를 통해 응용 프로그램을 개발할 수 있는 수준에 머물러 있는 반면, 화웨이는 중국 AI 업체인 캠브리콘 테크놀로지(Cambricon Technology)의 지적 재산을 라이센스 받아 기린 970에 탑재했다.

t_IFA2017_Kirin_970_02기린 970의 NPU 성능은 1.92테라플롭스(TFLOPS, FLOPS는 초당 부동 소수점 처리량)의 성능을 가진다. 종전 기린 960의 GPU로 처리할 때 0.6테라플롭스였던 점을 감안하면 3배 이상 가속된 것이다. 이를 활용하는 썬더소프트의 이미지 인식 처리 소프트웨어를 활용한 테스트에서 화웨이는 분당 2000장 이상의 이미지를 인식하고 판단할 수 있다는 결과를 공개했다. 단지 화웨이는 NPU 내의 들어 있는 코어 수와 같은 자세한 구성에 대해선 말하지 않았지만, CPU와 GPU가 차지한 다이의 범위 만큼 많은 면적을 차지하는 모양새다.

기린 970처럼 모바일 프로세서에 추론 가속을 위한 처리 유닛이 포함되면 상황을 인식해 처리하는 지능형 소프트웨어가 네트워크에 의지하지 않고 장치 단위에서 즉시 처리할 수 있기 때문에 이용자는 더 빨리 원하는 결과를 받을 수 있다. 스마트폰 이미지의 분류, 음성 명령의 처리, 이용자의 신원 확인 같은 보안, 사물 인식을 통한 검색, 실시간 언어 번역, 사진 처리 등 다채로운 지능형 작업들을 네트워크를 거쳐 클라우드의 도움을 받지 않고 곧바로 단말에서 처리할 수 있으므로 훨씬 효율적으로 이용할 수 있다. 이 밖에도 스마트폰에서 앱 작업에 필요한 작업 스케줄링, 로드 밸런싱, 메모리 할당, 실시간 페인팅, UI 렌더링, 그래픽 처리에도 활용 하면 성능 조정과 배터리 효율을 개선하는 데에도 도움이 된다.

뒤쪽에 있는 태블릿에 재생되는 이미지나 사진을 앞쪽 보드에서 실시간으로 인식한다.

뒤쪽에 있는 태블릿에 재생되는 이미지나 사진을 앞쪽 보드에서 실시간으로 인식한다.

물론 NPU의 활용을 위해서 이를 기반으로 하는 응용 프로그램의 개발은 필요하기에, 화웨이 리차드 유 CEO는 IFA 키노트에서 기린 970이 개방된 AI 생태계를 지원할 것이라고 설명했다. 텐서 플로/라이트, 카페/카페2 같은 추론 API들을 지원하고 기린 AI API 뿐만 아니라 안드로이드 NN 같은 표준을 이용해 다른 앱에서 사용할 수 있도록 한다는 것이다.

이처럼 NPU를 통합해 지능형 프로세서의 기능성을 높인 기린 970은 단순히 시제품으로만 존재하는게 아니라 이를 탑재한 스마트폰도 곧 출시된다. 그것이 10월 16일에 공개되는 메이트 10이다. 이 스마트폰은 기린 970이 갖고 있는 NPU에 의해 주목을 받게 됐지만, 한편으로 기린 970의 탑재가 화웨이 플래그십의 경쟁력을 상징적으로 보여줄 것임을 일찌감치 증명한 셈이 됐다. 중요한 것은 지능형 모바일 프로세서의 이른 채택을 결정한 화웨이가 다른 스마트폰 제조사보다 한발 앞선 모양새가 됐다는 점이다. 애플, 삼성, 퀄컴… 이제 긴장이 좀 되려나 모르겠나.

CHiTSOL
글쓴이 | 칫솔(PHILSIK CHOI)

직접 보고 듣고 써보고 즐겼던 경험을 이야기하겠습니다.
chitsol@techg.kr
You may also like
[IFA2017 돌아보기] 삼성 부스의 유일한 혁신, 크리에이티브스퀘어의 스타트업 제품들
깔끔한 확장성 엘가토 썬더볼트 3 도크, 비싼 가격을 잊게 하다
[IFA2017 돌아보기] 세상의 소음을 지우는 소니 노이즈 캔슬링 헤드폰들
[IFA2017] 진짜 시작된 마이크로소프트의 복합 현실