게임 역사의 한 획을 그은 네오지오나 플레이스테이션은 뛰어난 그래픽과 사운드로 게이머들의 눈과 귀를 즐겁게 했다. 저장 공간이 적었던 롬 대신 광학 디스크(CD)를 저장 매체로 활용해 표현력을 높일 수 있는 대용량 그래픽 데이터를 담을 수 있었다. 하지만 화려해진 게임 그래픽의 이면에는 대용량 데이터를 읽는 저장 장치의 느린 속도가 발목을 잡았다. 게임 데이터를 읽는 데 시간을 쓰다보니 게임의 흐름을 끊어놓기 일쑤였다. 결국 신형 플레이스테이션이나 XBOX 같은 콘솔 디바이스는 게임 데이터를 더 빨리 읽을 수 있는 하드디스크를 품기에 이르렀다.
이러한 빠른 저장 매체의 도입은 PC 분야라고 예외는 아니다. PC 업계는 용량을 늘리는 것과 별개로 속도를 높이기 위한 노력도 병행한 것이다. 플래터라는 물리적 자기 디스크를 빠르게 회전하며 저장하던 하드디스크에서 전기적 자극으로 신호를 기억하는 SSD로 바뀐 것도 이러한 이유다.
하지만 SSD도 앞으로 닥치게 될 PC 업계의 문제를 해결할 저장 매체로 보기는 힘든 것이 현실이다. 4K 해상도의 컨텐츠에서 나아가 8K 수준의 초고해상도까지 거론되는 상황에서 지금 보급되는 SSD만으로 저장 용량과 속도 문제를 해결할 수 있을지 의문인 상황이다. 이러한 의문을 가진 여러 기업들이 낸드 플래시를 겹겹히 쌓아 용량을 늘리는 한편, PCIe나 M.2 같은 더 빠른 인터페이스로 전송 속도를 끌어올린 SSD를 내놓으려 시도했다. 어느 정도 성과는 있지만, 집적도의 한계와 제조 방식이 비싼 근본적 문제를 벗어나긴 힘든 것을 알아챈 인텔은 마이크론과 함께 완전히 다른 새로운 형태의 저장 방식을 고안하기에 이른다.
‘3D XPoint(이하 크로스 포인트)’는 이런 답답한 상황 속에서 인텔이 제시한 첫 번째 해답이다. 인텔은 메모리 소자를 이용한다는 점은 같지만, 이전 낸드 플래시 방식과 완전히 다른 구조와 반도체 소재로 만들어 훨씬 빠르고 긴 수명을 보장하고, 설계 방법에 따라서 용량도 크게 늘릴 수 있다고 주장한다.
종전 낸드 플래시와 가장 다른 점은 얇은 금속 와이어를 차곡차곡 쌓아올린 구조다. 흔히 ‘적층 구조 방식’이라 부르는데, 캠프파이어를 위한 장작이나, 성냥개비를 쌓아 올린 모습을 상상하면 쉽다. 인텔은 이 기술이 낸드 플래시 대비 천 배 빠르고 긴 수명을 갖고 있으며 전통적인 메모리(D램)에 견줘 집적도가 열 배에 달한다고 설명한다.
인텔은 크로스포인트의 적층 구조 방식이 각 셀에 직접 접근할 수 있는 것을 장점으로 꼽았다. 아파트 층수와 호수만 알면 그 집을 찾아갈 수 있는 것과 비슷하다. 필요한 셀에 바로 접근하고, 데이터를 수정할 수 있다는 뜻이다. 필요한 부분만 건들일 수 있으니 접근 속도도 빠르고 수명이 길어지는 것은 당연하다.
이전 낸드플래시 메모리는 특정한 셀의 데이터를 수정하려면 한 블럭에 있는 셀을 모조리 지우고 새로 작성을 해야했다. 아파트를 예로 들자면 ‘201호를 리모델링 해야하니 2층 사람은 모두 나가세요’라는 것과 마찬가지다. 최소의 블럭 단위로 데이터를 쓰고 지우는 탓에 불필요한 수정이 빈번했고, 그만큼 접근 속도와 수명도 줄어들 수 밖에 없었다.
앞서 설명한 것처럼 적층 기술 자체가 새로운 것은 아니다. 낸드 플래시를 쌓아올려 용량을 확보한 제품은 앞서 발표된 바 있다. 다만 인텔은 16GB 수준의 큰 용량의 메모리를 양산 수준까지 끌어올렸고 낸드 플래시와 달리 새로운 소재로 트렌지스터를 제거해 넓은 공간을 확보했다. 그만큼 셀을 촘촘하게 밖아 넣을 수 있으니 이전 메모리보다 높은 집적도를 이룰 수 있던 것이다. 하지만 인텔은 새로운 소재에 대해 구체적으로 밝히길 꺼려했다.
인텔은 크로스포인트의 읽기와 쓰기 속도를 공개하지 않았다. 앞서 말했던 천 배의 속도는 접근 속도다. 폼팩터는 수많은 환경에 쓰일 것을 염두에 둔 만큼 상황에 따라서 바뀔 수 있다. 현실적으로 PCIe 인터페이스를 가장 먼저 쓰고, 프로세서와 통신은 SSD에서 쓰고 있는 NVMe를 채용할 것으로 보인다.
단지 이 기술의 효과를 최대로 끌어내려면 인터페이스의 변화도 예상해볼 수 있다. 아직 3D 크로스포인트 기술의 빠르기를 정확히 알 수 없지만, 기존 SSD의 10배 수준만 되더라도 한정된 전송 대역폭 탓에 제 성능을 모두 발휘할 수 없기 때문이다.
SSD는 이론상 1초에 CD 한 장 정도의 데이터를 전송한다. 그 10배 수준이라면 대략 CD 10장의 데이터가 한 번에 지나갈 대역폭이 필요한데, PCIe 3.0은 한 개 레인(x1)에 CD 한 장 반 수준에 불과하다. 물론 최고 16레인(x16)까지 쓸 수 있으니 문제 없을 것이라 생각하기 쉽지만 그리 간단하지 않다. 곧 출시되는 인텔의 차기 프로세서 스카이레이크 조차 최대 20레인의 PCIe만 동작하기 때문이다. 일반적으로 그래픽 카드가 16개 슬롯을 한 번에 쓰니 남는 것은 4레인 정도다. 크로스포인트가 PCIe 인터페이스를 이용하고, 4레인 이상의 대역폭을 쓰게 된다면 그래픽카드와 대역폭을 함께 나눠써야 하는 상황이 생기는 것이다.
물론 인텔 5820K, 혹은 5960X 등 최고급 라인 프로세서는 각각 28, 40레인의 PCIe 통로를 갖고 있다. 게다가 현재 출시된 대부분의 그래픽 카드는 PCIe 3.0 8레인 정도의 대역폭으로도 충분하다. 고급 프로세서를 얹어놓거나 SLI(두 개의 그래픽 카드를 꽂아 처리 능력을 높이는 것)를 쓰지 않는다면 크게 문제 되지 않을 수 있지만, PC 상황에 따라서 성능이 천차만별이라면 그다지 칭찬할 만한 상황은 만들어지지 않을 것이다. 게다가 이 계산은 크로스포인트가 10배라는 가정인데, 1,000배라는 숫자에 걸맞게 그 이상의 전송속도를 뿜어준다면 인터페이스부터 다시 고민해야할 상황이 생길 가능성이 높다.
이에 대해 인텔은 정확한 입장을 발표하진 않았지만, “국제 표준 기구와 함께 새로운 인터페이스를 고민하고 있고 소비자에게 불편을 주는 일은 없을 것” 정도로 말을 아꼈다. 정확히 어떤 형식으로 나올지 알 수 없어도 이런 문제를 인텔도 이미 파악했고, 새로운 무언가를 준비하고 있다고 생각하는 편이 좋을 것이다. 다행스럽게도 2017년 PCIe 4.0이 발표될 예정이다. 이것이 인텔이 말하는 새로운 인터페이스는 아니겠지만, 당분간은 기존 PCIe 슬롯만으로도 이전과 견줄수 없는 성능을 뽑아내 줄지 지켜봐야 할 부분이다.
인텔이 상상하는 마지막 모습은 그저 빠른 SSD를 그치는 게 아닐 것이다. 우리가 쓰는 D램(DDR램)을 넘어서는 무엇이지 않을까? 저장매체로 이용되는 비휘발성 메모리의 속도가 D램을 넘어선다면 현재 PC의 구조가 완전히 바뀔 가능성이 높다. 저장장치의 속도가 램만큼 빠르다면 램을 통하지 않고 프로세서가 저장장치의 데이터에 직접 접근해 처리하는 것이 훨씬 빠르기 때문이다. 더구나 보통 4GB, 많아야 32GB 수준의 메모리 용량에서 벗어날 수 있으니 PC의 구조 자체도 훨씬 간소화될 것이다.
크로스 포인트를 적용한 메모리는 이미 생산을 시작을 시작했다. 올해 말이 되면 인텔과 마이크론이 각각 독립적으로 제품을 생산할 예정이고 대규모 양산은 2016년부터 시작될 전망이다. 우리가 알고 있는 PC의 모습이 완전히 바뀌는 날이 멀지 않았다.
Pingback : 왠지 불편한 DMM.make와 신생 기업 UPQ의 콜라보레이션 | techG
Pingback : 왠지 불편한 DMM.make와 신생 기업 UPQ의 콜라보레이션 | MK Post