Home > #새소식 > 단일 GPU에서 실행 가능한 대규모 언어 모델 공개한 메타

단일 GPU에서 실행 가능한 대규모 언어 모델 공개한 메타

훨씬 적은 매개 변수에도 오픈AI의 GPT-3 모델을 능가한다고 주장한 새로운 AI 기반 대규모 언어 모델(LLM)인 LLaMA를 메타가 발표했습니다.

ChatGPT 기반 모델인 오픈AI의 GPT-3는 1,750억 개의 파라미터가 있는 반면, 메타 LLaMA 언어 모델은 최소 70억 개에서 최대 650억 개의 파라미터로 구성됐습니다.

패러미터 규모에 따라 LLaMA-7B, LLaMA-13B, LLaMA-33B, LLaMA-65B 등 4가지 모델로 나뉘는데, 메타는 GPT-3보다 10배 더 작은 LLaMA-13B가 더 나은 결과를 보였다고 주장했습니다.

메타는 LLaMA 모델이 향후 이 기술을 기반으로 구축되는 더 정교한 AI 모델의 기초를 형성할 것이라는 의미에서 ‘기본 모델’이라 부릅니다.

더 작은 크기의 AI 훈련 모델은 PC나 스마트폰 같은 장치에서 인터넷 연결 없이 ChatGPT 유형의 어시스턴트를 실행할 수 있고 축소 모델은 깃허브를 통해 배포됩니다.

다만 전체 코드 및 가중치 데이터는 접근 권한을 요청한 연구원에게만 제공됩니다.

Editor_B
글쓴이 | Editor_B
언제나 기분 좋은 소식을 전하고 싶습니다.

news@techg.kr
You may also like
미군용 XR 헤드셋 개발 위해 메타와 손잡은 안두릴
차기 퀘스트 헤드셋 운영체제에 새로운 그래픽 인터페이스 적용 예정
2026년 레이밴 스마트 안경에 안면 인식 및 슈퍼 센싱 탑재하려는 메타
퀘스트 앱 구독 서비스 이름을 퀘스트 플러스에서 호라이즌 플러스로 변경

Leave a Reply

error: Content is protected !!