구글이 기존 제미나이에서 수행했던 기능에 오디오와 이미지 생성 및 멀티모달 기능까지 수행할 수 있는 제미나이 2.0을 발표했습니다.
제미나이 2.0의 핵심 방향은 이용자를 대신해 작업할 수 있는 AI 봇인 에이전트 AI 시대를 겨냥한 것으로 이와 관련된 서비스도 함께 업데이트했습니다.
특히 이번 제미나이 2.0은 이용자 인터페이스 조작 및 멀티모달 추론, 장문맥 이해, 복잡한 명령어 추정, 복합함수 호출, 지연시간 등을 개선했습니다.
다만 구글은 제미나이 2.0을 공식 발표하면서 미리보기 모델인 제미나이 2.0 플래시라는 한 가지 버전만 공개했는데, 실험적인 버전이면서 성능은 뛰어나다고 설명했습니다.
더불어 텍스트나 음성뿐만 아니라 이미지, 동영상을 스마트 안경을 통해 대화하며 함께 작업을 진행할 수 있는 프로젝트 아트스타도 제미나이 2.0 기반으로 업데이트하고 소규모 그룹으로 테스트를 진행합니다.
여기에 크롬 브라이저에서 텍스트, 코드, 이미지, 양식 등 브라우저의 화면 정보를 이해하고 추론할 수 있는 프로젝트 마리너(Project Mariner)도 발표했습니다.
개발자를 위해 깃허브의 워크플로우에 직접 통합된 AI 코드 에이전트 줄스(Jules) 및 게임에서 3D 세계를 생성하는 AI 모델 지니2(Genie 2)도 공개했습니다.
구글은 제미나이 2.0을 발표하면서 개인정보보호 및 외부의 악의적인 지시를 식별하고 방지하도록 AI 에이전트의 안전과 보안에 신경썼다고 밝혔습니다.
구글은 제미나이 2.0에 앞서 2023년 12월 제미나이 1.0을 발표한 데 이어 지난 2월 멀티 모달 처리가 가능한 제미나이 1.5를 소개한 바 있습니다.