Google Gemini — 당신이 알아야 할 모든 것
Google은 챗봇이 여전히 Bard라고 불렸던 2023년 12월에 Gemini의 첫 번째 모델을 출시했습니다. 그 이후로 주요 검색 회사는 인공 지능과 관련된 거의 모든 활동에 Gemini라는 이름을 채택했습니다.
Chatbot Bard는 올해 초 단순히 Gemini가 되었습니다. 이는 곧 Android의 이전 어시스턴트를 대체하는 Gemini Assistant로 이어졌습니다. 회사는 또한 Docs 및 개발자를 위해 Gemini를 사용합니다.
처음 활동이 급증한 이후 Google의 상황은 둔화되는 것 같습니다. 이전과 마찬가지로 새로운 이름 대신 회사는 Gemini에 중점을 두고 이를 점점 더 많은 제품과 서비스에 추가했습니다.
그러다가 12월에 구글은 Gemini 2.0을 출시했습니다. Sundar Pichai CEO는 이번 출시를 에이전시 시대의 시작이라고 설명합니다. 이곳은 인공 지능 모델이 초기 지침 세트에 따라 작업을 수행하는 곳입니다.
#GoogleGemini #인공지능Gemini #GoogleAIGemini #Gemini2.0 #GeminiAssistant
원천: https://manualmentor.com/google-gemini-everything-you-need-to-know.html?utm_source=rss&utm_medium=rss&utm_campaign=google-gemini-everything-you-need-to-know
Google 처음으로 출시했다 쌍둥이자리 챗봇 이름이 여전히 Bard였던 2023년 12월 모델입니다. 그 이후로 검색 대기업은 AI와 관련된 거의 모든 작업에 점차적으로 Gemini라는 이름을 채택했습니다.
Bard 챗봇은 가장 먼저 추락하여 올해 초 단순히 Gemini가 되었습니다. 이는 곧 이어졌습니다. 쌍둥이자리 어시스턴트 Android의 이전 어시스턴트를 크게 대체합니다. 회사는 또한 Docs 및 개발자를 위해 Gemini를 사용합니다.
초기에 활발한 활동이 있은 후 Google에서는 상황이 느려지는 것처럼 보였습니다. 이전에 했던 것처럼 새 이름을 사용하는 대신 회사는 Gemini를 두 배로 늘려 더 많은 제품과 서비스에 추가했습니다.
그러다가 12월에 구글, Gemini 2.0 출시. 순다르 피차이(Sundar Pichai) CEO는 이 제품의 출시를 에이전트 시대(Agent Era)의 시작이라고 설명했습니다. AI 모델이 초기 지침 세트에 따라 사용자를 대신하여 작업을 수행하는 곳입니다.
쌍둥이자리란 무엇인가요?
Gemini 2.0 소개 | 현재까지 가장 유능한 AI 모델 – YouTube
Gemini 모델은 텍스트뿐만 아니라 이미지, 비디오, 오디오 및 컴퓨터 코드까지 처리할 수 있는 다중 모드 모델로 훈련되었습니다. 이는 다음과 유사합니다. 오픈AI의 GPT-4o와 Gemini 2부터는 이러한 방법도 출력할 수 있습니다.
Google의 일반적인 작동 모드에 따라 최신 버전의 모델은 지난 몇 달 동안 조용히 개발되었으며 ChatGPT와 같은 과장된 제품이 간과했던 일부 기능을 제공합니다.
예를 들어, 현재 다양한 언어와 용도를 포괄하는 Gemini on Hugging Face의 변형이 50,000개가 넘습니다.
불행하게도 이러한 다양성은 상당한 혼란을 야기했습니다. 최근 Gemini 출시가 급증하면서 상황이 더욱 악화되었으므로 이제 상황을 더 쉽게 이해할 수 있도록 Gemini 우주에 대한 명확한 지도를 배치해야 할 때라고 생각했습니다.
가장 먼저 깨달아야 할 점은 Google이 모델 기술과 애플리케이션을 동일한 이름의 변형으로 혼합하고 일치시키는 것을 좋아한다는 것입니다. 일단 명확해지면 다른 모든 것이 제자리에 들어가기 시작합니다.
1. 모델
그 시작은 2010년 런던에서 출범한 AI 연구소인 DeepMind였습니다. 이 전체 AI 산업의 초석은 LaMDA, PaLM, Gato AI 모델을 전 세계에 전달했습니다. Gemini는 이 세대 제품군의 최신 버전입니다.
Gemini 모델의 버전 1.0은 Ultra, Pro 및 Nano의 세 가지 버전으로 출시되었습니다. 이름에서 알 수 있듯이 모델은 고전력부터 휴대폰 및 기타 소형 장치에서 실행되도록 설계된 작은 버전까지 다양합니다.
후속 출시로 인한 혼란의 대부분은 검색과 AI 비즈니스 간의 Google의 철학적 싸움으로 인해 발생했습니다.
검색의 AI 식인풍습은 항상 회사의 머리 위에 걸려 있는 칼이었고, AI 제품 출시에 대한 ‘그들이 그럴 것인가, 그렇지 않을 것인가’라는 태도에 크게 기여해 왔습니다.
10개월 전에 출시된 Gemini 1.5는 전문가(MoE) 기술, 백만 개의 토큰 컨텍스트 창 및 새로운 아키텍처의 혼합을 통합하여 원래 모델을 점진적으로 개선한 것입니다. 그 이후로 우리는 Gemini 1.5 Flash, Gemini 1.5 Pro-002 및 Gemini 1.5 Flash-002가 출시되는 것을 보았습니다. 후자는 불과 3개월 전에 출시되었습니다.
동시에 회사는 무료 Gemma 제품을 출시하면서 개방형 모델 영역에도 놀라운 진출을 이루었습니다. 이러한 2B 및 7B 매개변수 모델은 다음에 대한 직접적인 반응으로 간주되었습니다. 메타의 Llama 모델 제품군이 출시되었습니다. Gemma 2.0은 5개월 후에 출시되었습니다.
제미니 2.0은 2024년 12월 출시돼 에이전트 시대의 모델로 평가받고 있다. 첫 번째로 출시된 버전은 구글 검색과 같은 도구 사용과 코드 생성을 위한 함수 호출을 지원하는 고성능 멀티모달 모델인 Gemini 2.0 Flash Experimental이었습니다.
몇 주 안에 회사는 현재 세대의 정식 버전인 Gemini 2.0 Experimental Advanced를 출시했습니다. 우리가 이렇게 말하는 이유는 현 시점에서 무엇이 완전하고 초기 코드가 무엇인지 실제로 확신할 수 있는 사람이 아무도 없기 때문입니다.
확실하게 말할 수 있는 것은 Gemini 2.0 Flash Experimental이 모든 면에서 매우 유능하고 성능이 뛰어난 AI 모델이라는 것입니다.
쌍둥이자리 모델
- Gemini 1 Ultra – 강력함
- Gemini 1 Pro – 중급
- Gemini 1 Nano – 소형
- Gemini 1.5 플래시 – 빠르고 저렴함
- Gemini 1.5 Pro – 더 느리고 더 비쌉니다.
- Gemini 2.0 플래시 실험적
- Gemini 2.0 플래시 사고
- Gemini 2.0 실험적 고급
젬마 모델(Gemmaverse)
- 젬마 1(2B, 7B 매개변수)
- Gemma 2(2B, 9B, 27B): 27B가 처음부터 훈련되었습니다.
- CodeGemma(2B 및 7B): 코드 생성을 위해 미세 조정되었습니다.
- RecurrentGemma(2B, 9B): Transformer 기반이 아닌 Griffin 기반입니다.
- PaliGemma 2(3B, 10B, 28B): 비전 모델은 텍스트 및 이미지 입력을 허용합니다. 다국어.
- DataGemma: 데이터 중심 모델
- GemmaScope: AI 연구 도구
2. 응용
Google은 연구 회사이자 제품 회사입니다. DeepMind와 Google AI가 연구를 주도하고 모델을 출시합니다. Google의 반대편에서는 이러한 모델을 가져와 제품에 적용합니다. 여기에는 하드웨어, 소프트웨어 및 서비스가 포함됩니다.
챗봇
챗봇은 다른 많은 기초 모델 공급업체와 마찬가지로 Google 애플리케이션 측면에서도 선두를 달리고 있습니다. 다시 말하지만, 검색해 보면 이름과 기능 측면에서 상황이 약간 모호해집니다.
쌍둥이자리 챗봇. 이는 Bard라고 불리며 Gemini 모델과 완전히 별개입니다. 10개월 전 Bard와 또 다른 Google 제품인 Duet AI가 Android 앱 출시와 함께 Gemini 브랜드로 통합되었습니다.
해당 조치에 따라 Gemini 채팅은 이제 Android Assistant를 포함한 더 많은 Google 제품에 통합되었습니다. 크롬 브라우저, Google 포토, Google Workspace.
이 글을 작성하는 시점에는 Gemini Chatbot과 레거시 Android Assistant가 최신 버전의 Android 휴대폰 운영 체제에서 이중 옵션으로 제공됩니다. Gemini Live는 OpenAI의 낮은 대기 시간, 고속 고급 음성 모드에 대한 Google의 대안으로 간주되며 가까운 시일 내에 Google Pixel 스마트폰 전체에 출시될 것으로 예상됩니다.
제품
챗봇으로서의 Gemini는 AI 애호가들로부터 대부분의 새로운 모델과 관심을 얻을 수 있지만, AI에 대한 대부분의 시선은 모바일의 Gemini에 쏠릴 것입니다.
이는 두 가지 형태로 제공됩니다. 먼저 iPhone 및 Android의 Gemini 앱을 통해, 그리고 Android 운영 체제와의 긴밀한 통합을 통해 제공됩니다.
Android 개발자는 기본 작업을 수행하기 위해 클라우드 기반 또는 비용이 많이 드는 모델을 사용할 필요 없이 자신의 앱에서 Gemini Nano 모델을 사용할 수도 있습니다.
깊은 통합을 통해 Gemini에서 시스템 기능을 실행할 수 있을 뿐만 아니라 AI 음성 비서인 Gemini Live를 사용하여 노래 등을 재생할 수 있습니다.
실험
최신 Gemini 모델 출시에는 새 모델과 관련된 일련의 주요 Google 애플리케이션 릴리스 또는 미리보기가 함께 제공되었습니다. 목록은 길고 인상적입니다. 그 중 일부는 다음과 같습니다:
- 프로젝트 아스트라(Project Astra): AI 비서를 위한 시각적 이해의 힘을 생생하게 보여줍니다.
- Project Mariner: 실제 사용 사례에 대한 다중 모드 AI의 강력한 쇼케이스
- NotebookLM: 연구 및 학습 애플리케이션을 위한 놀라운 새로운 패러다임
- 심층 연구: 심층 검색 능력과 거대한 맥락을 갖춘 매우 강력한 에이전트 연구 도구
3. 플랫폼
Gemini의 모바일 및 웹 기반 버전 외에도 일부 프리미엄 및 개발자 중심 제품이 있습니다. 이들은 일반적으로 Gemini Advanced의 Deep Research와 같은 가장 진보된 모델과 기능을 제공합니다.
- Gemini Advanced: AI 제품에 대한 Google의 정교한 구독 기반 게이트웨이입니다.
- Google Cloud: Google의 모든 기업 및 소비자 제품을 사용하는 만큼 비용을 지불하세요.
- AI Studio: Gemini AI 모델 범위를 테스트하고 평가할 수 있는 무료 AI 놀이터
- Vertex AI: Google Cloud 서비스의 일부로 통합된 AI 개발 플랫폼
- Google One: 소비자를 위한 구독 기반 클라우드 스토리지 서비스