현재 인공 지능 시장 (AI)에서 Deepseek- 중국의 젊은 AI 회사는 놀라운 혁신으로 기술 산업의 관심을 끌고 있습니다. 1 년이 넘는 설립 후 DeepSeek은 비용과 자원이 상당히 낮아 세계 최고의 제품과 직접 경쟁 할 수있는 고급 AI 모델을 개발했습니다.
DeepSeek은 OpenAI 및 인류 제품과 동등한 텍스트를 처리 할 수 있지만 훈련 비용이 훨씬 낮은 강력하고 우수한 언어 모델 인 DeepSeek V3 모델을 출시했습니다. 특히 DeepSeek은 간소화되고 창의적인 접근 방식을 사용하여 제한된 자원으로 인상적인 성능을 달성 할 수 있도록 도와줍니다.
그뿐만 아니라 DeepSeek은 논리적 작업을 위해 특별히 설계된 R1 모델을 시작하여 단계별로 문제를 해결하여 미국 주요 모델과 경쟁을 시작했습니다. Deepseek의 빠른 발전으로 연구자들은 흥분했을뿐만 아니라 기술 투자자, 특히 NVIDIA에도 영향을 미쳤습니다.
DeepSeek은 계산 전력을 절약하기 위해 “스파스 활성화”기술과 같은 모델 개발에 현명한 개선을 적용했습니다. 또한 컴퓨터 메모리에서 정보를 스토리지 및 검색하여 모델이 더 낮은 비용으로 효과적으로 작동하도록 도와줍니다.
DeepSeek의 인기는 회사가 무료 MIT 라이센스에 따라 모델과 알고리즘을 출시 할 때 글로벌 AI 연구 커뮤니티에 새로운 기회를 제공합니다. 이를 통해 누구나 쉽게 접근 할 수 있으며 개인 및 소규모 조직 이이 분야에 참여할 수있는 문을 열게됩니다.
마지막으로, Deepseek은 레이스에 여전히 많은 놀라움이 있음을 증명했으며, 아무도 미래에 선도적 인 위치를 보장 할 수 없다는 것을 증명했습니다. DeepSeek의 도착은 AI가 배치되고 사용되는 방식을 바꾸어 도전적이고 새로운 기회로 업계에 업계를 가져옵니다.
Openai, Google Deepmind 또는 Anthropic과 같은 인기있는 이름으로 지배되는 인공 지능 시장 (AI)에서는 중국의 젊은 AI 회사 인 Deepseek의 모습으로 인해 전체 산업이 흔들렸다. DeepSeek은 설립 후 1 년 만에 세계 최고의 제품과 직접 경쟁 할 수 있지만 비용과 자원이 훨씬 적은 고급 AI 모델을 개발했습니다. 이것은 AI 연구자들을 놀라게 할뿐만 아니라 기술 투자자들 사이에서 많은 우려를 제기했으며, 심지어 NVIDIA와 같은 대기업의 시가 총액에도 영향을 미쳤습니다. 그렇다면 Deepseek은 어떻게 그렇게했으며, 글로벌 AI 산업에 그 의미는 무엇입니까?
2023 년에 태어난 DeepSeek은 강력한 AI 모델을 지속적으로 시작할 때 기술 커뮤니티의 관심을 빠르게 끌어 들였습니다. 2023 년 12 월,이 회사는 Openai의 GPT-4O 또는 Anthropic의 Claude 3.5와 같은 수준에서 문서를 처리 할 수있는 대형 언어 모델 (LLM) 인 Deepseek V3를 발표했습니다. DeepSeek V3 Special을 만드는 것은 성능뿐만 아니라 훈련 방식도 있습니다. OpenAI는 GPT-4를 훈련시키는 데 1 억 달러가 넘는 비용이 들지만 DeepSeek은 V3를 개발하는 데 약 5,500 만 달러 만 소요됩니다. 이 차이는 Deepseek의 간소화되고 창의적인 접근 방식에서 비롯되며, 자원이 제한된 인상적인 결과를 얻을 수 있도록 도와줍니다.
DeepSeek은 비용 절감뿐만 아니라 라이벌 회사보다 상당수의 GPU를 사용하여 교육 프로세스를 최적화합니다. 구체적으로, DeepSeek V3는 NVIDIA에서 생산 한 약 2,000 H800 GPU에 의해 교육을받는 반면, 다른 회사는 최대 16,000 GPU H100을 사용해야 할 수도 있습니다. 그러나 V3의 출력 품질은 여전히 미국의 최고 AI 모델과 동일한 수준에 도달하여 DeepSeek은 하드웨어 힘을 기반으로 할뿐만 아니라 알고리즘 및 방법의 획기적인 개선이 있음을 증명합니다.
2024 년 1 월 20 일, DeepSeek은 논리적 사고와 문제 해결이 단계별로 필요한 작업을 위해 특별히 설계된 R1이라는 새로운 모델을 계속 시작했습니다. 전통적인 모델은 실제로 인간과 같은 추론 대신 통계적 확률에 따라 답을 제공하는 경향이 있기 때문에 이것은 AI의 중요한 단계입니다. 강화 학습 덕분에 R1은 표준 LLM 모델보다 복잡한 문제를 훨씬 더 잘 처리 할 수 있으며 OpenAI의 GPT-4 터보 (및 O1)를 사용하여 DeepSeek를 직접 경쟁 위치에 넣을 수 있습니다.
불과 1 주일 후, 2024 년 1 월 28 일, DeepSeek은 텍스트와 이미지를 모두 처리 할 수있는 새로운 AI 모델을 도입 할 때 기술 커뮤니티를 계속 저어주었습니다. 이로 인해 Google Gemini 또는 OpenAi의 GPT-4 비전과 같은 고급 멀티 모달 AI 시스템으로 Deepseek가 레이스를 시작합니다. Deepseek의 빠르고 지속적인 개발은 흥분된 연구자들뿐만 아니라 서구 AI 회사의 투자자들의 신뢰를 흔들 었습니다. 그 영향은 너무 강해서 Nvidia와 같은 하드웨어 거인조차도 심각한 영향을 미쳤으며, 투자자들이 AI 경쟁에 대해 걱정할 때 시가 총액이 6 천억 달러입니다.
그렇다면 DeepSeek이 다른 회사보다 비용이 훨씬 낮은 강력한 AI 모델을 만드는 데 도움이되는 비밀은 무엇입니까? 답은이 회사가 모델 개발 프로세스에 적용되는 현명하고 효과적인 접근 방식에 있습니다. DeepSeek이 모델에 넣은 가장 중요한 개선 사항 중 하나는 “스파스 활성화”기술입니다. AI 모델에서 수억 개의 매개 변수가 각 질문에 응답하는 방법을 결정하지만 입력 요청이있을 때마다 이러한 모든 매개 변수가 사용되는 것은 아닙니다. 일반적으로, 어떤 매개 변수가 리소스를 소비하는 과정으로 활성화 될 것이지만, DeepSeek은 필요한 매개 변수를 예측하고 활성화하여 수학을 크게 절약 할 수있는 방법을 찾았습니다.
또한 DeepSeek은 컴퓨터 메모리에 정보를 저장하고 검색하는 문제에 대한 완전히 새로운 접근 방식을 가지고 있습니다. 그들은 데이터를보다 효과적으로 압축하는 데 도움이되는 최적화 된 방법을 개발하여 하드웨어가 너무 강하지 않고 정보 액세스 모델을 더 빨리 허용했습니다. 이러한 기술 덕분에 DeepSeek은 세계 최고의 AI 모델과 동일한 성능을 달성 할 수 있지만 비용과 자원이 상당히 낮아질 수 있습니다.
DeepSeek의 성공은 서구 AI 회사들에게 큰 도전을 제기했을뿐만 아니라 글로벌 AI 연구 커뮤니티를위한 새로운 기회를 열었습니다. DeepSeek이 무료 MIT 라이센스에 따라 모델과 알고리즘을 출시했음을 주목할 가치가 있습니다. 즉, 누구나이를 다운로드, 연구 및 편집 할 수 있습니다. 이것은 학계, 특히 GPT-4 또는 Claude 3.5와 같은 비싼 AI 모델에 액세스하기에 충분한 자원이없는 연구원에게 긍정적 인 신호입니다. DeepSeek은 계산 능력을 최적화하는 데 도움이되는 개선 사항을 통해 개인과 소규모 조직이 자신의 대형 기술 회사 만 누워 누가 누가 누워 있는지 대신 게임에 참여할 수 있도록 도와줍니다.
DeepSeek의 인기는 AI가 배포 및 사용되는 방식에 큰 변화를 가져올 수 있습니다. AI 모델이 리소스 측면에서 점점 효과적이라면 사용자는 값 비싼 클라우드 서비스에 따라 랩톱이나 전화와 같은 개인 장치에서 바로 실행할 수 있습니다. 이로 인해 AI 회사는 사용자가 AI를 무료로 액세스 할 수 있고 서비스를 등록 할 필요가 없다면 회사는 “AI-A-a-Service”로부터 혜택을 얻을 수 있기 때문에 비즈니스 모델을 검토해야합니다. 미래에.
그러나 여전히 대답해야 할 큰 질문이 있습니다. DeepSeek의 접근 방식이 전반적인 성능을 향상시키는 AI 모델을 만드는 데 도움이되는지 또는 자원에 대해 더 효과적인 사람을 만드는 데 도움이됩니까? 답이 나중에 인 경우 OpenAi, Google Deepmind 또는 Anthropic과 같은 회사는 연구 개발에 크게 투자함으로써 여전히 주요 위치를 유지할 수 있습니다. 그러나 DeepSeek이 실제로 뛰어난 품질 모델을 만들 수 있다면, 서부 자이언트가 중국의 새로운 상대가 위험에 처할 때 AI 산업에서 전력 전송의 시작일 수 있습니다.
어쨌든 DeepSeek은 레이스가 여전히 많은 놀라움을 가지고 있음을 입증했으며, 오늘날 이름이 미래에도 여전히 입장을 유지할 것이라는 보장은 없습니다.
<
div class = “임신”>
<
H1> 결론 중국의 젊은 AI 회사가 왜 세계에 충격을 줄 수 있습니까? DeepSeek은 다른 회사보다 비용과 자원이 훨씬 적은 강력한 AI 모델을 만들 수 있음을 증명했습니다. DeepSeek의 현명하고 효과적인 접근 방식은 글로벌 AI 산업에 새로운 기회를 열었습니다. DeepSeek의 인기는 AI가 배치 및 사용되는 방식을 바꿀 수 있으며 서구 AI 회사에 문제가 발생합니다. 레이스 AI에는 여전히 많은 놀라움이 있으며, 아무도 미래에 자신의 위치를 확신 할 수 없습니다.