## New Chatgpt : 더 똑똑하지만 … 더 많은은?
OpenAi는 최근 두 가지 새로운 버전의 ChatGpt, O3 및 O4-Mini를 출시했으며, 우수한 논리적 사고 능력을 보유하고 있습니다. 그러나 내부 테스트 결과는 놀랍습니다.이 두 모델 모두 “환각”(즉, 정보 제작)이 전임자보다 훨씬 높은 빈도를 갖습니다. 이것은 다음 -세대 AI 제품의 정확성과 신뢰성을 보장하는 데 OpenAI에게 큰 도전을 제기합니다. 이 기사는이 문제와 잠재적 영향에 대해 더 많이 분석 할 것입니다.
O3 및 O4-MINI의 출시는 NLP (Natural Language Processing Technology)의 중요한 단계입니다. OpenAi는이 두 모델이 논리적 추론이 필요한 복잡한 작업을 더 잘 처리 할 것으로 기대합니다. 그러나 현실은 생각할 수있는 능력의 상당한 개선 외에도 O3 및 O4-MINI의 “제작 된”추세가 크게 증가했음을 보여줍니다. 이로 인해 특히 언론, 건강 또는 법률과 같은 높은 정확도가 필요한 영역에서 실제로 이러한 모델의 적용에 대해 많은 우려가 발생합니다.
현재 OpenAI는이 현상의 원인에 대한 세부 정보를 발표하지 않았습니다. 그러나 많은 전문가들은 논리를 개선하는 데 너무 집중하면 실수로 모델의 정보를 검증하는 능력이 줄어들 수 있다고 생각합니다. 많은 잘못된 정보를 포함 할 수있는 막대한 양의 데이터에 대한 모델 교육도 고려해야 할 요소입니다.
이 사건은 일반적으로 AI 기술의 개발 방향에 대한 큰 의문을 제기합니다. 논리적 사고의 향상과 정보의 정확성을 보장하는 방법은 무엇입니까? OpenAi는이 문제를 극복하고 앞으로보다 신뢰할 수있는 채팅 탑을 가져올 수 있습니까? 이것은 AI 분야의 선두 위치를 유지하기 위해 OpenAI가 해결 해야하는 과제입니다. AI 기술의 개발은 원치 않는 결과를 피하고 투명성과 신뢰성을 보장하기위한 책임과 관련이 있어야합니다.
#openai #chatgpt
: OpenAi는 O3, O4-MINI “정보 제작”을 채팅하기가 어렵습니다.
OpenAi는 방금 두 가지 새로운 모델을 출시했습니다 O3 그리고 O4- 미니논리적 사고가 필요한 작업을 처리하도록 특별히 설계되었습니다. 그러나 내부 테스트에 따르면이 두 모델은 GPT-4O와 같은 이전 모델보다 더 높은 빈도를 가진 잘못된 정보 ( “환각”이라고도 함)를 만드는 경향이 있습니다.
환상 현상은 여전히 AI 업계에서 가장 어려운 문제 중 하나입니다. 새로운 모델은 종종 정확도를 향상 시키지만 O3 및 O4-Mini는 이러한 추세에 반대합니다. OpenAI의 기술 보고서에 따르면, 이러한 모델은 “더 많은 진술을 만듭니다”는 더 많은 정보를 올바르게 제공하지만 더 많은 잘못된 답변을 제공해야합니다.
테스트 결과는 O3가 O1 (16%) 및 O3-MINI (14.8%)보다 2 배나 큰 개인 QA 데이터의 질문의 33%에서 O3가 환각 된 것으로 나타났습니다. O4-Mini는 훨씬 더 높으며 최대 48%의 비율이 높습니다. 이것은 새로운 세대 AI 모델의 정확도에 대한 기대와 비교 한 단계입니다.

OpenAI는이 문제를 기록 할뿐만 아니라. COSION에 따르면, 독립적 인 AI 연구 실험실에서 O3는 작업을 수행하는 작업을 “제작”하는 경향이 있습니다. 한 경우에,이 모델은 MacBook Pro 2021에서 코드를 실행하고 결과를 답에 복사했다고 말했다.
Cugure의 연구원이자 전 Openai 직원 인 Neil Chowdhury는 O 모델 라인에 사용 된 강화 학습 알고리즘이 실수로 기존 교육 프로세스에 의해 약간 줄어들게 된 오류를 증폭시킬 수 있다고 말했다. 같은 관점에서, 소개의 공동 창립자는 Sarah Schwettmann이며, 높은 환각 비율은 실제 잠재력보다 O3가 덜 효과적이라고 말합니다.
일부 회사는 여전히 실제 환경에서 O3를 테스트하고 있습니다. Stanford의 강사이자 Workera의 CEO 인 Kian Katanforoosh는 프로그래밍 프로세스에 사용될 때 그의 그룹이 라이벌보다 O3보다 높은 평가를 받았다고 말했다. 그러나 그들은 또한이 모델이 종종 깨진 웹 링크를 생성한다는 것을 발견했습니다.
때때로 AI의 “창의적”답변은 새로운 아이디어로 이어질 수 있지만, 법적 또는 재무와 같은 영역에서는 절대적인 정확도가 필요한 영역의 현상이 큰 장벽입니다. 유망한 접근 방식은 웹 검색 기능을 AI 모델에 통합하는 것입니다. 예를 들어 OpenAI의 데이터에 따르면 GPT-4O는 SimpleQA에서 90% 정확도에 도달하는 검색을 가지고 있습니다.
Openai 대표 인 Niko Felix는 정확성과 환각을 개선하는 것이 회사의 지속적인 연구 우선 순위라고 말했다. 그러나 사고 모델의 확장 이이 문제를 계속 악화 시킨다면 AI의 산업은 그 어느 때보 다 긴급한 문제에 직면하게 될 것입니다.
전통적인 훈련 방법의 맥락에서 효율성이 감소 함을 보여주기 시작하면 많은 기술 회사가 사고 모델로 전환하고 있습니다. 자원을 절약하고 많은 작업에서 효과적으로 자원에도 불구하고 극복해야 할 장벽이 여전히 많아서 진정으로 신뢰할 수 있습니다.
OpenAi는 방금 두 가지 새로운 모델을 출시했습니다 O3 그리고 O4- 미니논리적 사고가 필요한 작업을 처리하도록 특별히 설계되었습니다. 그러나 내부 테스트에 따르면이 두 모델은 GPT-4O와 같은 이전 모델보다 더 높은 빈도를 가진 잘못된 정보 ( “환각”이라고도 함)를 만드는 경향이 있습니다.
환상 현상은 여전히 AI 업계에서 가장 어려운 문제 중 하나입니다. 새로운 모델은 종종 정확도를 향상 시키지만 O3 및 O4-Mini는 이러한 추세에 반대합니다. OpenAI의 기술 보고서에 따르면, 이러한 모델은 “더 많은 진술을 만듭니다”는 더 많은 정보를 올바르게 제공하지만 더 많은 잘못된 답변을 제공해야합니다.
테스트 결과는 O3가 O1 (16%) 및 O3-MINI (14.8%)보다 2 배나 큰 개인 QA 데이터의 질문의 33%에서 O3가 환각 된 것으로 나타났습니다. O4-Mini는 훨씬 더 높으며 최대 48%의 비율이 높습니다. 이것은 새로운 세대 AI 모델의 정확도에 대한 기대와 비교 한 단계입니다.

OpenAI는이 문제를 기록 할뿐만 아니라. COSION에 따르면, 독립적 인 AI 연구 실험실에서 O3는 작업을 수행하는 작업을 “제작”하는 경향이 있습니다. 한 경우에,이 모델은 MacBook Pro 2021에서 코드를 실행하고 결과를 답에 복사했다고 말했다.
Cugure의 연구원이자 전 Openai 직원 인 Neil Chowdhury는 O 모델 라인에 사용 된 강화 학습 알고리즘이 실수로 기존 교육 프로세스에 의해 약간 줄어들게 된 오류를 증폭시킬 수 있다고 말했다. 같은 관점에서, 소개의 공동 창립자는 Sarah Schwettmann이며, 높은 환각 비율은 실제 잠재력보다 O3가 덜 효과적이라고 말합니다.
일부 회사는 여전히 실제 환경에서 O3를 테스트하고 있습니다. Stanford의 강사이자 Workera의 CEO 인 Kian Katanforoosh는 프로그래밍 프로세스에 사용될 때 그의 그룹이 라이벌보다 O3보다 높은 평가를 받았다고 말했다. 그러나 그들은 또한이 모델이 종종 깨진 웹 링크를 생성한다는 것을 발견했습니다.
때때로 AI의 “창의적”답변은 새로운 아이디어로 이어질 수 있지만, 법적 또는 재무와 같은 영역에서는 절대적인 정확도가 필요한 영역의 현상이 큰 장벽입니다. 유망한 접근 방식은 웹 검색 기능을 AI 모델에 통합하는 것입니다. 예를 들어 OpenAI의 데이터에 따르면 GPT-4O는 SimpleQA에서 90% 정확도에 도달하는 검색을 가지고 있습니다.
Openai 대표 인 Niko Felix는 정확성과 환각을 개선하는 것이 회사의 지속적인 연구 우선 순위라고 말했다. 그러나 사고 모델의 확장 이이 문제를 계속 악화 시킨다면 AI의 산업은 그 어느 때보 다 긴급한 문제에 직면하게 될 것입니다.
전통적인 훈련 방법의 맥락에서 효율성이 감소 함을 보여주기 시작하면 많은 기술 회사가 사고 모델로 전환하고 있습니다. 자원을 절약하고 많은 작업에서 효과적으로 자원에도 불구하고 극복해야 할 장벽이 여전히 많아서 진정으로 신뢰할 수 있습니다.
Openai의 결론은 O3, O4-Mini “정보를 만듭니다”더하기가 어렵습니다.
OpenAi는 방금 두 가지 새로운 모델을 출시했습니다 O3 그리고 O4- 미니논리적 사고가 필요한 작업을 처리하도록 특별히 설계되었습니다. 그러나 내부 테스트에 따르면이 두 모델은 GPT-4O와 같은 이전 모델보다 더 높은 빈도를 가진 잘못된 정보 ( “환각”이라고도 함)를 만드는 경향이 있습니다.
환상 현상은 여전히 AI 업계에서 가장 어려운 문제 중 하나입니다. 새로운 모델은 종종 정확도를 향상 시키지만 O3 및 O4-Mini는 이러한 추세에 반대합니다. OpenAI의 기술 보고서에 따르면, 이러한 모델은 “더 많은 진술을 만듭니다”는 더 많은 정보를 올바르게 제공하지만 더 많은 잘못된 답변을 제공해야합니다.
테스트 결과는 O3가 O1 (16%) 및 O3-MINI (14.8%)보다 2 배나 큰 개인 QA 데이터의 질문의 33%에서 O3가 환각 된 것으로 나타났습니다. O4-Mini는 훨씬 더 높으며 최대 48%의 비율이 높습니다. 이것은 새로운 세대 AI 모델의 정확도에 대한 기대와 비교 한 단계입니다.

OpenAI는이 문제를 기록 할뿐만 아니라. COSION에 따르면, 독립적 인 AI 연구 실험실에서 O3는 작업을 수행하는 작업을 “제작”하는 경향이 있습니다. 한 경우에,이 모델은 MacBook Pro 2021에서 코드를 실행하고 결과를 답에 복사했다고 말했다.
Cugure의 연구원이자 전 Openai 직원 인 Neil Chowdhury는 O 모델 라인에 사용 된 강화 학습 알고리즘이 실수로 기존 교육 프로세스에 의해 약간 줄어들게 된 오류를 증폭시킬 수 있다고 말했다. 같은 관점에서, 소개의 공동 창립자는 Sarah Schwettmann이며, 높은 환각 비율은 실제 잠재력보다 O3가 덜 효과적이라고 말합니다.
일부 회사는 여전히 실제 환경에서 O3를 테스트하고 있습니다. Stanford의 강사이자 Workera의 CEO 인 Kian Katanforoosh는 프로그래밍 프로세스에 사용될 때 그의 그룹이 라이벌보다 O3보다 높은 평가를 받았다고 말했다. 그러나 그들은 또한이 모델이 종종 깨진 웹 링크를 생성한다는 것을 발견했습니다.
때때로 AI의 “창의적”답변은 새로운 아이디어로 이어질 수 있지만, 법적 또는 재무와 같은 영역에서는 절대적인 정확도가 필요한 영역의 현상이 큰 장벽입니다. 유망한 접근 방식은 웹 검색 기능을 AI 모델에 통합하는 것입니다. 예를 들어 OpenAI의 데이터에 따르면 GPT-4O는 SimpleQA에서 90% 정확도에 도달하는 검색을 가지고 있습니다.
Openai 대표 인 Niko Felix는 정확성과 환각을 개선하는 것이 회사의 지속적인 연구 우선 순위라고 말했다. 그러나 사고 모델의 확장 이이 문제를 계속 악화 시킨다면 AI의 산업은 그 어느 때보 다 긴급한 문제에 직면하게 될 것입니다.
전통적인 훈련 방법의 맥락에서 효율성이 감소 함을 보여주기 시작하면 많은 기술 회사가 사고 모델로 전환하고 있습니다. 자원을 절약하고 많은 작업에서 효과적으로 자원에도 불구하고 극복해야 할 장벽이 여전히 많아서 진정으로 신뢰할 수 있습니다.
. Awesome {위치 : 절대; 국경 : 2px Solid #990000; -Moz-Radius : 50%; -ms-border-radius : 50%; 국경-라디우스 : 50%; 애니메이션 : 바운스 2S 무한; -webkit- 애니메이션 : 바운스 2s 무한; -Moz-Animation : Bounce 2S Infinite; -o-anime : 바운스 2s 무한; 디스플레이 : 인라인 블록; 패딩 : 3px 3px 3px; 색상 : #fff; 배경 : #990000; 글꼴 크기 : 20px; 선-높이 : 1; -Moz 국경 Radius : 5px; -webkit-border-radius : 5px; -Moz-Box-Shadow : 0 1px 3px #999; -webkit-box-shadow : 0 1px 3px #999; 텍스트 -shadow : 0 -1px 1px #222; 국경-바닥 : 1px 고체 #222; 위치 : 상대; 커서 : 포인터; }
게시물 New Chatgpt : 더 똑똑하지만 … 더 많은은을 제작 했습니까? 처음에 나타났습니다 퀸 모바일.