몇 번의 마우스 클릭만으로 웹 서핑을 할 사람이 필요하다는 비밀의 이유를 발견하십시오!

OpenAi는 컴퓨터 사용 에이전트 (CRAB)라는 새로운 AI 모델을 사용하여 웹을 자동화하는 데 도움이되는 “Operator”Research -A AI 에이전트 미리보기를 발표했습니다. 이 시스템은 웹 화면의 구성 요소와 상호 작용하고 인간과 같은 작업을 수행 할 수 있습니다.

현재 운영자는 사용자가 Pro Chatgpt 패키지를 $ 200/월에 등록 할 수 있습니다. OpenAI는이 기능을 ChatGpt에 통합하고 나중에 개발자를 위해 API를 통해 게를 릴리스 할 계획입니다.

사용자가 웹을 서핑하고, 쇼핑, 개인 금융 관리 목록을 만들고, 다른 많은 작업을 수행 할 수 있도록 AI 에이전트는 인공 지능 분야에서 새로운 개발 트렌드가되고 있습니다.

연산자는 화면에서 컨텐츠를 추적하고 키보드 및 마우스 -마우스 시뮬레이션을 통해 작업을 수행하여 작동합니다. 컴퓨터의 상태를 이해하고 필요한 조치를 수행하기 위해 크랩을 처리하는 스크린 샷 처리 크랩.

그러나 운영자의 사용은 보안 및 개인 정보 보호에주의를 기울여야합니다. OpenAI는 많은 안전 제어 조치를 시스템에 통합했지만 여전히 공격 가능성에 대해 걱정했습니다. 이 서비스를 사용하기 전에 사용자는 신중하게 고려해야합니다.

일반적으로 AI 에이전트를 개발하기위한 경쟁은 점점 더 긴장되고 있으며, 운영자와 함께 Openai는 인공 지능 분야에서 중요한 단계였습니다.

다섯째, OpenAi는 AI 에이전트-“AI 에이전트”인 “운영자”에 대한 연구 미리보기를 발표했습니다. 이 시스템은 사람들이 사용하는 방식과 유사하게 노드 및 텍스트 필드와 같은 화면의 구성 요소를보고 상호 작용하여 작업을 수행합니다.

Operator.chatgpt.com에서 ChatGpt Pro 패키지에 $ 200/월에 등록하는 사람들이 운영자를 사용할 수 있습니다. 이 회사는 나중에 사용자 플러스, 팀 및 엔터프라이즈를 위해 확장 할 계획입니다. OpenAI는 이러한 기능을 ChatGpt에 직접 통합 한 다음 개발자를 위해 API를 통해 게를 출시 할 계획입니다.

사용자는 왜 웹을 스스로 서핑 할 사람이 필요합니까?

실제로, 많은 사람들이 이러한 AI 요원의 영향과 그것이 인공 지능의 미래를위한 새로운 발전으로 간주되는 이유를 상상하지 못할 수도 있습니다. AI 개발자의 프로모션에 따르면, 이러한 AI 요소는 사람들이 웹 서핑, 쇼핑 목록을 만들거나 재생 목록에 노래를 추가하고 악의 테이블을 처리하는 등의 작업을 수행 할 수 있습니다. 훌륭한 기술 혁신으로 간단하고보기 어렵습니다.

그러나 간단한 작업조차도 여러 번 반복해야한다면 많은 시간이 걸린다는 사실. 더 중요한 것은 인간은 잘못된 정보와 같은 간단한 일을 할 때 실수를 저지르거나 단순히 물건을 사는 것과 같은 것을 잊어 버리는 경향이 있다는 것입니다.

예를 들어, 일로 바쁜 사람은 매주 쇼핑을 계획 할 시간이 없거나 특정 품목을 구입해야한다는 것을 잊지 못할 수 있습니다. 현재 AI 에이전트는 이전 습관을 기반으로 쇼핑 목록을 만들어 도와 드릴 수 있습니다. 또한 이메일이나 메시지를 스캔하여 구매 메시지를 감지 할 수도 있습니다 (예 : “어린이를위한 우유를 구매하는 것을 기억하십시오”). 온라인 상점의 가격을 자동으로 비교하고 가장 경제적 인 구매 장소를 제안 할 수도 있습니다.

AI 에이전트의 효과의 또 다른 예는 개인 금융을 관리하는 것입니다. 좋은 AI 에이전트는 은행, e -Wallet 및 온라인 응용 프로그램을 대신하여 데이터를 수집 한 다음 지출을 자동으로 분류하고 보고서를 작성할 수 있습니다. 거기에서 예산을 초과 할 때 저축 또는 지출 경고를 제안 할 수 있습니다.

운영자는 어떻게 작동합니까?

이러한 작업을 수행하려면 OpenAI의 운영자 AI 운영자는 컴퓨터를 사용하는 동안 화면에서 컨텐츠를 추적하고 키보드 및 마우스 인 -마우스 시뮬레이션을 통해 작업을 수행합니다. 게 처리 스크린 샷은 컴퓨터의 상태를 이해하고 관찰에 따라 클릭, 타이핑 및 롤링에 대한 결정을 내립니다.

Crab은 여전히 PC를 사용하기 위해 많은 단계를 통해 작동합니다. 먼저 화면을 추적하려면 스크린 샷이 필요합니다. 그런 다음 이미지를 분석하여 거친 픽셀 데이터를 처리합니다. 다음으로 컴퓨터를 제어하기 위해 가상 입력 작업을 수행하고 수행하는 작업을 결정합니다. 이 반복적 인 루프는 시스템을 설계하여 오류를 수정하고 다양한 응용 프로그램에서 복잡한 작업을 처리합니다.

OpenAi는 운영자가 Amazon 및 Google지도와 같은 웹 사이트를 확인하는 실제 웹 사이트 세트 인 WebVoyager에서 87%의 성공률을 달성했다고 말했다. Webarena에서 오프라인 웹 사이트는 AI 에이전트를 훈련시키는 데 사용되며, 성공률은 58.1%로 줄어 듭니다. 컴퓨터 운영 체제 작업의 경우 게는 Osworld에서 38.1%에 도달하여 이전 모델을 능가하지만 여전히 72.4%로 인간의 성능을 잃고 있습니다.

이 불완전한 연구 미리보기를 통해 OpenAi는 사용자의 피드백을 수집하고 시스템의 능력을 조정하기를 희망합니다. 회사는 게가 모든 경우에 신뢰할 수있는 것은 아니지만 사용자의 테스트를 통해 신뢰성을 향상시키기위한 계획이 있음을 인정했습니다.

Openai의 단계는 다른 기술 회사가 “대표”AI 시스템을 홍보 한 후에 발생하며, 이는 사용자를 대신하여 조치를 취할 수 있습니다. Google은 2024 년 12 월 Mariner Project를 발표하여 Chrome 브라우저를 통해 자동 작업을 수행했습니다. 2 개월 전에 Anthropic은 “컴퓨터 사용”자동화 도구를 시작하여 개발자에게 집중하고 마우스 커서를 제어하고 컴퓨터에서 작업을 수행 할 수 있습니다.

AI 에이전트를 개발하기위한 경쟁이 시작 중입니다

신체 활동 환경에서 일련의 회사가 다양한 동원 작업의 사람들을 지원하기 위해 인간 모양의 로봇을 개발하기 위해 경주하고 있다면 AI 요원은 디지털 환경에서 “인간 모양의 로봇”입니다. 이것이 일련의 개발 회사가 서로 태어나고 AI 요원을 완벽하게 경주하는 이유입니다.이 시장은 향후 10 년 동안 수억 달러를 가져올 것으로 예상되는 시장입니다.

OpenAi는 많은 안전 제어 조치를 운영자에 통합하여 이메일이나 구매와 같은 민감한 작업을 완료하기 전에 확인하도록 요청했습니다. 운영자는 OpenAi가 설정 한 내용을 찾을 수있는 내용에 대한 제한이 있으며 도박 및 성인 콘텐츠를 포함한 일부 웹 사이트에 액세스 할 수 없습니다.

그러나 전문가들은 여전히 새로운 공격에 속할 수있는 운영자의 가능성에 대해 우려하고 있습니다. AI 보안 문제에 대해 정기적으로보고 한 Willison은 다음과 같이 말했습니다. 외부 세계가 그것을 탐구하기 시작할 때이 모델에 대한 모든 종류의 성공적인 신속한 주입을 볼 것이라고 생각합니다. .”

개인 정보 보호와 관련하여 운영자가 화면에서 보았던 모든 정보는 인터넷을 통해 일반 스크린 샷을 통해 OpenAi의 클라우드 서버로 전송되었으므로 OpenAI에 대한 많은 자신감을 갖게됩니다. 이 회사는 사용자가 데이터를 사용하여 모델을 훈련시키지 않도록 선택할 수있는 여러 개인 정보 보호 조치를 구현했으며 동시에 모든 웹 사이트에서 모든 웹 브라우징 데이터를 삭제했습니다.

div class = “임신”>

H1> 결론 웹 서핑, 쇼핑 목록 작성, 개인 재무 관리와 같은 간단한 작업으로 인해 AI 에이전트는 시간을 절약하고 인간의 실수 가능성을 줄일 수 있기 때문입니다. 이것은 인공 지능 분야의 새로운 단계이며 향후 많은 유틸리티를 사용자에게 가져올 것으로 예상됩니다.

Sign up for Newsletter

Uncategorized

몇 번의 마우스 클릭만으로 웹 서핑을 할 사람이 필요하다는 비밀의 이유를 발견하십시오!

admin

답글 남기기 응답 취소