더이노베이터스

Amazon, 웹에서 직접 행동하는 AI ‘Nova Act’ 공개

Nova Act는 어떤 AI인가요?


Nova Act는 Amazon이 새로 설립한 범용 인공지능(AGI) 연구소에서 처음 개발한 AI로,

사용자를 대신해서 다음과 같은 작업을 할 수 있습니다.

  • 온라인에서 상품 구매
  • 회원가입 양식 자동 입력
  • 식당 예약
  • 웹페이지 상의 버튼 클릭, 드롭다운 선택, 체크박스 클릭 등 직접 조작

즉, 사용자가 하지 않아도 AI가 웹페이지를 직접 탐색하고, 필요한 행동을 수행하는 능력을 가진 거죠.

어떤 기술이 들어갔나요?


Nova Act는 Amazon의 기초 모델(Gemini와 유사) 위에 구축된 에이전트로, 다음과 같은 기능이 핵심입니다.

기능설명
웹 브라우저 자동화Playwright 등과 연동해 웹 요소를 직접 조작
작업 분해 능력큰 명령을 세부 단계로 나누어 안정적으로 처리
지시문 최적화개발자가 상세한 조건을 줄 수 있어 유연하게 사용 가능
헤드리스 실행브라우저 UI 없이 백그라운드에서 실행 가능

성능은 어느 정도인가요?


Amazon은 Nova Act의 성능을 여러 벤치마크로 검증했어요.

  • ScreenSpot Web Text 벤치마크 → **정확도 93.9%**로 OpenAI의 CUA(88.3%)보다 우수
  • GroundUI Web 벤치마크80.5% 정확도로 다양한 웹 UI 조작 능력 확인

이 수치는 AI가 실제 사람처럼 웹페이지를 조작하는 능력을 보여주는 중요한 지표예요.

누구나 써볼 수 있나요?


현재 Nova Act는 개발자 미리보기(Research Preview) 형식으로,

Amazon이 운영하는 Nova 개발자 포털을 통해 공개되어 있어요.

여기에서:

  • Nova Act의 API 키 발급
  • SDK 설치 및 문서
  • 튜토리얼 따라하기

모두 가능합니다. 누구든지 자신만의 AI 브라우저 에이전트를 만들어볼 수 있는 시대가 온 거죠.

왜 Amazon이 이걸 만들었을까?


Amazon은 최근 발표에서 **AI 분야에만 1,000억 달러(약 145조 원)**를 투자하겠다고 밝혔습니다.

그 이유는 명확합니다:

  • 전자상거래의 모든 과정(검색 → 결제 → 배송 추적)이 AI 중심으로 자동화될 가능성
  • 경쟁사(OpenAI, Microsoft, Google 등)의 AI 에이전트 개발에 대한 빠른 대응
  • 사용자를 대신하는 브라우저 상의 ‘AI 비서’ 경쟁에 뛰어들기 위해

즉, Nova Act는 Amazon이 AI 주도권을 잡기 위한 선언과 같은 존재입니다.

TI Tech Lab 김준수 연구원

Source

Avatar

theinnovators

Add comment