Nova Act는 어떤 AI인가요?
Nova Act는 Amazon이 새로 설립한 범용 인공지능(AGI) 연구소에서 처음 개발한 AI로,
사용자를 대신해서 다음과 같은 작업을 할 수 있습니다.
- 온라인에서 상품 구매
- 회원가입 양식 자동 입력
- 식당 예약
- 웹페이지 상의 버튼 클릭, 드롭다운 선택, 체크박스 클릭 등 직접 조작
즉, 사용자가 하지 않아도 AI가 웹페이지를 직접 탐색하고, 필요한 행동을 수행하는 능력을 가진 거죠.
어떤 기술이 들어갔나요?
Nova Act는 Amazon의 기초 모델(Gemini와 유사) 위에 구축된 에이전트로, 다음과 같은 기능이 핵심입니다.
기능 | 설명 |
---|---|
웹 브라우저 자동화 | Playwright 등과 연동해 웹 요소를 직접 조작 |
작업 분해 능력 | 큰 명령을 세부 단계로 나누어 안정적으로 처리 |
지시문 최적화 | 개발자가 상세한 조건을 줄 수 있어 유연하게 사용 가능 |
헤드리스 실행 | 브라우저 UI 없이 백그라운드에서 실행 가능 |
성능은 어느 정도인가요?
Amazon은 Nova Act의 성능을 여러 벤치마크로 검증했어요.
- ScreenSpot Web Text 벤치마크 → **정확도 93.9%**로 OpenAI의 CUA(88.3%)보다 우수
- GroundUI Web 벤치마크 → 80.5% 정확도로 다양한 웹 UI 조작 능력 확인
이 수치는 AI가 실제 사람처럼 웹페이지를 조작하는 능력을 보여주는 중요한 지표예요.
누구나 써볼 수 있나요?
현재 Nova Act는 개발자 미리보기(Research Preview) 형식으로,
Amazon이 운영하는 Nova 개발자 포털을 통해 공개되어 있어요.
여기에서:
- Nova Act의 API 키 발급
- SDK 설치 및 문서
- 튜토리얼 따라하기
모두 가능합니다. 누구든지 자신만의 AI 브라우저 에이전트를 만들어볼 수 있는 시대가 온 거죠.
왜 Amazon이 이걸 만들었을까?
Amazon은 최근 발표에서 **AI 분야에만 1,000억 달러(약 145조 원)**를 투자하겠다고 밝혔습니다.
그 이유는 명확합니다:
- 전자상거래의 모든 과정(검색 → 결제 → 배송 추적)이 AI 중심으로 자동화될 가능성
- 경쟁사(OpenAI, Microsoft, Google 등)의 AI 에이전트 개발에 대한 빠른 대응
- 사용자를 대신하는 브라우저 상의 ‘AI 비서’ 경쟁에 뛰어들기 위해
즉, Nova Act는 Amazon이 AI 주도권을 잡기 위한 선언과 같은 존재입니다.
TI Tech Lab 김준수 연구원
Source
- https://www.aboutamazon.com/news/innovation-at-amazon/amazon-nova-website-sdk
- https://labs.amazon.science/blog/nova-act
- https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser/
- https://venturebeat.com/ai/what-you-need-to-know-about-amazon-nova-act-the-new-ai-agent-sdk-challenging-openai-microsoft-salesforce/
Add comment