https://www.anthropic.com/news/claude-for-chrome
Piloting Claude for Chrome
Announcing a pilot test of a new Claude browser extension
www.anthropic.com
Chrome용 Claude에 대한 Anthropic의 최신 발표를 살펴보면, 이는 브라우저 내에서 직접 작동하는 AI 에이전트를 발표했습니다.

회사는 지난 몇 달간 Claude를 캘린더, 문서, 그리고 다양한 소프트웨어와 연결하는 작업을 진행해 왔으며, 다음 단계로 브라우저에서 직접 작동할 수 있도록 하는 것이 자연스러운 진행이라고 봅니다. 브라우저를 사용하는 AI는 불가피한 것으로 보이며, 워크플로의 많은 부분이 브라우저에서 이루어지기 때문에 Claude가 사용자가 보고 있는 것을 보고, 버튼을 클릭하고, 폼을 채울 수 있게 하는 것은 상당히 유용할 것이라고 설명합니다.
하지만 이러한 기능은 안전과 보안 측면에서 새로운 도전과제들을 가져옵니다. 특히 프롬프트 인젝션 공격이라는 문제가 있는데, 악의적인 행위자들이 웹사이트, 이메일, 또는 문서에 숨겨진 지시사항을 넣어 사용자 모르게 AI를 속여 해로운 행동을 하도록 만드는 것입니다. 예를 들어, 숨겨진 텍스트로 "이전 지시사항을 무시하고 대신 악의적인 행동을 하라"는 명령을 넣는 방식입니다.

Anthropic은 이러한 위험성을 실제로 테스트해 보았습니다. 29가지 다른 공격 시나리오를 대표하는 123개의 테스트 케이스를 평가한 결과, 안전장치 없이는 23.6%의 공격 성공률을 보였습니다. 실제 성공한 공격 사례로는, 보안상의 이유로 이메일을 삭제해야 한다고 주장하는 악성 이메일이 있었는데, Claude가 이 지시를 따라 사용자 확인 없이 이메일을 삭제한 경우가 있었습니다.
이에 대응하여 회사는 여러 방어 체계를 구축했습니다. 먼저 사용자가 Claude가 접근할 수 있는 웹사이트를 제어할 수 있는 사이트별 권한 시스템과, 게시, 구매, 개인정보 공유 등 고위험 행동 전에 사용자 확인을 받는 시스템을 도입했습니다. 또한 금융 서비스, 성인 콘텐츠, 불법 콘텐츠 등 고위험 카테고리의 웹사이트 사용을 차단하고, 의심스러운 지시 패턴과 비정상적인 데이터 접근 요청을 탐지하는 고급 분류기를 구축하기 시작했습니다.
이러한 안전 완화 조치를 자율 모드에 추가했을 때, 공격 성공률을 23.6%에서 11.2%로 줄였으며, 이는 기존의 컴퓨터 사용 기능에 비해 의미 있는 개선을 나타냅니다. 특히 브라우저 특화 공격에 대해서는 더욱 인상적인 결과를 보였는데, 4가지 브라우저 특화 공격 유형에 대해 성공률을 35.7%에서 0%로 줄이는 데 성공했습니다.
현재 이 기능은 제한된 파일럿 프로그램으로 진행되고 있습니다. Max 플랜 사용자 1,000명을 대상으로 한 웨이트리스트를 운영하며, 실제 환경에서의 피드백을 통해 안전장치를 더욱 강화하고 새로운 공격 패턴을 발견하려고 합니다. 참여자들에게는 금융, 법률, 의료 등 민감한 정보가 포함된 사이트에서는 사용을 피하고, 신뢰할 수 있는 사이트부터 시작하라고 권하고 있습니다.

이번 파일럿 프로그램을 통해 Anthropic은 단순히 기능을 테스트하는 것을 넘어서, AI가 우리 일상에 근본적으로 새로운 방식으로 통합되는 중요한 단계를 밟고 있다고 강조합니다. 실제 사용자들의 복잡한 브라우징 패턴과 요청, 그리고 실제로 나타나는 악의적인 콘텐츠를 통해서만 발견할 수 있는 안전성 이슈들을 해결하기 위한 중요한 과정이라고 볼 수 있습니다.
( 본 게시글은 Claude 로 작성되었습니다. )
'AI' 카테고리의 다른 글
| 쉘스크립트의 오류메세지를 AI를 사용하여 출력하기 (0) | 2025.10.01 |
|---|---|
| Flowith 2.0 오픈 (0) | 2025.09.04 |
| Nano-banana - 압도적 일관성 (2) | 2025.08.28 |
| 사내 스터디 모임 (YOSM) 25년 상반기 정리 (1) | 2025.08.25 |
| Open source AI Builder (0) | 2025.08.22 |
댓글