Disrupting malicious uses of our models

(AI의 악의적 사용 차단)

OpenAI 2026-02-27

□ 오픈AI의 인공지능 악용 탐지 및 차단 성과 보고서 발표

ㅇ 미국 인공지능 기업인 오픈AI(OpenAI)가 2026년 2월 25일 자사 모델을 악용하려는 위협 세력을 탐지하고 차단한 최신 성과를 담은 ‘AI의 악의적 사용 차단’ 보고서를 공개했음

ㅇ 보고서는 2024년 이후 2년간 추적한 결과를 담아 국가 주도의 영향력 공작(IO)과 고도화된 지능형 스캠 사례를 집중적으로 다뤘음

ㅇ 위협 행위자들은 단순히 단일 AI 모델에 의존하지 않고 여러 모델과 플랫폼을 결합하여 사용하는 복합적인 공격 양상을 보이고 있는 것으로 확인됐음

ㅇ 이번 공개 목적은 산업과 사회가 AI 기반 위협을 효과적으로 식별·회피할 수 있도록 인사이트를 공유하기 위함임

□ 국가 연계 세력의 영향력 공작 사례

ㅇ 중국 법 집행 기관과 연계된 것으로 추정되는 세력이 ‘사이버 특수 작전’을 통해 여론 조작을 시도했으나 오픈AI의 안전 시스템에 의해 차단됐음

ㅇ 해당 세력은 차단 이후 자체적으로 구축한 로컬 AI 모델을 활용해 가짜 계정을 동원하고 허위 사실 유포, 계정 신고 남발, 미 정부 관계자 사칭 등 수십 가지 기만 전술을 지속한 것으로 파악됐음

ㅇ 러시아의 ‘리바르(Rybar)’ 네트워크는 챗GPT를 활용해 특정 지역의 지정학적 이슈에 관한 기사와 댓글을 대량으로 생성했으나 탐지망에 의해 활동이 중단됐음

ㅇ 이들은 AI가 생성한 텍스트 특유의 문장 부호를 수동으로 삭제하는 등 탐지 회피를 시도했음

□ 지능형 스캠 사례와 범죄 수법

ㅇ 캄보디아 기반 ‘데이트 베이트(Date Bait)’ 조직이 인도네시아 젊은 남성을 대상으로 로맨스 스캠을 벌였음

ㅇ 이들은 챗GPT로 데이트 서비스 광고 문구를 생성하고 AI 챗봇이 초기 고객 대응을 맡아 신뢰를 쌓은 뒤 실제 인간 운영자가 개입해 거액의 송금을 유도했음

ㅇ 범죄 조직은 피해자별 최종 갈취 목표 금액인 살해 가치(Kill Value)를 산출해 일일 보고서를 작성하는 등 범죄를 체계적으로 관리했음

□ 위협 행위자들의 전술과 오픈AI의 대응 전략

ㅇ 위협 행위자들은 감시를 피하기 위해 단일 모델에 의존하지 않고 여러 AI 모델을 교차 활용하는 ‘모델 호핑(Model Hopping)’ 전략을 사용했음

ㅇ 이들은 작전 단계별 목적에 맞춰 기획 단계에서는 메시지 설계에, 실행 단계에서는 대량 생성과 번역에 특화된 모델을 선택적으로 활용하는 양상을 보였음

ㅇ 오픈AI는 비정상적 사용 패턴 모니터링, 사전·사후 분석 병행, 외부 파트너 협력, 정책·안전장치 개선 등 다층적 보호 체계로 대응하고 있음

□ AI 보안의 미래 과제와 시사점

ㅇ AI는 콘텐츠 생산성과 속도를 높이는 도구로 기능하지만 실제 위협은 소셜미디어와 웹사이트 등 기존의 인프라와 결합될 때 발생함

ㅇ 위협 활동은 특정 플랫폼에 국한되지 않고 여러 온라인 플랫폼을 넘나들며 복수 모델을 활용하는 양상을 보임

ㅇ AI 안전 논의는 단일 모델 통제를 넘어 생태계 전반의 구조 이해로 확장돼야 함을 시사함

ㅇ 플랫폼 간 협력과 정보 공유, 다층적 모니터링 체계 구축이 핵심 대응 과제로 부상하고 있음

AI 요약·번역·분석 서비스

AI를 활용한 보고서 요약·번역과 실시간 질의응답 서비스입니다.

(AI의 악의적 사용 차단)

번역 PDF 파일의 원문 형태 그대로 번역

국가전략포털에서 실시간 AI 질의응답 서비스를 시작합니다. 4가지 유형의 요약과 번역을 이용해보시고, 보고서에 대해 추가로 알고 싶은 내용이 있으면 채팅창을 통해 자유롭게 AI에게 물어볼 수 있습니다.

※ 제공하는 정보는 참고용이며, 정확한 사실 확인이 필요할 수 있습니다. 민감한 개인정보는 입력하지 마십시오.