오픈AI “中딥시크 데이터 무단수집 의혹 조사”…美해군 “딥시크 사용금지”

입력 2025-01-30 10:14

수정 2025-01-30 10:14

글씨 크기 조절
글자크기 설정

닫기

글자크기 설정 시 다른 기사의 본문도 동일하게 적용 됩니다.
- 가
- 가
- 가
- 가
- 가
프린트
공유하기
공유

닫기
- 페이스북
- 네이버블로그
- 엑스
- 카카오톡
- 밴드
https://www.seoul.co.kr/news/international/2025/01/30/20250130500015
URL 복사
댓글
0

이미지 확대

미국의 인공지능(AI) 서비스 챗GPT 개발사 오픈AI와 중국의 AI 업체 딥시크(Deepseek) 이미지. 로이터 연합뉴스

극강의 가성비로 미국 인공지능(AI) 관련 산업에 충격을 안긴 중국의 AI 업체 딥시크(Deepseek)가 챗GPT 개발사 오픈AI의 데이터를 무단 수집했다는 의혹에 오픈AI와 마이크로소프트(MS)가 조사에 착수했다.

한편에선 딥시크 사용 시 개인정보 탈취나 보안 위험에 대한 경고도 나오고 있다.

오픈AI “오픈AI 모델 ‘증류’ 통해 딥시크 모델 훈련 의심”블룸버그 통신과 월스트리트저널(WSJ) 등은 딥시크와 관련된 그룹이 오픈AI의 데이터를 허가 없이 무단으로 획득했을 가능성에 대해 오픈AI와 MS가 조사하고 있다고 소식통을 인용해 29일(현지시간) 보도했다.

오픈AI는 중국에 기반을 둔 기관들이 자사 AI 도구에서 대량의 데이터를 빼내려고 하는 여러 시도를 목격했다면서 이는 ‘증류’(distillation)라고 불리는 기술적 과정을 통해 자체 모델을 훈련하기 위한 것으로 보인다고 설명했다.

AI 분야에서 ‘증류’란 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 활용해 유사한 기능을 개발하는 것을 뜻한다.

MS의 보안 연구원들도 지난해 가을 딥시크와 관련이 있을 것으로 보이는 사람들이 오픈AI 애플리케이션 프로그래밍 인터페이스(API)를 사용해 대량의 데이터를 빼돌리는 것을 관찰했다고 말했다.

API는 소프트웨어 개발자들이 자신들이 개발한 서비스의 기능을 다른 앱이나 프로그램이 가져다 넣을 수 있도록 해주는 도구로, 이를 사용하기 위해서는 가져가려는 데이터나 서비스 주체의 허가를 받아야 한다.

이미지 확대

중국 인공지능(AI) 서비스 업체 딥시크(Deepseek) 이미지. 로이터 연합뉴스

오픈AI는 자사 시스템에서 생성된 데이터를 사용해 동일한 시장에서 경쟁하는 기술을 구축하는 것을 허용하지 않고 있다.

오픈AI는 자사 모델을 증류하려 한다고 의심되는 계정을 금지했으며, MS와 협력해 이런 시도의 배후에 있는 주체를 파악했다고 설명했다.

그러면서 딥시크가 자사의 “데이터를 무단으로 수집했을 가능성”이 있으며, 서비스 약관을 위반했다는 증거를 검토하고 있다고 전했다.

오픈AI는 “적과 경쟁자가 가장 강력한 미국 기술을 탈취하려는 노력을 막기 위해 미국 정부와 긴밀히 협력하는 것이 매우 중요하다”면서 “중국 기반 기업들이 주요 미국 AI 기업의 모델을 지속적으로 증류하려고 노력하고 있다”고 전했다.

앞서 지난 28일 트럼프 행정부의 AI·가상화폐 정책을 총괄하는 ‘차르’로 임명된 데이비드 색스는 폭스뉴스와 가진 인터뷰에서 딥시크가 오픈AI의 독점 모델을 이용해 기술을 개발했다는 “상당한 증거가 있다”면서 미국에서 지식 재산을 훔쳤는지 묻는 질문에 “가능하다”고 답했다.

美해군 “딥시크 사용금지”…국내서도 “너무 많은 개인정보 수집”

이미지 확대

한편 딥시크 사용 시 보안 우려가 있다는 경고도 잇따라 나오고 있다.

미국 CNBC에 따르면 미국 해군은 딥시크의 AI 챗봇 모델을 사용하지 말도록 내부 지침을 내렸다.

미 해군은 지난 24일 내부 구성원들에게 보낸 이메일을 통해 “딥시크의 AI를 어떤 형태로든 사용하지 말라”면서 “모델의 출처, 사용과 관련된 보안·윤리적 우려 때문”이라고 밝혔다.

미 해군 대변인은 해군정보국의 생성형 AI 정책과 관련된 것이라고 설명했다.

국내에서도 비슷한 우려가 제기됐다. 하정우 네이버 클라우드 AI 이노베이션 센터장은 딥시크의 AI 모델 ‘R1’을 사용할 때 수집하는 정보가 매우 광범위하다고 경고했다.

하 센터장은 “사용장비 정보는 물론 키보드 입력 패턴이나 리듬, IP 정보, 장치 ID 등은 기본에 쿠키까지 싸그리 (수집한다)”면서 “(싸그리 수집한) 정보는 중국 내 보안 서버에 저장된다. 사용자는 이러한 사실을 충분히 이해하고 신중히 사용 여부를 결정해야 한다”고 설명했다.

딥시크 R1은 최근 애플 앱스토어에서 챗GPT를 제치고 다운로드 순위 1위에 오르며 큰 주목을 받았다.

딥시크 기술 보고서에 따르면 딥시크V3 개발에 투입된 비용은 557만 6000달러(약 78억 8000만원)에 그친다. 엔비디아의 ‘H800 GPU’를 시간당 2달러에 2개월 동안 빌린 비용으로 계산됐다. 이는 메타가 최신 AI 모델인 라마(Llama)3 모델에 ‘H100’으로 훈련한 비용의 10분의 1 수준이다. 딥시크가 사용한 H800은 미국의 고성능 칩 수출 규제로 엔비디아가 H100의 사양을 낮춰 출시한 칩이다.

게다가 딥시크 ‘추론 AI’ 모델인 ‘R1’이 챗GPT 개발사 오픈AI가 지난해 9월 출시한 추론 AI 모델 ‘o1’보다 일부 성능이 앞서는 것으로 나타났다.

훨씬 적은 비용으로 개발된 AI 모델이 업계 선두 업체의 AI 모델에 필적할 만한 성능을 낸 것으로 업계는 평가하고 있다.

신진호 기자