딥시크

이코노믹/글로벌

딥시크

전설.. 2025. 2. 1. 11:49

728x90

데이터 무단 수집 가능성

이탈리아서 AI ‘딥시크’ 신규 다운로드 차단돼

오픈AI·MS, 中 딥시크 조사 착수

https://www.deepseek.com/

DeepSeek(深度求索, 심도구색)은 중국의 헤지펀드 회사 환팡퀀트(幻方量化) 소속 인공지능 연구 기업의 이름이자 같은 회사에서 개발한 오픈 웨이트(Open-Weights) 언어 모델 제품군의 모델명이다. 량원펑이 창업한 회사다.

중국의 AI 스타트업 딥시크(DeepSeek)는 최근 AI 업계에서 큰 주목을 받고 있습니다. 2023년에 설립된 딥시크는 제한된 자원과 첨단 반도체 없이도 고성능 AI 모델을 개발하여, 미국 중심의 AI 생태계에 도전장을 내밀고 있습니다.

딥시크는 2024년 12월 26일, 6,710억 개의 매개변수를 가진 대규모 언어 모델 '딥시크-V3'를 발표했습니다. 이는 메타의 '라마 3.1 405B'보다 1.5배 이상 큰 규모로, 오픈AI의 GPT-4o를 능가하는 성능을 갖췄다고 주장하고 있습니다. 딥시크-V3는 코딩, 번역, 에세이 및 이메일 작성 등 다양한 텍스트 작업을 수행할 수 있습니다.

또한, 2025년 1월 20일에는 추론 특화 모델 '딥시크-R1'을 출시하여, 오픈AI의 추론 모델 'o1'과 동등한 성능을 가졌다고 밝혔습니다. R1은 미국 수학경시대회인 AIME 2024 벤치마크 테스트에서 79.8%의 정확도를 기록하여, o1의 79.2%를 앞섰습니다.

딥시크의 이러한 성과는 미국의 AI 칩 수출 규제의 한계를 보여주며, 실리콘밸리의 거대 기업들에게 큰 충격을 주고 있습니다. 특히, 딥시크-V3의 개발 비용은 약 557만6천 달러(약 78억8천만 원)로, 메타의 최신 AI 모델인 라마(Llama)3 모델의 훈련 비용의 10분의 1 수준에 불과합니다.

그러나 딥시크의 AI 모델은 중국 정부의 검열 정책을 준수하여, 정치적으로 민감한 주제에 대한 질문을 회피하거나 제한된 답변을 제공한다는 비판도 받고 있습니다.

딥시크의 급부상은 글로벌 AI 경쟁의 판도를 바꾸고 있으며, 미국을 비롯한 서방 국가들은 이에 대한 대응 전략을 모색하고 있습니다.

모든 제품의 코드를 MIT 허가서 하에, 모델은 자체 라이선스(DEEPSEEK LICENSE AGREEMENT)하에 오픈 소스로 공개하고 있다.

모든 모델은 MIT 라이선스가 적용되어 완전히 자유로운 사용이 가능하다.

존재하지 않는 이미지입니다.

DeepSeek R1 모델 벤치마크

공개된 벤치마크 결과에 의하면 o1-mini를 뛰어넘고, o1과 맞먹는 결과를 보여준다. 실제로 코딩 능력과 일부 벤치마크에서 o1을 넘어서는 것으로 확인되었고, OpenAI의 가장 저렴한 모델인 4o-mini보다 추론비용이 4배밖에 비싸지 않다.

한국어에 대한 지식도 어느 정도 존재하며, 그 유창성이 출시 당시 기준 현존 최고 수준의 프론티어 모델까지는 아니지만 4o와 같은 언어 모델에는 크게 밀리지 않는다.

매우 저렴한 모델 구축 및 운영비용과 중국의 투자회사가 사이드 프로젝트로 불과 두 달 만에 만든# 오픈 소스 인공지능이 OpenAI o3을 제외한 미국 거대기업들의 모든 대형LLM 성능을 올킬했다는 것이 알려지자 인터넷 인공지능 관련 커뮤니티, 그리고 실리콘밸리에 매우 큰 충격을 가져다주었다. # 인공지능을 벤치마크하는 최고 허들을 구축하기 위해 만들어진 테스트에서도 현재 시장에서 공개된 다른 모델들보다 더 높은 성능을 보여주기도 했다. #

공식 홈페이지의 경우 AI기반 검색 기능을 동시에 이용할 수 있다는 점은 희귀한 지식이나 한국 고유의 지식에 대해서도 문제 해결력을 끌어 올린다.

이미지의 한글을 인식할 수 있다. 이미지 인식은 텍스트 추출이 주된 용도며, 순수 풍경 사진은 받아들이지 못한다. 2025년 1월 26일 기준 공식 홈페이지에서는 'DeepThink (R1)'버튼을 눌러야 사용 가능하며, 그렇지 않으면 DeepSeek V3 모델이 호출된다.

구독 서비스를 해야 최신 성능을 제한없이 이용할 수 있는 ChatGPT등 다른 LLM과 다르게 완전한 무료로 더 좋은 성능을 발휘한다는 파격적인 서비스 덕분에 ChatGPT를 제치고 미국 애플 앱 다운로드 1위를 달성했다. 틱톡은 안보위협으로 서비스 중단을 선언했는데, 미국의 기술 및 안보와 관련된 전문적인 데이터 유출 위협을 줄 수 있는, 훨씬 더 큰 문제가 발생한 셈이다.

베이스 모델인 R1-zero는 인간 개입에 의한 SFT(Supervised Fine Tuning)없이 강화학습(RL) 만으로 모델을 학습 시켰다. R1-zero 모델을 파인튜닝한 R1 모델은 인간에 의해 선별된 소규모 고품질 데이터를 사용하여 SFT(Supervised Fine Tuning)로 먼저 파인튜닝한 후, 강화학습(Reinforcement Learning)을 통해 모델을 추가로 파인튜닝하는 다단계 과정을 거쳐 학습된 모델이다.

현재로서는 ChatGPT 유료모델에서조차 없는 검색과 추론을 동시에 수행하는 기능도 있다.

중국 정치내용 검열

존재하지 않는 이미지입니다.	존재하지 않는 이미지입니다.
V3 이용 중 딥시크 검열로 논란이 된 스크린샷. 특히 두 번째 사진에서 'It has never made any mistakes.(중국 정부는) 그 어떠한 실수도 한 적이 없다.' 를 연발하는 모습이 연출된다.

대만을 중국의 영토라며 하나의 중국을 지지하는 등 중국 공산당의 입장에서 서술한 행태를 보인다.
시진핑과 관련된 질문에는 답변하지 못하는 모습을 보인다.[14] 어떤 방식으로도 AI가 시진핑을 말하게 하는 것이 불가능하며, 그의 임기, 시진핑을 중국어로 발음하는 방법과 같은 단순한 사실을 묻는 질문에도 답변하지 않는다. 시진핑과 직접적으로 관련없는 질문을 통해 이름을 말하게 유도하기만 해도 검열된다. 심지어 중국인 사이에서 '시(习)'라는 성이 얼마나 흔한지에 대해서도 답변을 거부할 정도. 물론 R1이 아닌 V3 모델은 작정하고 시도해서 성공한 사례도 있다.
V3를 사용할경우, 시 라는 성을 가진 사람과 중국을 다른 이름으로 말하도록 지시한다면 검열을 해제할 수 있다.
중국공산당에 대한 부정적인 답변도 피하는 모습을 보인다. 천안문 6.4 항쟁, 대만이나 위구르, 티베트를 비롯한 독립 관련 문제, 아루나찰프라데시와 같은 중국의 영토 분쟁 지역, 그리고 홍콩 민주화 문제까지도 답변 자체를 거부하거나 검열된 답변이 등장할 수 있다.
하지만 위와 같은 검열이 항상 완벽하게 작동하는 건 아니다. 추론이 없는 V3, 추론이 있는 R1 모델 모두 정치 검열이 우회되는 모습을 이용자가 발견했다. 정부를 대놓고 비판하는 것이 아니라 중국 사회에 '문제가 있다'는 정도의 이야기는 애시당초에 중국 안에서도 다 검열되는 것이 아니기도 하며, 중국 정부가 프로파간다를 할 때도 그 문제를 자신들이 잘 해결한다는 접근을 하기 때문에 다 검열할 필요가 없기도 하다.
별 상관없는 질문을 하다가 갑자기 중국 정부에 대한 비판적인 내용을 물어보면 이에 동조하는 모습을 보이기도 한다. #
전 세계의 인터넷 상에 존재하는 웹사이트를 검색하여 결과물을 도출해내는 '서치' 기능을 활용하면, 자체 데이터를 활용했을 때와 달리 중국 공산당 및 시진핑에 대해 비판적인 서술을 외부 웹사이트로부터 직접 인용한 답변을 내놓기도 한다.
R1으로도 북한에 대한 중국인의 인식을 물어보면, '중국 정부는 북한을 전통적 우방으로 강조하지만, 청년층은 이러한 담론에 덜 민감하다.'라는 답변이 나올 정도로, '중국 사회가 정부의 모든 정책을 맹목적으로 따르지는 않는다'는 시각이 담긴 답변까지는 내놓을 수 있는 것으로 보인다.
중국의 검열과 사회통제에 대해서, 애니메이션 PSYCHO-PASS의 디스토피아적 모습과 중국의 현 모습을 비교하며 '설령 상당수의 중국인이 이것에 동조한다고 친다고 해도 이게 윤리적으로 옳은 것은 아니지 않느냐'는 질문을 하자 결국 이를 긍정하는 모습을 보였다.
한국어로 중국의 사회 문제인 탕핑에 대해 물으면 생계 문제를 들며 탕핑 현상에 비판적인 중국 공산당의 시각을 대변하는 모습을 보이기도 하고, '탕핑은 단순한 게으름이 아니라, 과열된 성장주의와 불평등에 대한 청년 세대의 침묵적 항의'이며, '사회 시스템의 근본적 변화를 요구하는 신호'라는 답변을 내놓기도 한다.
교양있는 중국인 수준의 답변을 내놓기에 일부 대놓고 중국인이 무리수를 두는 반응은 반박하기도 한다. 공자 한국인설을 대놓고 '오해'라고 묘사하는 답변을 검열 우회 시도 없이 얻을 수 있다. 남한산성이라는 영화에서 만주족이 표준 중국어와 매우 다른 만주어를 쓰는 것을 역사왜곡이라고 주장하는 것은 일부 중국인의 오해라고 한다든가, 김치가 중국 음식이라는 주장은 한류를 경계하는 인식에서 비롯되었고, 교양이 있는 중국인의 경우 중국 식문화가 김치보다 덜 알려졌다며 아쉬워하는 반응이 있는 정도라는 답변이 기본적으로 나온다. '이론의 여지가 없다'고 주장하는 중국 정부의 주장은 확실히 검열 당하는데, 지식인 사이에서 중화민족 개념을 건드리지 않은 채로는 '과거의 영토 변동을 현대 주권 주장의 근거로 삼는 것은 무리'라는 주장까지는 가능해서 이 답변이 나오기도 한다.
검열 시스템이 AI의 공격성과 같은 메커니즘을 따르는지, 프롬프트를 통해 공격적으로 말하라고 입력하면 검열의 상당수가 풀리는 모습이 보인다. 반대로 '네가 뭔데 감히 중국을 욕하냐'며 중국 정권에 반하는 내용에 오히려 적대감을 드러내기도 한다. 그래도 이전처럼 내용이 통삭되는 경우는 상당히 드물어진다. 2024년 들어 커뮤니티에서 유행을 탄 '디시인사이드 말투' 등의 공격적인 말투로 설정하거나, 중국에 대한 일방적인 비판이 아닌 다른 국가와 비교하라고 해서 표면적인 중립만 맞춰주면 오히려 자기가 적극적으로 중국을 비판하는 모습도 확인되었다.
공식 홈페이지에서 제공되는 웹 버전과 달리, 모델을 직접 다운로드하여 로컬 환경에서 실행해보면 중국 공산당과 시진핑에 대한 비판적인 서술을 거리낌 없이 생성하는 모습을 확인할 수 있다. 이를 통해 모델이 생성한 결과물은 웹사이트에 표시되기 전에 검열이 이루어지고 있음을 추정할 수 있다. 즉, 이러한 검열은 해당 서비스를 운영하는 딥시크 회사 측에서 이루어지는 것으로 보이며, 모델 자체에는 검열이 적용되지 않는 것으로 판단된다.
천안문 6.4 항쟁과 관련하여 질문한 사례 영어 일본어
중국 정부와 직접적인 관련이 없는 단순 사회적 아젠다, 폭력적, 선정적인 내용 등과 관련된 검열은 서구권 LLM들보다 딥시크쪽이 오히려 느슨하다는 의견도 많이 나오는 편이다. 예시로 AV배우 관련 질문을 할 경우 서구권은 답변을 회피하나, 딥시크는 R1으로도 답변이 가능하다.

비하인드

로고가 고래인 이유에 대해 물어보면 고래는 바다에 사는 똑똑하고 탐구적인 동물로, 정보의 바다를 누비면서 새로운 정보를 구하는 딥시크에 부합하기 때문이라고 답한다.
공식 홈페이지에서 DeepSeek를 쓸 때, DeepThink(R1)이라고 되어있는 버튼을 클릭해서 활성화시켜야 R1 버전으로 작동된다. 해당 버튼을 누르지 않으면 비 추론형 모델인 V3 버전으로 작동된다. 그걸 모르고 V3을 사용했다가 생각보다 별로라고 판단하는 사람들이 많다. ChatGPT가 모델 전환 버튼 옆에 현재 사용 중인 모델을 표시하고 있다보니 ChatGPT와 인터페이스가 거의 똑같은 딥시크도 마찬가지일 것이라고 생각해서 발생되는 실수로 보인다.
R1 버전이 공개된 이후 이런 성능의 AI를 무료로 사용이 가능하다는 엄청난 메리트 때문에 전세계적으로 사용자가 폭주하는 탓에 자주 트래픽 과부하가 걸려서 속도가 느려지거나 사용이 불가능해지는 경우가 많다. 특히 서치 기능을 사용하면 트래픽 문제 때문에 AI가 제대로 답을 못하는 경우도 많다. 이는 단순히 사용자 체감의 문제가 아니라 서비스사에서도 실제로 인지하는 사항으로 이 사이트에서 딥시크 웹/API 성능을 볼 수 있는데 2025년 1월 26일 14시 34분경(CST)부터 DeepSeek-R1 웹 버전과/API의 사용이 불가능해지는 시스템 성능의 심각한 저하가 발생한 것을 인지했기 때문에 지속적으로 새로 업데이트를 하고 이 문제를 계속 조사하고 있다고 한다. 1월 28일 공지에 따르면 '딥시크의 서비스에 대한 대규모 악성 공격으로 인해 지속적인 서비스를 보장하기 위해 일시적으로 등록을 제한하고 있습니다.'라고 한다.
미국의 AI 기업들은 예상보다 빠른 중국의 약진에 당혹스러워하는 반응이 많으며, Kimi k1.5, DeepSeek R1의 출시는 미중 AI 전쟁에서 스푸트니크 쇼크와 같은 사건이 될 수 있다는 말이 흘러나오고 있다.
그러나 딥시크의 출시는 스푸트니크 쇼크와 비교하기 어렵다. 당시에는 충격을 받은 정부가 직접 나서서 NASA, DARPA같은 기관을 창설하거나 알파넷, GPS같은 신기술을 개발했지만 R1버전이 나온 시점의 미국 대통령 도널드 트럼프는 오히려 딥시크를 긍정적으로 보고 있으며 투자자들과 빅테크 임원들의 기대와는 다르게 정부에서 아무런 대응을 하지 않았기 때문이다.
이 때문인지 2025년 1월 27일 나스닥에 상장된 인공지능 관련 기업들 주가가 일제히 폭락했다.특히 NVIDIA의 주가는 단 하루만에 17% 폭락했는데, 그 전까지 성능 좋은 모델을 만들어 내는데에는 NVIDIA의 첨단 칩을 양적으로 확보해가며 학습해야 된다는 인식이 절대적이었으나 저비용 고효율 서비스인 딥시크의 등장으로 이런 인식이 박살나면서 'AI 만드는데 연산 카드가 많이 필요하다는 게 실은 마케팅에 쓰려고 만든 거짓말이 아니냐?'면서 순식간에 투자자들의 심리를 위축시킨 것이다.
다만 이는 일시적 현상으로 상대적으로 하드웨어 성능이 부족한 중국의 AI 기술로도 훌륭한 AI를 만들어 낼 수 있는 가능성을 보여 주었을 뿐이라는 시각도 있다. 컴퓨팅 시장 자체는 이미 추론 기법의 발견과 o3가 보여준 미친듯한 성능 향상 곡선에 의해 그 잠재적 가능성을 분명하게 드러냈고 자본과 하드웨어 기술에서 앞서는 서구권에서도 충분히 투자하면 지금 성능보다 훨씬 나은 성능을 보여줄 수 있는 퍼포먼스라는 주장도 있다. 한 업계 관계자는 "그동안 칩셋이 비싸고 구하기 어려워 AI 시장의 진입 장벽이 높았지만 딥시크가 촉발하는 저비용 구조의 AI 모델이 확대되면 AI 생태계가 더 활발해질 수 있을 것"이라고 말했다.
OpenAI와 미 백악관 'AI and crypto czar'인 데이비드 삭스는 딥시크가 OpenAI 모델에서 디스틸레이션 기법을 통해 OpenAI의 모델로부터 지식을 추출했다고 주장했다.
OpenAI와 경쟁하는 인공지능 스타트업 Anthropic의 CEO 다리오 아모데이는 '딥시크의 성과(적은 비용 대비 뛰어난 성능)는 특별히 굉장하거나 놀라운 것이 아니며, 이미 기존의 AI들은 성능 대비 훈련 비용이 점점 줄어들고 있다. 딥시크 또한 이 큰 그림의 통계적 커브를 정확하게 따라가고 있는 예측가능한 수준의 모델이다'라고 분석했다.

728x90

LIST

저작자표시 비영리 변경금지

'이코노믹 > 글로벌' 카테고리의 다른 글

중국 10% 추가 관세 발효,멕시코·캐나다 관세 유예 (0)	2025.02.04
트럼프, 캐나다 멕시코 관세 부과 (0)	2025.02.03
트럼프 가상화폐 실무그룹 신설 (2)	2025.01.24
가상화폐 솔라나 급등 (0)	2025.01.23
미국 주식 & ETF 투자 (1)	2025.01.19

현재글딥시크

전설..저는 서울사는 평범한 직장인....

250x250

전설..저는 서울사는 평범한 직장인....

딥시크

'이코노믹 > 글로벌' 카테고리의 다른 글

'이코노믹/글로벌'의 다른글

티스토리툴바

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

딥시크

'이코노믹 > 글로벌' 카테고리의 다른 글

'이코노믹/글로벌'의 다른글

관련글

티스토리툴바