딥시크 모델 개발비 82억은 과장...총비용은 100배 달할 것
Deepseek 여파가 아직도 잦아들지 않는 가운데 흥미로운 기사가 나왔네요.
요약하면 개발비용 557만달러(82억)은 알맹이 다 빼놓고 학습훈련에 들어간 비용한 발표한 거라는 내용입니다.
Deepseek가 저성능 GPU에서도 비슷한 결과를 내놓을 수 있다고 했는데요. 애초에 그 GPU들은 전부 모회사에서 가지고 있는 것들이고 A100 1만장, H800 1만장 외에도 총 5만장의 GPU를 보유한 것으로 추정되는데 이에 대한 비용은 하나도 계산이 안되었다는 것이죠.
이 GPU들 구매 비용만 조단위에 매년 운영비용도 수천억이 드는데다 고액으로 채용하고 있는 개발자들 인건비까지 감안하면 터무니없는 숫자라고 합니다. 결국 이거저거 다 감안하면 미국 빅테크들이랑 비슷한 규모의 금액이 투입됐을 것으로 추측된다는 기사인데요.
결국 쩐의 전쟁에서 중국 회사들은 미국회사들 만큼 돈을 지를 수 있다는 소리니 이게 우리 입장에서는 꼭 좋은 소리는 아닐 수도 있겠네요. 특히나 이 기사의 내용은 deepseek 성능은 특히나 추론 모델은 앞서가고 있다고 하니 오히려 더 긴장해야 되는거 아닌가 싶습니다.
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit
개인 정보를 아무런 꺼리낌 없이 무한으로 취합할 수 있는
곳이 중국이니 그것만으로도 엄청난 절감 효과가 !!
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit