읽기 설정
투자자분들께 28년부터 수익성을 달성할 계획이라고 말씀드리셨고, 올해는 천재들의 나라를 데이터센터로 확보할 가능성이 있는 해이며, 이를 통해 이 모든 발전과 의학 분야에 긍정적인 영향을 줄 수 있게 될 것입니다.
그리고 건강, 기타 등등, 그리고 새로운 기술들입니다.
이럴 때 오히려 사업에 재투자해서 더 큰 규모의 데이터 센터를 구축해서 더 많은 발견을 할 수 있도록 하는 것이 적절한 시기가 아닐까요? 수익성이라는 게 이 분야에서는 좀 이상한 개념인 것 같아요.
저는 이 분야에서 수익성이, 음, 자원을 소비하는 것과 사업에 투자하는 것을 측정하는 척도가 되기는 어렵다고 생각합니다.
음, 이 모델을 한번 가져가 보도록 하겠습니다.
저, 사실 수요가 예상보다 훨씬 많을 때 수익이 발생한다고 생각하고, 수요를 예상보다 적게 잡았을 때 손실이 발생한다고 생각해요. 데이터 센터를 미리 구매하기 때문이죠.
이렇게 생각해보시면 좋을 것 같습니다. 이상적으로는, 물론 이 또한 스타일화된 사실이라는 점을 감안해서 말씀드리지만요.
이 숫자들은 정확하지 않아요. 여기서는 간단한 모델을 만들려고 할 뿐이에요. 컴퓨팅의 절반은 학습에 쓰고, 절반은 추론에 사용한다고 해 봐요. 그리고 추론은 50% 이상의 큰 마진을 가지고 있어요.
그것이 의미하는 바는, 만약 스테디 스테이트 상태였다면, 데이터 센터를 구축할 수 있었을 것이고, 정확히 어떤 수요가 들어올지 알고 있었을 것이라는 뜻입니다.
수익이 어느 정도 발생할 수 있습니다. 예를 들어, 정확히 얼마인지는 잘 모르겠지만, 대략...
컴퓨팅에 연간 1천억 달러를 지출한다고 가정했을 때, 연간 5천억 달러를 지원하여 1조 5천억 달러의 수익을 창출하고, 나머지 5천억 달러는 학습에 사용됩니다.
기본적으로 말씀하신 대로 수익성이 좋으시고, 500억 달러의 이익을 내고 계시는군요.
현재 이 업계의 경제 상황은 이렇습니다. 아니, 오늘이 아니라 앞으로 1년 또는 2년 정도 후에 그렇게 예상하고 있습니다.
그렇게 되지 않는 유일한 경우는 50억 미만의 수요가 발생할 때입니다. 그럴 경우, 데이터 센터의 50% 이상이 연구에 사용되면서 수익성이 발생하지 않게 됩니다.
더 강력한 모델을 훈련하지만, 수익성이 없으시군요. 예상보다 수요가 많아지면 연구 예산이 줄어들죠. 하지만, 아시다시피 추론을 더 많이 지원할 수 있게 되면서 수익성이 높아지실 수 있습니다.
제가 설명이 부족했던 것 같습니다만, 제가 말씀드리고 싶은 부분은 먼저 컴퓨팅 자원의 양을 결정하신 다음에, 추후 추론과 훈련 간의 목표 성능을 정하시는 것입니다.
하지만 그건 수요에 따라 결정되는 문제입니다. 결정하시는 분에 의해 결정되는 것이 아닙니다. 제가 듣기로는, 수익을 예측하시는 이유가 컴퓨팅 자원에 체계적으로 투자를 덜하고 있기 때문이라는 말씀이신가요?
솔직히 말씀드리면 예측하기 어려운 상황이잖아요. 그래서 2028년이나 언제쯤 될 거라는 이야기들은 저희가 투자자분들께 최선을 다해 설명하려는 노력의 일환입니다. 이런 모든 것들은 불확실성 범위 때문에 정말 불확실합니다.
만약 수익이 충분히 빠르게 성장한다면, 2026년에 수익을 낼 수도 있겠어요. 그리고, 아시겠지만, 내년에 너무 낙관적이거나 비관적으로 예측하면 크게 변동될 수도 있겠죠.
제가 말씀드리고자 하는 것은, 사업 모델을 머릿속에 가지고 계신다고 생각하시면, 투자를 계속 투자를 계속 투자를 계속 투자를 하시고, 규모를 확장하신 후에 수익을 내는 그런 식으로 되는 것이죠.
상황이 완전히 바뀌는 지점이 한 곳으로 정해진 것은 아닌 것 같습니다. 그리고 저는 이 업계의 경제 구조가 그렇게 작동하지 않는다고 생각합니다.
알겠습니다. 제가 이해한 대로 말씀드리면, 저희가 받아야 할 컴퓨팅 자원과 실제로 받은 자원 간의 차이 때문에 어쩔 수 없이 이익을 챙기게 되었다는 말씀이시죠? 하지만 그렇다고 해서 앞으로도 계속 이익을 낼 것이라는 의미는 아니라는 말씀이신 것 같습니다.
다시 투자를 진행할 계획입니다. 인공지능 기술이 워낙 빠르게 발전했기 때문에, 더 많은 천재들이 모인, 규모가 큰 국가를 만들고 싶어서입니다. 수익은 높지만 손실도 상당한 상황입니다.
만약 매년 수요를 정확히 예측할 수 있다면, 연구에 컴퓨팅 자원의 50% 정도를 투자하는 것으로 보아 매년 수익을 낼 수 있을 것입니다.
50%를 초과하는 매출총이익과 정확한 수요 예측은 이익으로 이어집니다.
제가 생각하기에, 그건 꽤 수익성이 좋은 사업 모델인데, 마치 앞에 보이는 건물이나 예측 오류 때문에 가려져 있는 것 같습니다.
음, 50%를 마치, 그러니까, 일종의 상수처럼 가정하고 계시는 것 같습니다.
사실 AI 발전이 빠르고, 더 많은 규모로 확장하여 발전을 가속화할 수 있다면, 50%를 넘어서도 이익을 내지 않아도 됩니다. 제가 말씀드릴 것은, 규모를 더 키우는 것이 좋을 수도 있다는 점입니다. 아시다시피, 규모의 경제는 로그 형태로 돌아오니까요.
70% 정도면 모델 크기를 1.4배 정도 줄일 수 있을까요?
저처럼 추가로 200억 달러가 있다면, 아시다시피, 그 한 달러 한 달러마다 그 가치가 현저히 떨어지는 경향이 있습니다. 로그 선형 모델의 경우에 더욱 그렇죠.
그리고 아마 $200억 달러를 활용하는 방식으로는 추론 서비스 제공이나, 좀 더 뛰어난 역량을 갖춘 엔지니어를 채용하는 것이 더 나을 수도 있겠습니다.
그래서 제가 50%라고 말씀드린 건, 그게 정확히 저희의 목표는 아닙니다.
정확히 50%라고 단정 지을 수는 없을 겁니다. 시간이 지남에 따라 변동이 있을 가능성이 높습니다. 제가 말씀드리는 것은 로그 선형 수익인데, 그 결과는 비즈니스의 일부분 정도를 투자하는 것이 된다는 의미입니다.
아니요, 5%도 아니고, 95%도 아닙니다.
그리고 나서 로그 스케일 확장 때문에 수익 체감 효과가 줄어들게 되죠. 제가 다리오에게 인공지능 발전이나 뭐에 대해 믿게 설득하는 게 좀 이상하게 느껴지지만, 좋아요, 연구에는 수익 체감 효과가 있으니까 투자하지 않는 거잖아요. 하지만 말씀하신 다른 부분에는 투자하는 거겠죠.
다시 말씀드리지만, 연간 500억 원 정도를 지출하는 시점이 되면 수익이 점점 줄어들게 됩니다. 분명히 말씀하실 부분일 것이라고 생각합니다만, 천재의 경우 이러한 수익 감소율이 상당히 높을 수도 있습니다.
일반적으로 시장 경제에서 이익이 왜 중요한지 말씀드리면, 다른 회사들이 이 돈으로 더 많은 일을 할 수 있다는 의미입니다. 저는 그냥, Anthropic에 대한 정보는 말씀드리고 싶지 않아서요. 이익을 제치고 옆에 두는 것은, 그 부분이 제가 하고 싶지 않은 일입니다.
이런 스타일의 숫자들을 제시하는 이유가 바로 그런 이유이고, 자 이제 업계의 균형을 찾아봅시다, 그렇죠? 그럼 왜 모두가 컴퓨팅 자원의 100%를 사용하지 않을까요?
훈련에 집중하고 고객 응대는 하지 않는다는 말씀이시죠? 왜냐하면 수익이 발생하지 않으면 자금을 조달할 수 없고, 컴퓨팅 거래를 할 수 없으며, 다음 해에 더 많은 컴퓨팅 자원을 확보할 수 없기 때문입니다.
따라서 모든 기업이 교육에 100%를 쏟지 않고, 추론에도 100%를 쏟지 않는 균형 상태가 나타날 것입니다. 현재 모델을 그대로 제공하지 않고 개선해야 하는 이유가 분명해질 것입니다.
다른 모델을 계속 훈련해야 하는 이유는 수요가 없기 때문이에요. 뒤쳐지면 안 되니까요. 따라서 어떤 균형이 존재할 거예요. 10%도 아닐 겁니다.
90%로 되기는 어려울 것 같아요. 그냥 스타일리쉬한 사실처럼, 50%라고 말씀드리는 것이 좋겠습니다.
제가 말씀드리고자 하는 바로 그 점입니다. 그리고 저희는 훈련에 투자하는 비용과 연산 자원을 통해 얻을 수 있는 매출 총이익 사이의 균형이 깨지는 상황에 놓일 것이라고 생각합니다.
따라서 근본적인 경제적 측면은 수익성이 좋습니다. 문제는 내년에 컴퓨팅 자원을 구매할 때, 이 지옥같은 수요 예측 문제가 발생한다는 것입니다.
그리고 예상하시는 것처럼 수익성이 좋을 수도 있지만, 연구를 위한 컴퓨팅 자원이 부족할 수도 있습니다.
혹시 너무 많이 예상해서 손해가 될 수도 있고, 연구를 위해서 세상에서 가장 많은 컴퓨팅 자원을 확보하게 될 수도 있겠죠.
이해가 되세요? 이건 업계의 역동적인 모델입니다. 음, 좀 더 멀리 떨어져서 보면, 제가 말하는 건 천재 국가가 2년 안에 나타날 거라고 생각해서 이걸 사라고 말하는 게 아니라는 뜻입니다.
저에게는, 지금 말씀하시는 결론이 상당히 설득력 있게 들립니다. 하지만, 마치 천재들이 모인 나라를 만들고 발전시키는 게 어렵고, 아직 갈 길이 멀다는 말씀이신 것 같아요.
음, 조금 거리를 두고 보니 제가 말씀드리고 싶은 부분은, 혹시 당신의 세계관이 '우리가 10년 안에 조만간 조 단위의 달러를 생성하는 세상에 다가갈 것이다' 라고 말하는 사람과 일맥상통할 수도 있다는 점입니다.
그것은 제 생각과는 전혀 다릅니다. 제 생각은 그렇지 않습니다. 그래서, 다른 예측을 해보겠습니다.
2030년 이전에 매출액이 조 단위가 없을 것이라는 점을 제가 보기 어렵습니다. 음, 예를 들어, 상상해 볼 수 있는 합리적인 세상은 분명히 존재합니다.
아마 세 년 정도 걸릴 거예요. 그러니까, 제가 생각하기에 가능성이 있는 시나리오의 끝은 아마 거기일 거라고 생각해요. 2028년쯤에 데이터 센터에서 진짜 천재 국가가 나타나는 거죠.
음, 매출액이, 매출액이 계속 증가해서, 아마도 2028년쯤에는 백조억 단위로, 백조억 단위가 될 수도 있을 것 같습니다.
그리고, 그리고, 그런 다음 천재들의 나라에서 그것을 조 단위로 가속화시키죠, 아시겠지만, 그리고, 기본적으로 저희는 확산의 느린 단계를 밟고 있는 것 같습니다.
조만간 조 단위로 올라가는 데 2년이 걸릴 거예요. 2030년까지 기다려야 하는 세상일 수도 있죠. 2030년 이전에 기술적인 지수 함수와 확산 지수 함수를 고려해도, 분명 그 정도는 될 거라고 생각해요.
그러니까, Anthropic가 이익을 얻는 모델을 구축하셨는데, 근본적으로 컴퓨팅 자원이 부족한 세상에 있다는 가정에서 출발하신 것으로 보입니다.
그래서 결국 저희는 계속해서 컴퓨팅 성능을 늘려나갈 겁니다. 음, 수익이 발생하는 방식은, 다시 한번 말씀드리지만, 아시다시피 이 업계 전체를 추상화해서 보면, 마치 경제학 교과서에 나오는 것처럼 생각할 수 있습니다.
저희는 소수의 기업들을 보유하고 있습니다. 각 기업은 연구 개발에 제한된 금액을 투자할 수 있거나, 예를 들어, 각 기업이 연구 개발에 일정 비율을 투자할 수 있습니다.
그들은 서비스를 제공하는 데 약간의 한계 비용이 발생합니다. 그 한계 비용에 따른 마진, 이익 마진, 총 이익 마진은 매우 높습니다. 추론이 효율적이기 때문에 어느 정도 경쟁은 있지만, 모델 자체도 차별화되어 있습니다.
몇몇 회사들이 연구 예산을 늘리기 위해 경쟁할 수는 있겠지만, 관련 업체 수가 적기 때문에, 뭐라고 해야 할까요?
저는 코르노 균형이 소수의 기업에 의한 균형이라고 생각합니다.
말씀하시는 건, 완벽한 경쟁으로 인해 마진이 제로가 되는 균형을 이루지 못한다는 거죠? 만약 경제에 세 개의 기업이 있고, 그 기업들이 독립적으로, 합리적으로 행동한다면요.
완벽한 경쟁 상황으로 균형을 이루지 않아요. 제가 이해하는 데 도움을 주시겠어요? 지금 세 개의 주요 기업이 있는데, 아직 이윤을 내지 못하고 있거든요.
그리고, 네, 무엇이 변하고 있나요? 네, 현재 매출총이익은 매우 긍정적이네요.
무슨 일이 일어나고 있는지는 두 가지의 조합이에요. 하나는 아직 컴퓨팅의 지수적 성장 단계에 있다는 것이죠.
그러니까, 기본적으로 말씀드리면 모델을 학습시키는 데 드는 비용이 있다는 뜻입니다. 작년에 학습시킨 모델 한 개가 10억 달러가 들었다고 해 봅시다.
그리고 올해는 40억 달러의 수익을 올렸고, 추론하는 데 10억 달러의 비용이 들었습니다.
음, 아시다시피, 또 다시 말씀드리지만, 여기서는 스타일화된 숫자를 사용하고 있습니다. 대략 75퍼센트 정도의 매출총이익률과, 약 25퍼센트의 세금을 고려해야 할 것 같습니다.
그래서 전체적으로 그 모델은 20억 달러의 수익을 냅니다. 하지만 동시에 다음 모델을 훈련하는 데 100억 달러를 지출하고 있습니다. 그 이유는 기하급수적인 확장이 있기 때문입니다.
그래서 회사는 돈을 잃게 됩니다. 각 모델은 돈을 벌지만, 회사는 돈을 잃어요. 제가 말씀드리는 균형은, 데이터센터에 천재들이 있는 나라와 같은 균형이라는 뜻입니다.
데이터 센터에는 천재들이 있는 나라이지만, 모델 학습 확장 규모가 좀 더 균형을 이루고 있습니다. 어쩌면 아직도 증가하고 있을지도 모르겠네요.
수요 예측은 아직 진행 중이지만, 좀 더 안정적인 흐름을 보이고 있습니다.
제가 말씀드릴 내용이 몇 가지 있습니다. 우선 현재 세계 상황부터 살펴보겠습니다. 말씀하신 대로 현재 세계에서는 개별 모델 하나하나를 회사로 본다면 수익을 낼 수 있습니다.
물론, 최전선 연구실의 생산성에서 중요한 부분을 차지하는 것 중 하나는 차세대 모델을 훈련시키는 것이라고 생각합니다, 그렇죠?
만약 그렇게 하지 않으셨다면, 두 달 동안 이익을 얻으실 수 있습니다. 하지만 최상의 모델이 없기 때문에 마진을 확보하지 못하셨을 겁니다. 네, 현재 시스템으로는 두 달 정도 이익을 얻으실 수 있겠지만, 어느 시점이 되면 그 시스템이 감당할 수 있는 최대 규모에 도달하게 됩니다.
그리고 균형 상태에서는 알고리즘 개선이 이루어지지만, 현재 모델을 학습하는 데 사용했던 비용과 다음 모델을 학습하는 데 사용되는 비용이 거의 비슷합니다.
음, 그러니까 이 균형은, 뭐랄까요, 어느 시점이 되면 경제가 돈이 떨어지게 되고, 고정된 노동량이 따라오며, 경제는 성장할 겁니다, 그렇죠?
그것은 고객님께서 예측하신 내용 중 하나입니다. 저희는 우주에 데이터 센터를 갖게 되겠지만, 말씀드린 주제의 또 다른 예시인데요. 인공지능 덕분에 경제가 이전보다 훨씬 빠르게 성장할 것이라고 생각합니다.
하지만 지금처럼 컴퓨터가 매년 세 배씩 성장하는 것은 아니잖아요.
저는 경제가 연간 300% 성장할 것이라고는 믿지 않습니다. 저는 이것을 '사랑과 은총의 기계'에서 말씀드린 적이 있습니다. 저는 경제가 연간 10% 또는 20% 정도 성장할 수 있다고 생각하지만, 연간 300% 성장은 이룰 수 없을 것이라고 생각합니다.
그러면 결국, 음, 경제가 컴퓨팅을 대부분 생산하게 된다면, 그게 한계에 도달할 거라고 생각해요. 자, 이제 컴퓨팅이 한계에 도달한 상태라고 가정해 봅시다.
프론티어 랩스가 수익을 창출하는 세계는, 궁극적으로 대체재의 품질에 의해 마진이 제한되기 때문에 빠른 발전을 지속하는 곳입니다.
그러므로, 귀하께서 프론티어 모델을 가지고 계시기 때문에 수익을 창출하실 수 있습니다. 만약 프론티어 모델이 없으셨다면, 수익을 내지 못하셨을 겁니다.
그래서 이 모델은 안정 상태에 도달하지 않도록 요구합니다. 영원히, 계속해서 알고리즘 개선을 해야 하는 거죠.
전 그렇게 생각하지 않아요. 경제학 수업 같은 거죠, 경제학에 대해 계속 이야기하는 거예요. 타일러 코웬의 명언을 아시나요? 저희는 경제학에 대해 끊임없이 이야기해요.
아니요, 하지만 독과점이라고 할 만한 세상도 있을 수 있어요. 제가 변호사분들께서는 절대로 ‘독과점’이라는 단어를 쓰지 않으시길 바라시지만, 이 분야가 독과점이 될 거라고 생각하지 않아요.
하지만 경쟁 업체가 단 하나가 아닌, 소수 몇몇 플레이어들로 구성된 산업 분야도 분명히 존재합니다.
보통은, 페이스북이나 메타와 같이 독점 기업이 생기는 방식처럼, 저는 늘 그냥 페이스북이라고 부르지만, 이런 종류의 네트워크 효과에 관한 것이죠.
진입 장벽이 매우 높은 산업에 소수의 업체만 존재하게 되는 방식이죠? 클라우드도 바로 그런 경우인 것 같아요. 클라우드는 좋은 예시라고 생각합니다.
클라우드 내에 세 명, 어쩌면 네 명 정도의 플레이어가 있을 것 같습니다.
음, 제 생각에는 인공지능도 아마 세 개 정도, 혹은 네 개 정도는 비슷할 것 같아요. 이유는 클라우드 회사를 운영하려면 정말 많은 비용과 전문 지식, 그리고 자본이 필요하기 때문이죠.
그러니까 자본을 전부 투입해야 하고, 그뿐만 아니라 자본을 투입하는 것 외에도, 많은 기술과 노력이 필요한 여러 가지 다른 요소들을 갖춰야 하잖아요. 마치 누군가에게 가서 산업을 혁신하고 싶다고 말하는 것과 같은 상황이죠.
여기 백억 달러가 있습니다. 마치 '좋아요, 저는 백억 달러를 투자하고, 또 다른 사람들이 해왔던 일들을 다 해낼 수 있다는 걸 걸고 베팅하겠습니다' 라고 말하는 것과 같습니다.
산업 전체의 이익을 줄이기 위한 것이고요. 그리고, 귀사가 진입하면서 이익 마진이 하락하는 효과가 나타나죠. 경제적으로 이런 균형이 계속 발생해요. 몇몇 주요 플레이어들이 있는 거죠.
수익이 엄청나게 높지 않아요. 마진도 엄청나게 높지 않지만, 그렇다고 제로도 아니고요, 그렇죠? 그리고, 음, 제가 생각하기에 이것이 클라우드에서 보이는 모습인 것 같아요. 클라우드는 차별화되지 않은 상태예요.
모델들이 클라우드보다 더 차별화되어 있다는 건 누구나 아시겠지만, 클로드 같은 경우는 클로드답게, GPT와는 다른 강점을 가지고 있고, 제미니 또한 각자 다른 부분에서 뛰어난 모습을 보여줍니다. 단순히…
클로드의 코딩이 뛰어나고, GPT는 수학과 논증에 강점을 가지고 있죠. 음, 그보다 조금 더 미묘한 차이가 있습니다. 모델들은 각기 다른 종류의 코딩에 능숙하답니다.
모델들은 서로 다른 스타일을 가지고 있습니다. 저는 이러한 것들이 실제로 꽤나 서로 다른 점이 있다고 생각하며, 따라서 구름에서 보이는 것보다 더 큰 차이를 기대합니다.
사실 하나 반론이 존재합니다. 그 반론은 만약 그러한 모든 과정, 즉 모델을 생산하는 과정이 있다면, 말입니다.
만약 AI 모델들이 그걸 스스로 할 수 있게 된다면, 그게 경제 전체로 퍼져나갈 수 있겠죠. 하지만, 그건 AI 모델 전반을 상품화해야 한다는 주장이 아니에요.
전체 경제를 한 번에 상품화하는 것과 같은 주장일 수도 있죠. 제가 상상하기에는 누구나 무엇이든 할 수 있고, 무엇이든 지을 수 있고, 아무런 제약도 없는 세상이 되면 어떤 일이 벌어질지 잘 모르겠습니다. 솔직히 잘 모르겠어요.
아마 우리가 그런 세상을 원할지도 모릅니다. 어쩌면 여기가 최종 상태일 수도 있고, 어쩌면, 음, 아시잖아요. 아마, 아마, 아마, 아마 이런 종류의 AI 모델들이 모든 것을 할 수 있게 될 때, 안전과 보안 문제들을 모두 해결했을 때 말이죠.
저기, 아시다시피, 그게 경제가 다시 한번 균형을 잡히는 여러 가지 메커니즘 중 하나이고, 뭐, 그런 식으로, 어느 정도 회복되는 현상이라고 할 수 있겠네요. 하지만, 그런 건 일종의, 포스트… 와 같은, 그런 느낌이랄까요.
음, 데이터 센터에 있는 뛰어난 두뇌들이시군요. 좀 더 적절하게 표현하자면, 핵심적인 부분은 AI 연구가 특히 원시적인 지적 능력에 크게 의존하고 있다는 점입니다.
그리고 두 번째로, 현재 세계를 보면 AI 알고리즘 발전 속도만큼 빠르게 확산되는 기술이 매우 드문 것 같습니다. 특히 AGI 시대에는 그 힘이 더욱 풍부하게 존재할 것으로 예상됩니다.
그리고 그건 이 산업이 구조적으로 확산되는 경향이 있다는 점을 암시하는 것 같아요. 그래서 코딩은 빠르게 진행되고 있다고 생각하지만, AI 연구는 코딩을 포함하는 더 큰 범위이고, 일부 측면에서는 빠르게 진행되지 않는 것 같아요.
하지만 저는 다시 한번 말씀드리지만, 코딩을 시작하고 AI 모델이 빠르게 작동하게 되면, AI 모델들이 다른 모든 것을 처리하는 능력이 상당히 빨라질 거라고 생각합니다.
지금 코딩 작업이 빠르게 진행되는 것 같은데, 인공지능 모델이 또 다른 인공지능 모델을 만들고 다른 모든 것을 구축하게 되면 전체 경제도 비슷한 속도로 나아가지 않을까 생각합니다.
지리적으로는 좀 걱정스럽네요. 인공지능에 대한 정보나 경험이 있는 것만으로도 차이가 발생할까, 그런 점이 걱정되기도 해요.
그래서 제가 말씀드린 것처럼, 10에서 20퍼센트 정도의 성장률에 대해 말씀드릴 때, 걱정되는 점은 그 성장률이 실리콘밸리처럼 50퍼센트 정도까지 나올 수도 있고, 실리콘밸리와 사회적으로 연결된 지역이나, 그런 곳들에서 나타날 수 있다는 것이죠.
다른 곳에서의 현재 속도와 크게 다르지 않을 것 같습니다. 그리고 그렇게 된다면 꽤나 혼란스러운 세상이 될 거라고 생각합니다.
음, 제가 많이 생각하는 것 중 하나는 어떻게 그런 상황을 예방할 수 있을까 하는 점입니다. 한번 그 나라에 천재들이 있고, 데이터 센터도 갖춰진다면 로봇 기술이 빠르게 해결될 수 있을까요?
로봇 공학 분야의 큰 문제점은, 인간은 현재 하드웨어를 원격 조작하는 방법을 익힐 수 있지만, 현재의 인공지능 모델은 그렇지 못하다는 것 같습니다. 적어도, 매우 생산적인 방식으로 말이죠. 만약 인간처럼 학습하는 능력이 있다면, 이것이 로봇 공학 문제를 즉시 해결해 줄 수 있을까요?
음, 저는 인간처럼 학습하는 것에 의존하는 것은 아니라고 생각합니다. 여러 가지 방식으로 일어날 수 있을 겁니다. 예를 들어, 저희는 다양한 비디오 게임으로 모델을 학습시킬 수도 있습니다. 비디오 게임은 로봇 제어와 비슷하거나, 여러 시뮬레이션 로봇 환경에서 학습시키는 것도 가능하고, 아니면 그냥, 아시죠, 학습시키는 거죠.
컴퓨터 화면을 조작하고, 이를 통해 일반화하는 방법을 배우게 됩니다. 그러니 결국 그렇게 될 겁니다.
인간과 비슷한 학습에 반드시 의존하는 건 아닐 거예요. 인간과 비슷한 학습이 일어날 수 있는 방법 중 하나일 뿐이에요. 모델이 마치 '로봇을 하나 집어 들었는데, 어떻게 써야 할지 모르겠네, 배우는 건데' 이런 식으로요.
계속 학습하는 방법을 발견했기 때문에 그렇게 될 수도 있고, 다양한 환경에서 모델을 훈련시킨 후 일반화했기 때문에 그렇게 될 수도 있으며, 모델이 컨텍스트 길이 내에서 그것을 학습하기 때문에 그렇게 될 수도 있습니다.
어떤 방향으로 가든 실제로는 큰 상관이 없습니다. 방금 한 시간 전에 나눴던 이야기를 떠올려 보면, 그런 일들은 여러 가지 방식으로 일어날 수 있습니다.
하지만 모델들이 어떤 이유로든 그러한 능력을 갖게 된다면 로봇 공학이 혁신될 거라고 생각합니다. 로봇의 설계 방식도 크게 달라질 것이고, 모델이 훨씬 더 뛰어날 테니까요.
저도 그렇다고 생각합니다. 음, 그리고 로봇을 어느 정도 제어할 수 있는 능력도 있고요.
따라서 저희는 물리적인 부분, 즉 하드웨어를 구축하고 물리적인 로봇을 제작하는 데 더욱 능숙해질 것이며, 동시에 그것을 제어하는 능력 또한 향상될 것입니다. 음, 이것이 로봇 산업에도 긍정적인 영향을 미쳐서, 발전적인 결과를 가져오게 될까요?
조만간 수조 달러의 수익을 창출할 수 있을까요? 제 생각은 긍정적이지만, 엄청나게 빠르긴 하지만 무한정 빠르게 확산되지는 않을 겁니다. 그렇다면 로봇공학도 혁신될까요? 네, 아마 한두 해 정도 더 걸릴 수도 있을 것 같습니다.
그게 제가 생각하는 방식이고요, 극단적으로 빠른 발전에는 일반적인 회의론이 있어요.
제 생각에는, 곧 몇 년 안에 어떤 방식으로든 지속적인 학습 문제를 해결하실 것 같습니다.
불과 몇 년 전까지만 해도 지속적인 학습에 대해 이야기하는 사람은 거의 없었고, 그러다가 깨달았죠. 왜 지금 당장 이 모델들이 가진 잠재력만큼 유용하지 않은 걸까? 명확하게 튜링 테스트를 통과하고 다양한 분야에서 전문가 수준의 능력을 보여주는데도 불구하고, 어쩌면 이것이 문제일 수도 있다는 것을요.
그리고 나서 이 문제를 해결하고 나서, 사실 인간 지능이 할 수 있는 또 다른 영역이 있다는 것을 깨닫게 될 거예요. 인간의 노동의 기반이 되는, 이러한 모델들이 할 수 없는 영역이죠. 따라서 앞으로도 이런 종류의 것들이 더 많이 있을 수 있다고 생각해요. 그러니까, 우리 같은 경우, 지금까지는…
음, 마치 인간 지능의 조각들을 발견한 것 같아서요, 좀 더 명확히 말씀드리면, 저는 지속적인 학습이 제가 이전에 말씀드린 것처럼 전혀 장애물이 아닐 수도 있다고 생각합니다. 네, 그렇죠. 음, 생각컨대, 저희는 어쩌면…
음, 사전 훈련의 일반화 능력과 강화 학습의 일반화 능력과 같은 것들을 통해 그 자리에 도달하는 것인데, 솔직히 말씀드리면, 그런 것이 존재하지 않을 수도 있다고 생각합니다. 아니, 거의 존재하지 않을 수도 있다는 생각이 듭니다.
실제로, 머신러닝 분야에서 사람들이 장벽이라고 생각했던 것들이 막대한 컴퓨팅 자원 앞에서 자연스럽게 사라지는 역사가 많이 있었습니다. 아시다시피, 그러한 점들이 많이 논의되었고…
음, 아시다시피, 모델이 명사와 동사를 어떻게 추적하는지, 음, 어떻게, 어떻게 하는 건지, 문법적으로 의미를 이해할 수는 있지만, 음, 의미적으로는 이해하지 못하는 것 같은데, 아시죠?
통계적 상관관계일 뿐 이해할 수 있는 것들이 있습니다. 문단을 이해할 수도 있고, 단어를 이해할 수도 있습니다. 추론을 할 수 없다고 생각했지만, 갑자기 코딩과 수학을 매우 잘 할 수 있다는 사실이 드러나는 거죠. 저는 그들이 실제로 더 강력한 역사를 가지고 있다고 생각합니다.
이런 것들 중 일부는 굉장히 크게 느껴지기도 하고, 그러다가 조금씩 사라지기도 하고, 어떤 것들은 진짜이고, 의미하는 바는 데이터의 필요성이 진짜라는 거죠. 아마 지속적인 학습도 진짜일 겁니다.
하지만 다시 말씀드리면 코딩과 같이 어떤 기반을 갖는 것이 중요하다고 생각합니다. 1년, 2년 안에 모델이 스스로 완결할 수 있는 지점에 도달할 수도 있을 것 같습니다. 그 또한 매우 큰 과제입니다.
저희가 모델이 할 수 있다는 것을 언급하고 있는 인간 활동의 전체 영역에 대해서 말씀하시는 건가요? 혹시 엔드 투 엔드라고 하실 때, 기술적인 방향을 설정하고 맥락을 이해하는 것을 의미하시는 건가요?
음, 네, 뭐 그렇습니다, 그렇죠. 제가 말씀드리고 싶은 건, 그 모든 걸 포함해서요. 흥미로운 부분은 그 점이, 제 생각에는 완전한 AGI에 해당한다고 느껴진다는 겁니다. 어쩌면 내부적으로는 일관성이 있을 수도 있지만, 코드의 90%나 100%라고 단정하기는 어렵습니다.
음, 아니요, 다른 업무 부분들도요. 아니요, 아니요, 아니요. 제가 이 스펙트럼을 말씀드렸는데, 코드의 90%, 100%의 코드, N10 소프트웨어 엔지니어의 90%, 100%의 N10 소프트웨어 엔지니어, 새로운 작업들이 소프트웨어 엔지니어들을 위해 만들어지고, 결국에는 그것들도 완료되겠지요.
하지만 그 범위는 상당히 넓습니다. 하지만 저희는 그 범위를 매우 빠르게 짚어나가고 있습니다.
네, 제가 했던 팟캐스트 중에 진행자가 '아, 그런데 보르헤스라는 작가가 컴퓨터가 학습하는 것에 대한 에세이를 썼다'고 말하는 걸 본 적이 있어서 웃기네요. 제가 10년 동안 인공지능 연구를 해왔는데, 그걸 듣고 너무 웃겨요.
그리고 팟캐스터가 에세이를 썼다는 느낌이 들 법도 하죠. 그리고 인터뷰할 때마다 다들 그 에세이에 대해 물어보고요. 솔직히 말씀드리면, 우리 모두 함께 이 문제를 해결해 나가고 있는 거니까요.
네, 맞아요. 제가 다른 사람들보다 볼 수 있는 몇 가지 방법이 있긴 합니다. 요즘은, 아마 그런 점이 더 두드러지겠죠. 엔트로픽 내에서 많은 것을 보고, 여러 결정을 내려야 하기 때문입니다.
다른 사람들이 가지지 못한 훌륭한 연구적인 통찰력이 있나요, 그렇죠? 저는 2,500명 규모의 회사를 운영하고 있잖아요.
실제로 구체적인 연구적인 통찰력을 얻기가, 10년 전이나 심지어 2~3년 전보다 훨씬 더 어렵습니다.
완전한 원격 근무 대체 인력이 보편화되는 세상으로 향하고 있습니다. 이럴 때 API 가격 정책이 여전히 가장 합리적인 선택일까요?
만약 그렇지 않다면, AGI를 어떻게 가격을 책정하거나 제공해야 할까요? 네, 여러 가지 다양한 비즈니스 모델이 동시에 실험될 것 같습니다.
API 모델이 많은 분들이 생각하시는 것보다 훨씬 더 튼튼하다고 생각합니다.
기술이 상당히 빠르게 발전하고, 지수적으로 발전하는 경우, 제가 생각하는 한 가지 방법은 그것이…
최근 세 달 동안 새로운 활용 사례들이 계속해서 나타나고 있습니다.
어떤 제품 표면을 배치하든, 항상 관련성이 없어질 위험에 노출될 수 있습니다, 그렇죠?
어떤 제품의 인터페이스는 모델의 다양한 기능 범위에 적합할 수 있잖아요. 하지만 챗봇은 이미 한계에 부딪히고 있는데, 더 똑똑하게 만들어도 일반 소비자에게는 큰 도움이 되지 않더라고요.
하지만 저는 그것이 인공지능 모델의 한계라고 생각하지 않아요. 모델이 충분히 좋은지, 그리고 그들이 더 나아지는 것이 경제에 중요하지 않다는 증거라고 생각하지 않고요.
그 제품 자체에는 큰 의미가 없을 거예요. 그래서 API의 가치는 항상 최신 기술을 기반으로 구축할 수 있는 기회를 제공한다는 점이라고 생각해요. 새로운 것을 시도하는 데 아주 유리하죠.
그러다 보니, 불과 몇 달 전에 가능하지 않았던 새로운 스타트업과 아이디어들이 모델의 발전 덕분에 계속해서 등장하게 될 것입니다.
그래서 저는 사실, 거의 확실하게 예측하건대, 저희는… 그럴 거라고 생각합니다.
다른 모델들과 함께 존재할 것이지만, 항상 API 비즈니스 모델을 유지하게 될 것입니다. 왜냐하면 항상 1,000명이 다양한 방식으로 모델을 실험해 보고 싶어 할 필요성이 존재하기 때문입니다.
그리고 그 중 100개 정도가 스타트업으로 발전하고, 10개 정도가 큰 성공을 거둔 스타트업이 되며, 아시다시피 2~3개 정도가 특정 세대의 모델 활용 방식의 모범이 되는 경우가 있습니다.
음, 저는 기본적으로 항상 동시에 존재할 것이라고 생각합니다. 물론 다른 모델들도 생겨날 거고요. 모델이 출력하는 모든 토큰이 같은 가치를 지니는 것도 아닐 거라고 확신합니다.
음, 혹시 아시겠지만, 모델이 요청을 받아서 답변을 할 때, 어떤 토큰들이 어떤 가치를 가지는지, 아시는지 궁금합니다. 예를 들어, 누군가가 전화를 해서 '제 맥'}
음, 잘 안 되는 것 같은데, 혹시 모델을 재시작해 보시는 건 어떠세요? 아시겠지만, 모델이 그거 분명히 1000만 번은 말했을 거예요. 아마 한 달러 정도, 혹은 조금 더 적게 될 수도 있겠네요.
만약 모델이, 음, 모델이 제약 회사에 가서, 아, 음, 개발 중인 이 분자에서, 아, 음, 이쪽 끝부분의 방향족 고리를 가져가셔야 합니다라고 말한다면요.
분자를 하나 가져다 그 분자 끝부분에 놓으시면 돼요. 아시다시피, 그렇게 하시면 정말 놀라운 일들이 일어날 겁니다. 예를 들어, 그런 토큰의 가치가 수백만 달러에 달할 수도 있죠. 맞죠? 그래서 저는 분명히 사업을 많이 볼 수 있을 거라고 생각합니다.
저희는 분명히, 어떤 시점에 성과에 따른 지불 방식이나, 다양한 형태의 보상 체계가 나타날 가능성이 있다고 생각합니다. 물론, 여러 가지 형태로 나타날 수 있을 겁니다.
일종의 노동 시간제로 계산되는 일 같은 거죠, 아시겠어요? 음, 저는 잘 모르겠네요. 새로운 산업 분야이기 때문에 많은 시도가 이루어질 것 같아요. 그리고 어떤 방법이 맞을지 저는 아직 모르겠어요.
음, 제가 생각하는 건, 사람들은 다양한 시도를 해 보면서 이게 어떻게 가장 잘 활용될 수 있을지를 알아내야 한다는 말씀에 동의해요. 그런데 제가 놀라운 건 클로드 코드예요.
스타트업 역사 전체를 통틀어서 코딩 에이전트처럼 이렇게 치열하게 경쟁이 붙었던 애플리케이션은 없었던 것 같습니다. 그리고 클라우드 코드를 생각해 보더라도요.
여기 분야의 선두 주자라고 말씀하셨는데, 제게는 조금 놀랍게 들립니다. 마치 엔트로픽이 이것을 반드시 만들어야만 했던 것처럼 느껴지지 않아서요. 엔트로픽이 왜 이 기술을 개발해야만 했는지에 대한 배경이 있으신지 궁금합니다.
네, 엔스로픽이 모델뿐만 아니라 애플리케이션까지 개발하게 된 배경에 대해 말씀드리겠습니다. 사실 굉장히 간단한 과정에서 비롯된 일이었습니다. 저희는 자체적으로 코딩을 하고 있었는데요.
저희가 잘 코딩하는 모델들에 대해 말씀드리는데요, 2025년 초쯤에 저는 이런 모델들을 활용하시면 AI 회사로서 귀사의 연구를 상당히 가속화할 수 있는 시기가 찾아왔다고 생각했습니다.
물론, 아시겠지만, 인터페이스가 필요하고, 사용하기 위한 장비도 필요합니다. 그래서 내부적으로 사람들에게 권장하는 것은, 이게 꼭 필요한 것이라는 의미는 아니라고 말씀드리고 싶습니다. 그냥 이 기능을 실험해 보라고 말씀드렸을 뿐이고, 아시겠지만… 이 부분은요.
음, 클로드 CLI로 원래 불렸을 수도 있었고, 내부적으로 결국 클로드 코드라는 이름으로 변경되었을 가능성이 있는 것 같아요. 그때는 아마 모두가 그걸 사용했고, 굉장히 빠르게 발전했던 것 같습니다.
내부 도입을 검토해 봤는데, 제가 생각하기에는 외부로 출시하는 것이 좋겠다는 판단이 들었습니다. Anthropic 내부에서 굉장히 빠른 채택이 이루어지고 있는 것을 봤으니까요, 코딩 분야에서도요.
저희가 하는 일 중 많은 부분은, 음, 아시겠지만 저희는 수백 명에 달하는 많은 청중을 가지고 있습니다. 이는 어느 정도 외부 청중을 대표한다고 볼 수 있습니다. 벌써부터 많은 분들이 참여하고 계시는 것 같습니다.
제품 시장 적합성은 잘 맞고, 이제 이걸 출시해 봅시다. 음, 그리고 출시했는데, 그리고 솔직히 말씀드리면 저희가 모델을 직접 개발하고 있기 때문에 저희 스스로 무엇을 알아야 하는지 잘 알고 있습니다.
음, 제가 생각하기에는 모델을 가장 중요하게 활용해야 할 것 같아요. 일종의 피드백 루프를 형성하는 것 같은 느낌이 듭니다. 예를 들어, 엔트로픽의 개발자가 '이것이 더 잘하도록 하면 더 좋을 것 같아요.'라고 생각하는 상황이 발생할 수 있겠죠.
이런 x 같은 것들을 활용한 다음, 그걸 만들 새로운 모델에 통합하는 방식이 있습니다. 이건 하나의 버전이라고 할 수 있죠. 하지만 제품 반복 과정처럼, 평범하게 개선하는 방식도 있습니다. 예를 들어, 저희는…
저희 엔트로픽에는 코더들이 많이 있습니다. 클라우드 코드를 매일 사용하고 있어서 빠른 피드백을 받을 수 있었죠. 초기에는 그게 좀 더 중요했지만, 지금은 물론 수백만 명이나 사용하고 있습니다.
그래서 외부 피드백도 많이 받고 있지만, 빠른 내부 피드백을 얻을 수 있어서 정말 좋은 것 같습니다. 이런 점이 저희가 코딩 모델을 출시하게 된 이유 중 하나라고 생각합니다.
아, 제약 회사 같은 건 시작하지 않았죠? 제가 배경이 생물학 쪽이긴 한데, 제약 회사를 시작하려면 필요한 자원들이 전혀 없습니다. 그래서 OpenClaw에 대한 기대감이 엄청 많아서, 제가 직접 한번 확인해 보고 싶었어요.
이번 주말에 데이트가 있는데 아직 아무것도 계획하지 못해서, OpenClaw에 Mercury 직불카드를 줬어요. 200달러 한도로 설정하고, 놀라게 해달라고 했어요. 자, 맥 미니입니다. 켜졌고, Mercury에 접근할 수 있을 뿐만 아니라, 완전히 격리되어 있어요.
사실 머큐리가 가드레일을 설정하는 걸 정말 쉽게 해주기 때문에, 데빗 카드 접근 권한을 주는 게 꽤 편안하게 느껴졌어요. 허가 범위를 사용자 정의하고, 지출 한도를 설정하고, 구매 카테고리를 제한할 수 있었답니다.
되편으로 직불 카드가 제대로 작동하는지 확인하고 싶어서 OpenClaw에게 테스트 거래를 해서 위키피디아에 몇 달러를 기부해 달라고 부탁했어요. 그 외에는 무슨 일이 일어날지 전혀 몰라요.
다음 에피소드에서 어떻게 진행되었는지 알려드릴게요. 그동안 다양한 방법으로 돈을 사용하고 싶으신 분들을 위한 개인 은행 솔루션이 필요하시면 mercury.com slash personal을 방문해 주세요.
머큐리는 FDIC에 의해 보험에 가입된 은행이 아니라는 점, 핀테크 회사입니다.
Choice Financial Group과 Column NA 멤버를 통해 제공되는 은행 서비스입니다. FDIC에 의해 보험에 가입되어 있습니다. 그녀는 우리가 커피를 마시고 동네를 산책한다고 생각하는 것 같아요.