AI 시대에 '슈퍼 애플리케이션'보다 '슈퍼 유용성'이 더 중요한 이유는 무엇일까?

저자：Eve Cole 업데이트 시간：2024-11-19 17:54:02

인공지능 시대의 슈퍼 애플리케이션은 반드시 등장하겠지만 아직은 그 때가 이르지 않았다.

슈퍼앱은 언제 등장하나요? 이는 지난 1년간 AI 업계의 가장 흔한 불안이 아닐까.

사람들은 인공지능을 PC 인터넷이나 모바일 인터넷과 비교하기가 쉽습니다. 둘 다 등장한 지 몇 년이 지나면서 그들은 인기 있는 슈퍼 애플리케이션을 갖게 됩니다. 그러나 인공지능은 산업혁명 수준의 기술 물결이다. 인공지능 슈퍼 애플리케이션의 출현 시기는 증기기관과 전기 출현 이후의 슈퍼 애플리케이션 출현 시기와 더 비슷하다.

1776년에는 실용적인 가치를 지닌 최초의 증기기관이 제작되어 인류사회를 '증기시대'로 이끄는 만능 동력원이 되었습니다. 분야. 열역학 제2법칙은 거의 100년 후에 나타났습니다. 전력의 발명은 2차 산업 혁명의 정점을 열었습니다. 모두 전기 이후에 나타났습니다. . 수십 년에 걸쳐 점진적으로 발전해 온 새로운 비즈니스 형식입니다.

그러므로 인공지능 시대의 슈퍼애플리케이션은 반드시 등장하겠지만 아직은 그런 시대가 도래하지 않았다. 지난해 AI 업계는 이른바 '슈퍼 애플리케이션'을 추구해왔는데, 이는 빠른 성공을 조금 열망하는 것으로 보인다.

기본 기술로서 대형 모델은 직접적인 실용 가치를 창출하지 않습니다. 기본 대형 모델을 기반으로 구축된 다양한 애플리케이션은 모델의 존재 의미입니다. AI 애플리케이션 개발자와 기업가에게 가장 좋은 전략은 분명히 AGI나 "슈퍼 애플리케이션"을 고수하는 것이 아니라 매우 유용한 애플리케이션을 만들기 위해 작은 조치를 취하고 계속해서 반복하는 것입니다.

최근 2024 Baidu World Conference에서 Baidu는 Wenxin Big Model에 대한 최신 데이터를 발표했습니다. 반년 전 Wenxin Big Model의 일일 API 호출은 2억 건이었으며 현재는 15억 건을 초과하여 7.5배 증가했습니다. 딱 6개월만요. 이는 중국 내 AI 애플리케이션 폭발의 축소판일 뿐만 아니라 대형 모델이 실제로 애플리케이션에 대한 실질적인 가치를 창출했음을 보여줍니다.

01 대형 모델은 기본적으로 환상을 제거합니다.

오랫동안 국산 대형 모델을 다른 업계에 판매하는 것이 어려웠다. 업계 관계자는 36Kr에 “스마트 하드웨어든 AI 에이전트든 업계 수요는 매우 많지만 실제로 의향이 있는 사람은 거의 없다”고 말했다. . 대형 모델 세대가 너무 열악하고 어디에나 환상이 있기 때문에 비용을 지불하십시오.” 다중 모드 기능의 개발로 인해 생성 인공 지능의 초기 사용자 경험은 단순한 대화형 봇의 경험에 더 가깝습니다. 처음에는 사용자가 얼리 어답터를 필요로 하지만 평범한 경험으로 인해 유지율이 낮습니다.

지난 1년 동안 대형 모델의 가장 큰 변화는 '환상'이 기본적으로 사라지고 모델을 사용할 수 있게 됐다는 점이다. 대형 모델은 본질적으로 확률 모델입니다. 텍스트 생성에서는 다음으로 가능성이 높은 텍스트가 자동으로 생성되며, 이로 인해 AI는 소위 "심각한 넌센스"라고 불리는 "환각"을 경험하게 됩니다.

대규모 모델을 기반으로 애플리케이션을 개발하려면 "환상"을 제거해야 합니다. AI 업계에서는 일반적으로 검색 향상 기술(RAG, Retrieval-augmented Generation)을 사용해 대형 모델에서 생성된 텍스트의 착시 현상을 기본적으로 제거해 대형 모델을 실용화하는 가치를 갖는다. 멀티모달 기술이 현실화되기 위해서는 AI 적용 영역을 확장하기 위한 정확성과 제어성도 필요하다.

Baidu는 이번 월드 컨퍼런스에서 향상된 이미지 기반 검색 기술인 새로운 iRAG(이미지 기반 RAG)를 출시했습니다. 올해 초 Baidu는 '환상'의 다중 모드 생성 문제를 해결하기로 결정하여 Vincent 사진도 환상을 제거하여 영화 및 TV 작품, 만화 작품, 만화책, 포스터 분야에 진출할 수 있도록 했습니다. 생산 및 기타 분야.

예를 들어, 자동차 산업은 마케팅에 크게 의존하고 있으며 종종 고품질의 사진을 많이 요구합니다. 완벽한 사진을 만들기 위해서는 많은 인적, 재정적, 물적 자원이 필요합니다. iRAG 기술을 사용하면 자동차 회사는 매우 저렴한 비용으로 더 빠른 시간 내에 뛰어난 시각적 성능을 갖춘 사진을 얻을 수 있습니다. 시각적으로 더욱 놀라울 수도 있습니다.

현재 생성형 인공지능의 기술적 경로는 기본적으로 두 가지 학파로 나뉘는데, 하나는 기본 대형 모델을 통해 몇 년 안에 일반 인공지능 달성을 꿈꾸는 AGI 학파이고, 다른 하나는 시작하는 응용 중심 학파이다. 애플리케이션 요구 사항을 반영하고 Apply 피드백 모델을 사용하여 혁신합니다.

대규모 기본 모델에 대한 지속적인 연구 및 개발을 기반으로 Baidu는 애플리케이션 중심 개발에 더욱 중점을 두고 있습니다. 예를 들어, 회사 로고는 변형되거나 색상이 왜곡될 수 없어 정확한 다중 모드 기능이 필요하기 때문에 애플리케이션이 정확한 이미지를 생성해야 하기 때문에 iRAG가 사용되는 것으로 이해됩니다. 거의 1년 간의 노력 끝에 이 기술이 실용화되었습니다. 응용 프로그램의 진행 상황은 모델 자체의 연구 및 개발에 반영될 수도 있습니다.

02 AI 애플리케이션의 가장 큰 트렌드, 에이전트

2년이 지나면 생성 AI는 전환의 중요한 시기에 들어서게 됩니다. 36Kr은 앞서 국내 AI 스타트업 2곳이 대형 모델 사전 훈련을 중단했다고 밝힌 바 있다. 최근 이틀간 스케일링법이 '투자수익률 감소'에 이르렀는지 여부를 두고 업계의 논쟁이 격화됐다.

실제로 전 세계적으로 변화는 이미 시작되었습니다. OpenAI, Microsoft, Google과 같은 글로벌 기술 대기업은 연속적으로 지능형 에이전트를 사용하고 배포했습니다. 9월 중순, OpenAI 연구원 Noam Brown은 소셜 미디어를 통해 새로운 다중 에이전트 연구팀을 위해 머신러닝 엔지니어를 모집한다고 발표했습니다. 마이크로소프트 CEO이자 회장인 나델라(Nadella)는 자신이 만든 AI의 새로운 진전을 직접 발표하고, 새로운 비즈니스 인텔리전스 에이전트 10개를 한꺼번에 출시하며 그룹을 결성해 데뷔했다. 거의 동시에 구글도 지능형 에이전트를 출시할 것이라는 소식이 전해졌다. 곧 구글은 에이전트형 인공지능인 자비스(Jarvis)의 최신 AI 개발 결과의 '내부 프리뷰 버전'을 '우연히' 유출했다. 인터넷을 탐색하고 정보 지능을 독립적으로 검색하십시오.

Baidu는 중국에서 스마트 에이전트 트렌드를 선도하고 있습니다. 이번 바이두 월드 컨퍼런스 행사에서는 지능형 에이전트가 주인공이 됐다. Baidu는 회사 유형, 역할 유형, 도구 유형, 산업 유형이라는 네 가지 유형의 상담원에 중점을 둡니다.

예를 들어, 도구적인 에이전트인 "Free Canvas"는 Baidu의 초기 도서관 사업의 장기간 축적을 기반으로 생성 인공 지능 기술을 겹쳐서 창조에 있어서 큰 도약을 달성했습니다.

초기에 사람들이 도서관을 이용하려는 목적은 기성 문서를 찾는 것이었습니다. 그러나 생성적 인공지능 기술이 등장하자 바이두는 사람들의 가장 근본적인 요구는 기성 문서를 찾는 것이 아니라 자신에게 더 적합한 콘텐츠를 만드는 것임을 깨달았습니다.

이러한 요구를 충족시키기 위해 Baidu는 기성 문서를 기반으로 또는 물질적 기반 없이 사람들이 더 나은 창작을 할 수 있는 방법에 대해 생각하기 시작했습니다. 이 경로에 따라 최초의 Baidu 라이브러리가 재구성되었습니다. 이후 바이두는 클릭 한 번으로 긴 글을 생성할 수 있는 오렌지피안(Orange Pian)이라는 독립 제품을 출시했다. 내면의 생각을 더욱 편리하고 정확하게 표현해보세요.

바이두 창업자인 로빈 리(Robin Li)는 “에이전트는 AI 애플리케이션의 가장 주류 형태이며 곧 폭발점을 맞이할 것”이라고 믿는다. 모바일 시대의 계정 차이점은 상담원이 더 인간적이고, 더 지능적이며, 영업, 고객 서비스 및 보조원과 더 비슷하다는 것입니다. 에이전트는 AI 기반 시대에 콘텐츠, 정보 및 서비스의 새로운 전달자가 될 수 있습니다.

OpenAI CEO 샘 알트만(Sam Altman)도 지난달 Reddit에 대한 질문에 답하면서 AI 에이전트 개발자에게 의지할 가능성을 밝혔습니다. "우리는 점점 더 나은 모델을 갖게 될 것입니다. 하지만 다음으로 큰 혁신은 AI 에이전트가 될 것이라고 생각합니다." NVIDIA의 Jen-Hsun Huang도 NVIDIA가 앞으로 1억 개의 지능형 에이전트를 보유하게 될 것이라고 말했습니다.

지능형 에이전트의 특징은 문턱이 낮고 상한선이 충분히 높다는 점이며, 수년 전 대학생들이 창업한 구글이나 메타처럼 아주 강력한 회사로 성장할 수 있다는 점이다. 세계에서 가장 강력한 기술 거인. 어느 정도 지금 지능형 에이전트를 구축하지 않는 것은 20년 전에 웹사이트를 구축하지 않거나 10년 전에 APP를 구축하지 않은 것과 같습니다.

03 중국 AI 기수들의 기술적 신념

글로벌 인공지능 개발의 인재, 자원, 기술 노드에서 바이두만큼 중요한 역할을 담당한 중국 기업은 거의 없습니다. 그 이면에는 AI에 대한 창업자의 신념과 집념이 뗄래야 뗄 수 없는 관계다. 업계에서 로빈 리(Robin Li)는 "1위안이 있으면 기술에 투자하고, 1억이 있으면 기술에 투자하고, 100억이 있으면 기술에 투자한다"는 고전적인 말을 했습니다. .

Baidu의 AI 작업은 10여년 전의 유명한 경매로 거슬러 올라갑니다. 2012년 12월 어느 날, 미국 네바다주 타호 호수 남쪽 스키산 기슭에서 비밀 경매가 열렸습니다. 경매 대상 자산은 실제로 'AI의 대부'인 제프리 E. 힌튼(Geoffrey E. Hinton) 교수와 그의 학생 2명 등 '3명'이었다.

바이두, 구글, 마이크로소프트, 딥마인드 등의 대표자들이 수시로 입찰가를 올렸고, 제시 금액은 4,400만 달러로 치솟았다. 이때 참여자 중에는 바이두와 구글만 남았다. 바이두는 상한선 없이 경매에 참여했지만, 결국 무산됐다.

이로 인해 Robin Li는 딥 러닝, 자율 주행 및 기타 기술을 스스로 개발해야 함을 깨달았습니다. 이후 Baidu America Research Institute를 설립하고 이후 Ng Enda를 비롯한 글로벌 인재를 적극적으로 유치하기 시작했습니다. , Dario Amodei 등 전 세계 최고의 인재들이 합류합니다.

다음 10년 동안 바이두는 칩, 프레임워크, 모델부터 애플리케이션 레이어까지 인공지능 기술에 대한 풀스택 자체 연구 기간을 시작하여 하나씩 물리쳤습니다. 바이두는 자율주행 개방형 플랫폼인 Apollo를 잇달아 출시했고, 딥러닝 프레임워크인 PaddlePaddle을 오픈소스화했으며, 2019년 초에는 Wenxin 대형 모델 버전 1.0도 출시했습니다.

그러나 ChatGPT가 탄생하기 전까지 AI 기술의 적용은 전환점을 찾지 못했고 업계에서는 끝없는 돈의 구렁텅이로 간주되었으며 실제 적용은 아직 멀었습니다.

끈기는 항상 보상을 받습니다. 반전은 2023년 3월에 일어났다. 바이두는 Wenxin 대형 모델 3.0 버전을 기반으로 ChatGPT를 벤치마킹한 제품인 Wenxin Yiyan을 세계 최초로 출시했다. 10년간의 묵묵한 투자가 드디어 결실을 맺은 시점이다.

2023년 하반기부터 Baidu는 기본 모델이 계속해서 선두를 달리도록 보장하면서 대형 모델의 동질적 경쟁이 막대한 자원 낭비를 초래한다는 사실을 갑자기 깨달았습니다. models."라고 밝히며, 모든 제품을 대형 모델을 이용해 재구성하는 최초의 회사가 되도록 사내에 요청했다. 2023년 월드 컨퍼런스에서 바이두는 검색, 지도, 네트워크 디스크 등 중요한 애플리케이션의 재구성 결과를 외부 세계에 선보였다. 올해 월드 컨퍼런스에서는 바이두의 주제를 '애플리케이션이 오고 있다(Applications Are Coming)'로 직접 설정해 외부 세계에 공개했다. 지능형 신체, 산업 응용 분야 및 기타 분야에서 창출된 엄청난 가치에서 대규모 모델을 참조하세요.

과거를 돌이켜보면 바이두가 지난 10년간 글로벌 인공지능 발전의 모든 중요한 노드에서 올바른 선택을 했다는 것을 어렵지 않게 볼 수 있다. 장기적으로 Robin Li는 모든 일반인이 AI를 진정으로 사용하여 모든 사람이 프로그래머의 능력을 가질 수 있기를 희망합니다.

04 누구나 프로그래머가 될 수 있는 능력을 갖고 있다

Baidu World Conference에서 Robin Li는 코드 프로그래밍, 다중 에이전트 협업 및 다중 도구 호출이 없는 소프트웨어인 One More Thing - Miaida도 출시했습니다.

Miaida는 사용자가 코드를 이해할 필요가 없다는 점에서 이전의 보조 코드 생성 도구와 매우 다릅니다. 이에 비해 이전의 AI 도구는 생산성 도구로서 피라미드 최상위에 있는 엘리트의 역량을 강화하는 데 더 중점을 두었습니다. 예를 들어 실리콘 밸리에서는 미국의 엔지니어가 부족하기 때문에 보조 코드 생성이 매우 중요합니다. 엔지니어의 시간당 임금도 매우 비쌉니다. 보조 도구는 효율성을 향상시키고 피라미드 꼭대기에 있는 사람들을 더욱 강력하게 만들 수 있습니다.

하지만 AI는 소수가 사용하는 특허가 아니라 모두가 혜택을 누릴 수 있는 것이어야 합니다.

기본 모델과 에이전트의 기능이 점차 향상됨에 따라 Baidu는 이러한 기술 기능을 통합하여 코드 한 줄도 이해하지 못하는 실제 일반인이 프로그래머의 기능을 가질 수 있도록 합니다.

수억 또는 10억 명이 넘는 사람들이 이 능력을 갖게 되면 이는 거대한 시장 공간, 특히 보조 코드 생성 도구와 같은 기술과 비교할 수 없는 창의성의 폭발에 해당할 것입니다. 바이두는 모든 평범한 사람이 피라미드 꼭대기에 있는 사람들의 능력을 가질 수 있기를 바라며, 그 중요성은 당연히 더욱 심오합니다.

Robin Li는 컨퍼런스에서 "Baidu는 '슈퍼 애플리케이션'을 출시하지 않을 것이지만 계속해서 더 많은 사람과 더 많은 기업이 수백만 개의 '매우 유용한' 애플리케이션을 만들 수 있도록 도울 것입니다."라고 말했습니다.

AI 시대에 점점 더 많은 사람들이 새로운 제품과 서비스를 만드는 방법을 배우고, 창의적이고 임계값이 낮은 작업인 자연어 프로그래밍을 사용하여 엉뚱한 아이디어를 실현하고 수많은 가치 있는 제품을 만들 수 있다고 상상해 보십시오. 이것이 바로 기술의 진정한 포용성이다.