| A100 pcie40G - $ 200/card/month;BMS:8*Ascend 910B $ 2000/month 8*4090D - $ 800/month 8*4090 - $ 900/month 8*A100 pcie40G - $ 1400/month 8*A100 pcie80G - $ 3200/month 8*A100 nvlink80G - $ 3800/month 8*A800 nvlink80G - $ 3800/month 8*H20 - $ 4000/month 8*L20 - $ 1300/month 8*L40 - $ 1600/month 8*L40S - $ 2200/month 8*H100 - $ 8000/month 8*H200 - $ 9200/month 8*B200 - $ 13000/month |
Точка перелома в сфере вычислительных мощностей: когда китайские токены «захватывают лидерство», кто переопределяет ценность ИИ?Февраль 2026 года станет знаковым месяцем для глобальной индустрии искусственного интеллекта. В этом месяце холод и жар переплелись на одной временной линии: с одной стороны, акции гиганта полупроводниковой индустрии Nvidia необъяснимо рухнули после публикации сильнейшего в истории финансового отчета, испарив за одну ночь 1,77 триллиона юаней рыночной капитализации; с другой стороны, на китайском рынке А-акций сектора аренды вычислительных мощностей и облачных вычислений захлестнула волна роста до предела, с бурным притоком горячих денег. Корень этого разительного контраста «льда и пламени» кроется в взрывных данных от OpenRouter. «Звездный час» китайского ИИ: не просто превосходство, а доминированиеДанные OpenRouter, крупнейшей в мире платформы-агрегатора API для моделей ИИ, показывают, что в феврале 2026 года «весы» глобальных вычислительных мощностей ИИ совершили исторический наклон. За неделю с 9 по 15 февраля недельный объем вызовов китайских моделей достиг 4,12 триллиона токенов, впервые превзойдя американский показатель в 2,94 триллиона токенов. Всего неделю спустя эта цифра подскочила до 5,16 триллиона токенов, увеличившись на 127% за три недели и продолжая расширять лидерство. Еще более впечатляющей стала перетасовка глобального «рейтинга драконов» больших языковых моделей. В недельном рейтинге с 16 по 22 февраля четыре из пяти лучших моделей мира по объему вызовов были китайскими — MiniMax M2.5, Kimi K2.5 от Moonshot AI, GLM-5 от Zhipu AI и V3.2 от DeepSeek. На эти четыре модели в совокупности пришлось 85,7% от общего объема вызовов топ-5. Это не случайный взрыв, основанный на одном хите, а кластерный подъем китайских производителей ИИ. Ценность этого достижения заключается в его «международном» характере. Доля пользователей из США на платформе OpenRouter составляет целых 47,17%, в то время как на китайских разработчиков приходится лишь 6,01%. Это означает, что китайские модели завоевали взыскательных зарубежных разработчиков благодаря своей производительности и экономической эффективности. Как отметил один из партнеров a16z, среди ИИ-стартапов, в настоящее время привлекающих финансирование в Кремниевой долине, ошеломляющие 80% строят свои основные демонстрационные модели на основе китайских открытых исходных кодов. Логика капитала в условиях «Льда и Пламени»: переоценка стоимости вычислительных мощностейРеакция рынков капитала всегда наиболее чувствительна. 26 февраля по восточному времени Nvidia, представившая «безупречный отчет» с ростом выручки на 73%, необъяснимо потеряла 5,5% своей стоимости. В то же время на следующее утро на китайском рынке А-акций концептуальные акции, связанные с арендой вычислительных мощностей, облачными вычислениями и центрами обработки данных, взлетели на фоне общего тренда, устроив ралли с лимитными ростами. Эта крайняя дивергенция, на первый взгляд, выглядит как игра на «продаже новостей», но в своей глубине отражает полную реконструкцию рынком логики распределения стоимости вычислительных мощностей. Раньше рынок был убежден: «чем мощнее модель, тем больше карт нужно сложить», и GPU от Nvidia были единственным синонимом вычислительной мощи. Но взрыв китайских моделей разрушил эту линейную логику. Такие популярные китайские модели, как DeepSeek и Alibaba Qwen, широко используют архитектуру MoE. Эта технология, активируя только релевантные подсети, а не всю модель целиком, позволяет снизить использование памяти при инференсе до 60% и увеличить пропускную способность до 19 раз. Это означает, что для генерации огромных объемов токенов больше не требуется пропорционально огромное количество высококлассных GPU. Дженсен Хуанг сказал: «Вычислительная мощность — это доход». Но когда китайские модели могут производить токены, сопоставимые с американскими, с десятой долей затрат, рынок начинает настораживаться: пул прибыли от вычислительных мощностей смещается с дефицитного производства чипов на обширную сферу эксплуатации и применения. Падение Nvidia отражает опасения по поводу ослабления ценовой власти «продавца лопат»; в то время как рост на рынке А-акций является приветствием переоценки «старателей» и поставщиков услуг для «золотой лихорадки». Качественное изменение индустрии за взрывом токенов: от «трафика» к «топливу»Взрыв объема вызовов китайского ИИ, по сути, является взрывом экономики токенов. Токены перестают быть «трафиком» с почти нулевыми предельными издержками в эпоху интернета и превращаются в топливо, движущую силу производства в эпоху ИИ. Эту трансформацию движет фундаментальное изменение модели использования: от «вопросов» к «выполнению работы». С распространением моделей, обладающих мощными возможностями параллельной обработки, таких как Kimi K2.5, ИИ начинает глубоко вмешиваться в рефакторинг кода, генерацию документов и сложные рассуждения. Например, Kimi может координировать до 100 «агентов-копий», работающих параллельно, повышая эффективность обработки сложных задач в 3-10 раз. Такое глубокое вовлечение в производственные процессы приводит к экспоненциальному росту потребления токенов. JPMorgan прогнозирует, что с 2025 по 2030 год среднегодовой темп роста потребления токенов в Китае достигнет ошеломляющих 330%, увеличившись в 370 раз всего за пять лет. Это не просто цифровая вакханалия, а прелюдия к демократизации интеллекта. Взгляд в будущееКогда китайские модели ИИ занимают центральное место на глобальной арене, а стоимость вычислительных мощностей ускоряет свой сдвиг от производства чипов к прикладным сервисам, наступает золотой век для операторов вычислительных мощностей. В этой волне переоценки перед каждой ИИ-компанией встает четкая задача: как превратить стремительно растущий спрос на токены в стабильную, эффективную и недорогую производительность. В процессе демократизации вычислительных мощностей многие отечественные поставщики услуг становятся «энергоснабжающими компаниями» новой структуры. Платформы аренды вычислительных мощностей, такие как omniyq.com, с их обширными парками высокопроизводительных GPU (включая 4090, A100, H800 и т.д.) и гибкими моделями обслуживания, обеспечивают надежную вычислительную основу для бурно растущих отечественных приложений. Когда пламя инноваций зажжено китайскими большими моделями, такие платформы, как omniyq.com, делают все возможное, чтобы подпитывать это пламя прерии непрерывным потоком «вычислительных дров», позволяя каждому разработчику ИИ с предельными затратами открыть дверь в интеллектуальное будущее. Declaration: This article is originally created by Shenzhen Cloud Engine - a cost-effective AI computing power service platform. For reprint, please indicate the source link:https://www.omniyq.com/ru/sys-nd/414.html
|