Em 4 de maio, o Douyin, o modelo de grande linguagem central da ByteDance, anunciou a introdução de planos de subscrição pagos ao lado do seu escalão gratuito, segundo a cobertura do 澎湃新闻 (The Paper). A medida assinala um potencial fim da era de acesso gratuito para os modelos de IA chineses e reflete a procura crescente por capacidades avançadas em tarefas complexas.
O Douyin disponibilizará três níveis de subscrição com opções de faturação mensal e anual:
A estrutura de preços foi descoberta na página da AppStore do Douyin, que incluía uma declaração de serviço com os serviços pagos.
A equipa oficial do Douyin respondeu ao The Paper, afirmando: “O Douyin continuará a disponibilizar serviços gratuitos. Com base nas ofertas gratuitas, o Douyin está a explorar serviços adicionais de valor acrescentado para satisfazer necessidades diferenciadas dos utilizadores. Os detalhes do plano relacionado encontram-se atualmente na fase de testes e serão divulgados através dos canais oficiais após o lançamento formal.”
De acordo com fontes próximas do Douyin, as funcionalidades pagas incidirão em tarefas complexas e cenários de produtividade, incluindo:
À medida que as capacidades do modelo evoluem, o Douyin consegue agora lidar com tarefas cada vez mais complexas e de maior valor. No entanto, estas tarefas exigem mais recursos de computação e mais tempo de inferência, levando a empresa a introduzir serviços pagos para responder à procura, mantendo o acesso gratuito às necessidades do utilizador do dia a dia.
Em março de 2025, o modelo de grande linguagem do Douyin atingiu 1,2 quatriliões de tokens em uso diário, o que representa um crescimento de 1.000x desde o seu lançamento em maio de 2024 e uma duplicação face aos três meses anteriores, segundo a Volcano Engine (divisão cloud da ByteDance). Na plataforma da Volcano Engine, o número de empresas com utilização cumulativa de tokens superior a um trilião cresceu de 100 empresas no final de 2024 para 140 empresas.
O vice-presidente da Volcano Engine, Tan Dai, abordou anteriormente a estratégia de preços dos modelos de grande dimensão, salientando que os aumentos de preço refletem melhorias de capacidade: “As diferenças no preço do token refletem fundamentalmente diferenças de capacidade. Os modelos da próxima geração são mais poderosos; os custos por token irão aumentar, mas o valor económico criado aumentará proporcionalmente. Os aumentos de preço impulsionados pela inteligência aprimorada do modelo acabam por criar mais valor para os clientes.”
O modelo pago do Douyin segue padrões já estabelecidos a nível global e doméstico. O ChatGPT da OpenAI oferece acesso em níveis (Free, Go, Plus, Business, Enterprise) com variações de preços consoante a região. Os concorrentes Anthropic e Grok também lançaram versões de subscrição pagas.
Na China, os principais modelos Zhipu e DeepSeek já operam modelos de subscrição pagos. Ainda assim, as estratégias de preços divergem: a Zhipu aplicou três aumentos de preços de API em 2025. Em 12 de fevereiro, a Zhipu aumentou o preço do GLM Coding Plan em 30% ou mais, citando “procura forte e sustentada do mercado e crescimento rápido na escala de utilizadores e no volume de chamadas”. Em 16 de março, a Zhipu lançou o GLM-5-Turbo com um aumento de 20% no preço, seguido de um aumento de 10% em 8 de abril com o GLM-5.1.
Em contraste, a DeepSeek anunciou cortes de preços significativos em 25 de abril, oferecendo um desconto de 75% por tempo limitado no preço da API V4-Pro. Em 26 de abril, a DeepSeek reduziu ainda mais os preços dos tokens de entrada em cache em toda a sua suite de APIs para um décimo do preço original, com descontos no modelo Pro a estenderem-se até 5 de maio de 2026. Após o ajuste: DeepSeek-V4-Flash a ¥0,02 por milhão de tokens de entrada em cache e DeepSeek-V4-Pro a ¥0,025 por milhão de tokens.
As estratégias de preços divergentes — a Zhipu a aumentar e a DeepSeek a cortar — refletem julgamentos de mercado independentes, e não uma tendência generalizada na indústria.