0,6 segundos para imprimir!A velocidade mais rápida no telefone é Stable Diffusion, e isso é apenas o começo

Fonte original: Heart of the Machine

Agora, com a aceleração de amontoar grandes modelos em telefones celulares, o usuário médio pode experimentar o poder da IA generativa por si mesmo.

Fonte da imagem: Gerado por Unbounded AI

2023 chegou ao fim, e este é o ano em que grandes modelos e IA generativa se tornaram as principais tendências na comunidade de IA. Desde o advento do ChatGPT, uma variedade de modelos de IA de uso geral e profissionais surgiram um após o outro, e o aumento se tornou imparável. Com o avanço das tecnologias de compressão de modelos, como quantização, poda de rede e destilação de conhecimento, o poder de computação de IA de dispositivos terminais, como telefones celulares, continua a aumentar, e grandes modelos estão se movendo para o pouso de terminais, além da implantação em nuvem.

Para esta “revolução do lado do dispositivo” que começou, os gigantes de chips e fabricantes de telemóveis tornaram-se a principal força, e continuam a tentar implementar e executar modelos de IA generativa em telemóveis e outros dispositivos terminais, dando às pessoas um pouco de surpresa e choque de vez em quando.

Em fevereiro deste ano, vimos pela primeira vez o Stable Diffusion, um grande modelo de diagramas de Wensheng rodando mais de 1 bilhão de parâmetros em telefones celulares. Ele estava rodando em um telefone Android alimentado pela plataforma móvel Snapdragon 8 de segunda geração da Qualcomm, e levou menos de 15 segundos para executar 20 etapas de inferência, resultando em uma imagem de 512×512 pixels. Isso também criou a velocidade de inferência mais rápida em um smartphone na época.

Você acha que esse é o limite de velocidade para telefones que executam Stable Diffusion? Aparentemente não. No Snapdragon Tech Summit de 2023, no mês passado, o tempo de construção de menos de 15 segundos foi reduzido em dez vezes. A mais recente plataforma móvel emblemática da Qualcomm, o Snapdragon 8 de terceira geração (Snapdragon 8 Gen 3), torna possível disparar.

No cume, um telefone Snapdragon 8 Gen 3 rodando o mesmo grande modelo Stable Diffusion foi gerado localmente em menos de 1 segundo (0,6 segundos). De 15 segundos para 0,6 segundos, ficamos surpresos com a velocidade com que grandes modelos de IA generativa do lado do dispositivo evoluíram.

Este é apenas um pequeno teste das capacidades de IA do lado do dispositivo da Qualcomm no Snapdragon Technology Summit deste ano. Além de um salto qualitativo na velocidade de geração (de 15 segundos para 0,6 segundos), o Snapdragon 8 Gen 3 aumenta o tamanho dos parâmetros de grandes modelos que podem ser executados (de 1 bilhão para 10 bilhões) em uma ordem de magnitude.

Foi revelado o chip de PC AI de próxima geração da Qualcomm, o Snapdragon X Elite, que “encaixou” dezenas de bilhões de modelos de parâmetros na plataforma de PC, expandindo consideravelmente a amplitude de aplicativos de IA generativos.

Até agora, a liderança da Qualcomm e a liderança tecnológica no campo da IA do lado do dispositivo foram ainda mais fortalecidas, e fabricantes como telefones celulares, PCs e até mesmo fones de ouvido receberam mais imaginação e possibilidades de implementação de IA terminal.

Plataformas duplas tornam a IA generativa mais acessível

Desde fevereiro deste ano, a Qualcomm tem executado sucessivamente o Stable Diffusion e o ControlNet em telefones Android equipados com a plataforma móvel Snapdragon 8 de segunda geração, tornando uma realidade para modelos grandes rodarem em telefones celulares. O Snapdragon 8 Gen 3 revelado no Snapdragon Summit leva o potencial dos modelos de grande escala a novos patamares, permitindo-lhe continuar a liderar o caminho no campo.

Entende-se que o motor de IA da Qualcomm usado no Snapdragon 8 Gen 3 tem uma poderosa NPU Hexagon para terminais móveis, integrando uma unidade de aceleração de hardware atualizada, uma unidade de inferência de micro-fatia, um tensor reforçado, uma unidade escalar e vetorial, todos os quais compartilham uma grande memória compartilhada com 2 vezes a largura de banda. A precisão mista de INT8+INT16 e toda a precisão de INT4, INT8, INT16 e FP16 são suportadas. Até 98% melhor desempenho e 40% mais eficiência energética do que a geração anterior.

O Snapdragon 8 Gen 3 também tem um hub de sensor Qualcomm integrado mais forte, com 2 ISPs sempre ativos, 2 micro NPUs e 1 DPS, 30% mais memória, suporte para precisão INT4 e uma melhoria de 3,5x no desempenho de IA.

Pode-se dizer que o Snapdragon 8 Gen 3 dá ao telefone um desempenho de IA sem precedentes, tornando-se a primeira plataforma móvel da Qualcomm construída especificamente para IA generativa. Então, será que esta plataforma móvel emblemática faz jus ao seu nome? Essa é a questão que nos preocupa a todos.

Nesta plataforma, o Qualcomm AI Engine suporta IA generativa multimodal pela primeira vez, incluindo uma variedade de grandes modelos de linguagem, modelos de linguagem visual e muito mais. Especialmente no lado do dispositivo, o Snapdragon 8 Gen 3 suporta a execução de um modelo com 10 bilhões de parâmetros pela primeira vez, e a escala atingiu a escala de 10 bilhões. Ao mesmo tempo, o tempo que leva para a Difusão Estável gerar imagens foi reduzido para menos de 1 segundo, que é mais uma vez o tempo mais rápido.

Ao executar o modelo de linguagem grande da Meta, Llama2-7B, o Snapdragon 8 Gen 3 pode gerar 20 tokens por segundo, que também é um dos mais rápidos no terminal de celular.

Ziad Asghar, vice-presidente sênior de gerenciamento de produtos da Qualcomm

Atualmente, a plataforma Snapdragon tem suportado a operação de grandes modelos de empresas ou instituições como OpenAI, Meta, Microsoft, Android, stability.ai, BLOOM, Baidu, Zhipu, Baichuan Intelligence, Youdao, etc., o que não só oferece uma oportunidade para esses fabricantes “descentralizarem” suas grandes capacidades de modelo para o lado do dispositivo, mas também traz uma riqueza de opções para a experiência do usuário IA generativa.

Com as ações adicionais da Qualcomm em capacitar o pouso de terminais de modelos de grande escala, os fabricantes de telefones celulares que usam a plataforma móvel Snapdragon 8 Gen 3 rapidamente acompanharam, acelerando o processo de integração de modelos de grande escala em telefones celulares.

Tomando a série Xiaomi 14 equipada com a plataforma móvel Snapdragon 8 Gen 3 como exemplo, a tecnologia de modelo grande de IA foi integrada no novo sistema operacional emergente da Xiaomi e lançou vários aplicativos do lado do dispositivo. Com a bênção das capacidades de grandes modelos, o Xiaomi Mi 14 suporta muitas funções, como AI Wonderful Painting, AI Search, AI Photo, AI Expanded Image, etc., para que os métodos de entrada, WPS e álbuns de fotos sejam rejuvenescidos.

A série iQOO 12 da Vivo também está equipada com a plataforma móvel Snapdragon 8 Gen 3, e o novo motor de IA da Qualcomm atualiza muito a sua experiência de imagem, com textura e detalhes completos da foto. Ao mesmo tempo, o sistema OriginOS 4 pré-instalado nesta série de telefones celulares introduz funções generativas de IA, e o assistente de IA Blue Heart Little V pode realizar super pesquisa semântica, super perguntas e respostas, super escrita, super criação e interação super inteligente, o que melhorou significativamente sua inteligência.

Anteriormente no Snapdragon Summit, o CEO da Honor, Zhao Ming, anunciou que o novo telefone celular principal Honor Magic 6 será equipado com a plataforma móvel Snapdragon 8 Gen 3, que suporta um modelo de IA do lado do dispositivo de 7 bilhões de parâmetros, proporcionando aos usuários uma experiência mais inteligente. Ele demonstrou as operações inteligentes, como busca de fotos e geração de vídeo por IA no lado do terminal, e o efeito foi muito bom.

A integração de grandes modelos em dispositivos móveis levou a um grande número de aplicações de IA generativas que são divertidas ou podem ajudar a melhorar a produtividade. No futuro, aplicativos de IA mais generativos permitirão que mais usuários experimentem o charme da IA e melhorem sua experiência interativa, que é uma das forças motrizes importantes para a Qualcomm construir recursos de IA generativa no lado do dispositivo.

Além de continuar a usar IA para capacitar plataformas móveis, a Qualcomm também está procurando capitalizar o desenvolvimento de grandes modelos e IA generativa para remodelar a indústria de PCs e expandir sua vantagem no campo da IA.

A IA generativa tem uma “segunda frente”

A Qualcomm revelou um novo processador para plataformas de PC, o Snapdragon X Elite, que usa uma tecnologia de processo de 4nm e integra uma CPU Qualcomm Oryon personalizada, que roda duas vezes mais rápido que o processador de 12 núcleos da Intel, consome 68% menos energia do que os concorrentes da Intel e roda 50% mais rápido do que o M2 da Apple durante as horas de pico.

Se esses parâmetros não convencerem você da resistência do Snapdragon X Elite, vá para uma pontuação. O Snapdragon X Elite está disponível em duas variantes: uma versão de 23W com foco na duração da bateria e uma versão de 80W com foco no desempenho. As pontuações single-core e multi-core no teste Geekbench 6 são mostradas no gráfico abaixo, com o desempenho single-core sendo particularmente impressionante.

Fonte: FoneArena

Da mesma forma, o Snapdragon X Elite foi construído para IA. Alimentado pelo Qualcomm AI Engine líder do setor com Qualcomm Hexagon NPU e até 75 TOPS de potência de computação heterogênea e 45 TOPS para Hexagon NPU, ele fornece a base de poder de computação para experiências transformadoras em aplicativos criativos, videoconferência e assistentes de produtividade. O Qualcomm AI Engine também suporta um grande número de aplicações e experiências aceleradas, criando infinitas possibilidades.

Desde seu lançamento, ele suporta a execução de modelos de IA generativa com mais de 13 bilhões de parâmetros no lado do dispositivo, gerando 30 tokens por segundo para 7 bilhões de modelos grandes de parâmetros, e a velocidade de processamento de IA é 4,5 vezes mais rápida do que a de produtos concorrentes. A figura a seguir mostra os recursos de desenho de IA no lado do PC.

De telefones celulares a PCs, diversas plataformas no dispositivo fornecem mais caminhos para liberar recursos de IA generativa. Isso também mostra que a Qualcomm continua a “aumentar o peso” na trilha do pouso de IA generativa terminal, que não é apenas inseparável do acúmulo de tecnologia, mas também da continuação de sua própria estratégia de desenvolvimento de IA na era dos grandes modelos.

Telemóveis e PCs aceleram para inaugurar uma nova era de IA

Na era atual de grandes modelos, a rota da implantação de IA generativa no lado do dispositivo está se tornando mais clara. Com base nisso, a Qualcomm sempre aderiu ao conceito e estratégia de “IA híbrida é o futuro da IA”, com foco no desenvolvimento coordenado de nuvem e dispositivos, e acredita que a IA do lado do dispositivo é a chave para expandir a IA generativa para uma escala global mais ampla.

Seguindo essa cognição voltada para o futuro, a Qualcomm construiu gradualmente recursos poderosos e abrangentes de IA final em seu próprio layout e liderou a inovação e o progresso de modelos grandes do lado do dispositivo e IA generativa. Não há dúvida de que o Snapdragon 8 Gen 3 e o Snapdragon X Elite anunciados no Snapdragon Summit consolidarão ainda mais a posição da Qualcomm como líder em IA do lado do dispositivo.

* *Solução de otimização de IA Full-Stack da Qualcomm

Se os grandes modelos continuarem a ser implementados no ritmo atual, seremos capazes de experimentar aplicações de IA mais generativas em telefones celulares, PCs e até mesmo dispositivos inteligentes, como wearables XR e carros conectados, tornando as interações homem-máquina mais naturais e personalizadas. Por sua vez, essas aplicações de IA generativa e as mudanças de experiência resultantes terão um impacto profundo nesses dispositivos finais, até mesmo mudando seus principais drivers e redefinindo-os.

Tomemos como exemplo os telemóveis que estão intimamente relacionados com o trabalho e a vida das pessoas, para além da procura de um desempenho absoluto, as pessoas estão a prestar cada vez mais atenção a algumas aplicações criativas. Isso exige que a IA desempenhe um papel, e o desempenho da IA generativa tornou-se a competitividade central da próxima geração de processadores de telefones celulares.

Portanto, não é surpreendente que a plataforma móvel Snapdragon tenha continuado a fazer esforços nesta área nos últimos anos. Do Snapdragon 8 Gen 2 do ano passado ao Snapdragon 8 Gen 3 neste Snapdragon Summit, a IA tem sido onipresente, e a IA generativa se tornou a “nova joia da coroa da IA” e recebeu atenção e favor generalizados.

À medida que o escopo e a maturidade de grandes modelos e IA generativa em dispositivos móveis se tornam mais amplos e maduros, podemos ver que os smartphones tradicionais são substituídos por “telefones de IA” com recursos de IA generativa abrangentes. Os recém-lançados telefones emblemáticos de fabricantes de telefones celulares, como a Xiaomi, começaram a tomar forma nesse sentido, usando IA generativa para melhorar a experiência do usuário e a eficiência em alguns cenários, e fazendo mudanças quantitativas suficientes para a mudança qualitativa de subverter telefones celulares no futuro.

Ao mesmo tempo, a evolução dos endpoints de PC é semelhante à tendência para recursos de IA generativa. O Microsoft Copilot, integrado no Windows, é um bom exemplo disso. E, claro, há muitos cenários de IA mais generativos e maneiras pelas quais as pessoas interagem com seus PCs, permitindo uma colaboração mais eficiente e inteligente, fluxos de trabalho mais simplificados, mais produtividade e experiências de usuário mais personalizadas.

O Snapdragon X Elite está visando a IA generativa assim que atacar, e está pronto para injetar sangue fresco no mercado atual de PCs. No 6º Fórum Econômico Internacional de Hongqiao - sub-fórum “Tecnologia Inteligente e Desenvolvimento da Indústria Futura”, o presidente da Qualcomm China, Meng Feng, fez um discurso principal, dizendo que a próxima geração de PCs entrará em uma nova era de “AI PC”, caracterizada por inteligência, alto desempenho, alta eficiência, etc., e terá grande significado para a eficiência do escritório. Acredita-se que, no futuro, a Qualcomm continuará a fortalecer suas capacidades básicas em modelos grandes e IA generativa com base em plataformas móveis como Snapdragon 8 Gen 3 e plataformas de PC como Snapdragon X Elite. Juntamente com o lançamento de novos telefones celulares e PCs emblemáticos de fornecedores com essas plataformas, podemos esperar por aplicações de IA generativas mais diversificadas devido à sua crescente autonomia e capacidades de autodesenvolvimento.

No entanto, antes que a era dos “telefones de IA” e “PCs de IA” realmente chegue, também é necessário ver se os recursos de IA generativa podem fazer com que os usuários tenham perceções fortes, se eles podem atender com precisão às suas necessidades, se eles podem confiar em aplicativos relacionados e se eles podem impulsionar seu desejo de mudar de telefone, que são todas as questões que a Qualcomm e os fabricantes de telefones celulares precisam considerar agora e no futuro.

Conclusão

Desde o seu lançamento, o Snapdragon 8 Gen 3 e o Snapdragon X Elite mostraram poderosas capacidades de IA generativa que deixam as pessoas com imaginação ilimitada. Como Ammon, presidente e CEO da Qualcomm, disse: "Estamos entrando na era da IA generativa que mudará a experiência do usuário e criará um novo ciclo para dispositivos móveis e computação. 」

Neste processo, a Qualcomm, como líder do lado dos terminais, está a assumir o seu devido papel nos tempos. Por um lado, a empresa aproveita seus poderosos recursos de otimização de IA full-stack para reunir partes de software e hardware para facilitar o rápido desenvolvimento do ecossistema de IA do lado do dispositivo e, por outro lado, a nova tecnologia multiplataforma “Snapdragon Seamless” permite a integração perfeita de Android, Windows e outros sistemas operacionais, o que deve expandir ainda mais a implementação de IA em celulares, PCs e outros dispositivos.

É previsível que a experiência de IA baseada no ecossistema Snapdragon seja implementada muito rapidamente, e a velocidade de várias aplicações será muito acelerada. No futuro, a Qualcomm continuará a manter suas vantagens tecnológicas em IA do lado do dispositivo e promover modelos grandes para serem mais convenientes, ricos e atraentes ao implantar aplicativos. Ao mesmo tempo, trabalharemos com os principais fabricantes para inovar aplicações de IA generativa baseadas em grandes modelos, reduzindo o limiar para usuários comuns usarem IA generativa.

À medida que a nova era da IA generativa começa, acho que este Snapdragon Summit nos deu a resposta para saber se a Qualcomm pode continuar a atender às expectativas das pessoas.

Link de referência:

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)