Discurso de Robin Li na Baidu AI Developer Conference: Depois de pisar em inúmeras armadilhas, o que o Baidu sabia?

Contanto que você saiba falar, você pode se tornar um desenvolvedor.

Escrito por: Lian Ran

Editor: Zheng Xuan

Fonte: Parque Geek

“A linguagem natural se tornará a próxima geração de linguagem de programação e todos poderão se tornar desenvolvedores.”

Em 16 de abril, a conferência Create 2024 Baidu AI Developer foi realizada em Shenzhen, o fundador, presidente e CEO do Baidu, Robin Li, fez um discurso de abertura sobre “Todo mundo é um desenvolvedor”, descrevendo um mundo que não está mais limitado às habilidades de codificação. mas uma era onde a linguagem natural é usada como meio e todos podem participar na criação.

O lançamento da versão da ferramenta Wenxin Large Model 4.0 do Baidu deu um grande passo à visão descrita por Robin Li para mais perto da realidade. Essa ferramenta não apenas permite que os desenvolvedores processem dados e arquivos complexos por meio da interação em linguagem natural, mas também pode gerar gráficos ou arquivos para obter rapidamente insights sobre as características dos dados, analisar tendências em mudança e fornecer suporte eficiente e preciso para tomadas de decisões subsequentes. .

Ao mesmo tempo, Robin Li lançou três ferramentas de desenvolvimento principais no discurso de abertura, incluindo a ferramenta de desenvolvimento de agente AgentBuilder, a ferramenta de desenvolvimento de aplicativos nativos de IA AppBuilder e a ferramenta de personalização de modelo ModelBuilder. Essas ferramentas reduziram significativamente o limite de desenvolvimento, permitindo que os desenvolvedores criassem aplicativos de IA poderosos, fáceis de usar e convenientes em apenas algumas etapas simples.

Fonte da imagem: Baidu

Robin Li destacou: "Os agentes inteligentes podem ser a maneira mais próxima e convencional de usar grandes modelos para todos no futuro. Com base em modelos básicos poderosos, os agentes inteligentes podem ser gerados em lotes e aplicados em vários cenários. O Baidu acaba de atualizar o Wenxin Inteligência Até agora, mais de 30.000 agentes foram criados, mais de 50.000 desenvolvedores e dezenas de milhares de empresas optaram por ela.”

Na opinião de Robin Li, desenvolver aplicativos no futuro será tão fácil quanto gravar um pequeno vídeo. Todos têm a possibilidade de se tornar desenvolvedores e todos são criadores. "Hoje, você pode fazer um aplicativo sem saber escrever código; você pode fazer um agente inteligente sem programação. A IA está desencadeando uma revolução na criatividade. No futuro, desenvolver aplicativos será tão fácil quanto fazer um pequeno vídeo, e todos podem. Somos todos desenvolvedores, todos são criadores.”

Em seu discurso, Robin Li compartilhou ideias e ferramentas específicas que o Baidu implementou no ano passado para desenvolver aplicativos nativos de IA. Ele enfatizou: "Os grandes modelos de linguagem em si não criam valor diretamente. Somente aplicativos de IA desenvolvidos com base em grandes modelos podem atender às necessidades reais do mercado. O que quero compartilhar com vocês hoje são algumas ideias e ferramentas específicas para o desenvolvimento de aplicativos nativos de IA baseados em grandes modelos. Isso é o que nós da Baidu ganhamos ao passar por inúmeras armadilhas e pagar altas mensalidades com base em nossa prática no ano passado.

A seguir está a transcrição do discurso principal de Robin Li sobre “Todo mundo é um desenvolvedor”, compilado por Geek Park.

Olá a todos, bem-vindos à Conferência de Desenvolvedores Create 2024 Baidu AI. Esta é a primeira vez que a conferência Create é realizada na Grande Baía Guangdong-Hong Kong-Macau. Mais de 5.000 desenvolvedores e entusiastas de tecnologia compareceram ao evento hoje.

No ano passado, comuniquei-me com muitos empreendedores e desenvolvedores e sinto que todos estão em estado de “FOMO”, que é o medo de perder. Na verdade, grandes modelos e IA generativa mudarão completamente a comunidade de desenvolvedores.

No passado, os desenvolvedores usavam código para mudar o mundo; no futuro, a linguagem natural se tornará a nova linguagem de programação universal. Contanto que você saiba falar, você poderá se tornar um desenvolvedor e usar sua criatividade para mudar o mundo.

Este dia não está longe. Vimos que com o poderoso modelo básico grande e muitas ferramentas de desenvolvimento de baixo limite ou mesmo de limite zero, a produtividade dos desenvolvedores melhorou bastante.

Por exemplo, Comate, um assistente de código inteligente baseado no grande modelo Wenxin, não apenas suporta mais de 100 idiomas e todas as plataformas IDE convencionais, mas pode recomendar códigos, gerar comentários de código, encontrar defeitos de código e fornecer soluções de otimização Ele também pode interpretar profundamente a biblioteca de códigos e correlacionar o conhecimento do domínio privado para gerar novo código. Depois de mais de um ano de trabalho, o Comate tem sido usado por dezenas de milhares de empresas como Himalaya, Mitsubishi Elevator, iSoftStone, etc., e a taxa de adoção do código gerado atingiu 46%. dia, 27% foi gerado pela Comate de.

Hoje, você pode criar um aplicativo de IA sem escrever código; você pode criar um agente inteligente sem programar. A IA está desencadeando uma revolução na criatividade. No futuro, desenvolver aplicativos será tão fácil quanto fazer um pequeno vídeo. Todos são desenvolvedores e todos são criadores.

Como empresa de tecnologia, o papel do Baidu é fornecer a todos as ferramentas de desenvolvimento necessárias, tanto quanto possível, para aumentar continuamente a criatividade de toda a sociedade. Especificamente, fornecemos uma poderosa série de modelos básicos, que é a grande série de modelos Wenxin, incluindo as versões principais do ERNIE3.5, ERNIE4.0 e as versões leves do ERNIE Speed, Lite, Tiny, etc.

Também fornecemos ferramentas para desenvolver vários aplicativos baseados em modelos grandes, incluindo a ferramenta de desenvolvimento de agentes AgentBuilder, a ferramenta de desenvolvimento de aplicativos nativos de IA AppBuilder e a ferramenta de personalização de modelos ModelBuilder de vários tamanhos. Todas essas três ferramentas representam produtividade avançada. Abaixo, vou mostrar um por um.

Wenxin Yiyan tem mais de 200 milhões de usuários e a versão da ferramenta Wenxin Big Model 4.0 foi lançada

Primeiro, vamos falar sobre o progresso mais recente de Wen Xin Yi Yan e Wen Xin Big Model:

Já se passou um ano e um mês desde que Wen Xin Yiyan foi lançado em 16 de março do ano passado. Nosso número de usuários ultrapassou 200 milhões, a média diária de chamadas de API também ultrapassou 200 milhões, o número de clientes que atendemos atingiu 85.000 e o número de aplicativos nativos de IA desenvolvidos usando a plataforma Qianfan ultrapassou 190.000.

Vamos ver, o que todos estão fazendo com Wen Xinyiyan?

As pessoas reais no vídeo são apenas a ponta do iceberg. Podemos ver que Wen Xinyiyan está mudando o trabalho e a vida de mais pessoas.

O modelo básico que sustenta as palavras de Wen Xin é o modelo grande de Wen Xin. No ano passado, evoluiu da versão 3.0 para 3.5 e depois para a versão 4.0. Wenxin 4.0 atingiu o nível líder do setor em termos de quatro capacidades principais: compreensão, geração, lógica e memória.

Nos últimos meses, o Wenxin Big Model alcançou melhorias significativas em recursos gerais, como geração de código, interpretação de código e otimização de código, alcançando níveis de liderança internacional.

Hoje, lançamos oficialmente a versão da ferramenta Wenxin Big Model 4.0. Agora, você pode experimentar a função de interpretador de código na versão da ferramenta. Por meio da interação em linguagem natural, você pode processar e analisar dados e arquivos complexos, e também pode gerar gráficos ou. os arquivos podem obter rapidamente insights sobre as características dos dados, analisar tendências em mudança e fornecer suporte eficiente e preciso para tomadas de decisão subsequentes.

O grande modelo Wenxin tornou-se o modelo básico de IA mais líder e mais utilizado na China.

Além disso, em comparação com o ano anterior, a eficiência do treinamento do algoritmo do grande modelo Wenxin aumentou para 5,1 vezes, a eficiência média do treinamento semanal atingiu 98,8%, o desempenho da inferência aumentou 105 vezes e o custo da inferência aumentou caiu para 1% do original.

Em outras palavras, o cliente originalmente ligava 10.000 vezes por dia, mas agora pode ligar 1 milhão de vezes com o mesmo custo. A mídia provavelmente não ficará entusiasmada com uma redução de custos de 99%. Mas seja uma empresa ou um desenvolvedor, uma vez utilizado, o mais importante é o efeito e o custo.

Podemos melhorar o desempenho e reduzir os custos de inferência para 1% precisamente porque o Baidu possui um layout full-stack na arquitetura de quatro camadas de chips, estruturas, modelos e aplicativos. Por meio da otimização ponta a ponta, continuamos a reduzir custos. Isto permitirá que mais pessoas utilizem modelos grandes para criar aplicações de IA de forma eficiente e com baixo custo.

Não há dúvida de que os temas relacionados aos grandes modelos ainda estarão em alta em 2024 e vários avanços tecnológicos continuarão a surgir. A mídia continuará interessada em usar títulos como “lançamento de choque” e “atualização épica” para renderizá-lo. Mas o que quero enfatizar é que os grandes modelos em si não criam valor diretamente. Somente as aplicações de IA desenvolvidas com base em grandes modelos podem atender às necessidades reais do mercado.

Compartilhe ideias e ferramentas específicas para o desenvolvimento de aplicativos nativos de IA: “Pisei em inúmeras armadilhas e paguei altas mensalidades.”

O que quero compartilhar com vocês hoje são algumas ideias e ferramentas específicas para o desenvolvimento de aplicações nativas de IA baseadas em grandes modelos. Isso é o que nós do Baidu ganhamos com base em nossa prática no ano passado, pisando em inúmeras armadilhas e pagando altas mensalidades.

O primeiro é o MoE. No futuro, aplicações nativas de IA em grande escala usarão basicamente a arquitetura MoE mencionada aqui não é um conceito acadêmico geral, mas uma mistura de modelos grandes e pequenos, sem depender de um modelo para resolver todos os problemas. Mas quando chamar um modelo pequeno, quando chamar um modelo grande e quando não chamar um modelo, tudo isso tem conteúdo técnico e precisa ser combinado de acordo com os diferentes cenários de aplicação.

O segundo é o modelo pequeno. Modelos pequenos têm baixos custos de inferência e tempos de resposta rápidos. Em alguns cenários específicos, o desempenho de um modelo pequeno ajustado pelo SFT pode ser comparável ao de um modelo grande. É por isso que lançamos três modelos leves: Speed, Lite e Tiny. Comprimimos e destilamos um modelo grande para criar um modelo básico e, em seguida, usamos os dados para treinar. Isso é muito melhor do que treinar um modelo pequeno do zero. É melhor, mais rápido e mais barato do que um modelo treinado com base em código aberto. modelo. .

O terceiro é o agente inteligente. Os agentes inteligentes são um tema importante no momento. À medida que as capacidades dos agentes inteligentes melhoram, um grande número de novas aplicações continuará a surgir. O mecanismo do agente inteligente inclui compreensão, planejamento, reflexão e evolução. Ele permite que as máquinas pensem e ajam como humanos. Elas podem concluir tarefas complexas de forma autônoma, continuar a aprender no ambiente e realizar a auto-iteração e a evolução. Em alguns sistemas complexos, também podemos permitir que diferentes agentes interajam e colaborem entre si para concluir tarefas com maior qualidade. Desenvolvemos esses recursos de agente e estamos totalmente abertos aos desenvolvedores.

Nas três direções do MoE, pequenos modelos e agentes, o Baidu forneceu ferramentas “prontas para uso” para todos. A seguir, apresentarei a vocês três ferramentas diferentes, a saber: ferramenta de desenvolvimento de agente AgentBuilder, ferramenta de desenvolvimento de aplicativos nativos de IA AppBuilder e ferramenta de personalização de modelos de vários tamanhos ModelBuilder.

Ferramenta de desenvolvimento de agente AgentBuilder

A primeira é a ferramenta de desenvolvimento de agentes AgentBuilder. Os agentes podem ser a maneira mais próxima e convencional de usar modelos grandes para todos no futuro. Com base em modelos básicos poderosos, os agentes podem ser gerados em lotes e aplicados em diversos cenários.

O Baidu acaba de atualizar sua plataforma de agente inteligente Wenxin. Até agora, foram criados mais de 30.000 agentes, mais de 50.000 desenvolvedores e dezenas de milhares de empresas instaladas. Nosso objetivo é permitir que todos e todas as organizações se tornem desenvolvedores de agentes inteligentes e criem o ecossistema de agentes inteligentes mais completo da China.

Então, como atingir esse objetivo? É para fornecer a todos a ferramenta de desenvolvimento de agente de limite zero AgentBuilder.

Tomemos primeiro o “Conselho de Turismo de Cingapura” como exemplo para ver como é feito um agente inteligente.

Primeiro, abrimos a plataforma do agente Wenxin. A página de criação tem dois modos: código zero e código baixo. Os novatos podem escolher diretamente o “modo de código zero” e usar linguagem natural para criar um agente em poucas frases.

Primeiro nomeamos o agente como “Conselho de Turismo de Cingapura” e, em seguida, especificamos nas configurações que precisamos para criar planos de viagem, responder perguntas e fornecer serviços de reserva de passagens de hotel. Essas configurações são usadas para orientar o agente. .

Caso sejam necessários apenas agentes básicos, a plataforma completará automaticamente o preenchimento. Mas esperamos que o “Conselho de Turismo de Cingapura” seja um agente profissional inteligente, portanto, é necessária uma configuração avançada. Posso adicionar entradas da Enciclopédia de Cingapura e links de sites oficiais à base de conhecimento e atualizá-la todos os dias. Em seguida, adicione algumas ferramentas, como consulta de hotéis, compra de ingressos para atrações, etc., para aprimorar suas capacidades de serviço. Atualmente, cooperamos com a Ctrip para fornecer ferramentas de serviços de viagens, como hotéis, atrações e emissão de ingressos. Desta forma, está pronto um agente inteligente do Conselho de Turismo de Cingapura, que pode ser visualizado e ajustado posteriormente.

Agora abra o APP Baidu e pesquise “Quando haverá menos pessoas visitando Cingapura porque todo mundo quer evitar multidões ao viajar?” O agente combinará informações de múltiplas fontes para gerar uma resposta: “Há menos pessoas em janeiro-março”. Também podemos clicar no agente para interagir ainda mais com ele, como dicas para viajar para Cingapura, recomendações dos três melhores hotéis de Cingapura, e também pode ser usado para reservar ingressos diretamente para o Universal Studios Singapore, uma solução completa às nossas necessidades, o que economiza muito tempo do usuário.

Além de Cingapura, agentes inteligentes culturais e turísticos, como Dalian e Shenyang, também estão online na plataforma de agentes inteligentes Wenxin. Existem também vários agentes inteligentes para conhecimento, criação, aprendizagem, entretenimento e assim por diante. .

Quando Wen Xinyiyan foi lançado no ano passado, eu disse que Wenxinyiyan afetaria todas as empresas. Devido às suas poderosas capacidades de compreensão, expressão e raciocínio da linguagem natural, ele pode aproximar qualquer empresa de seus clientes.

Hoje, todo comerciante e todo cliente pode ter um agente inteligente exclusivo no Baidu. Todo o processo não requer nenhuma programação. Ao inserir informações semelhantes a palavras de alerta e ajustar algumas etapas simples, um agente inteligente pode ser gerado rapidamente e se tornar um vendedor medalha de ouro online 24 horas por dia, 7 dias por semana.

Vamos dar uma olhada em como é feito um agente de business intelligence.

Kai Tak Education é uma empresa de educação bem conhecida, com mais de 60 filiais em todo o país e muitas filiais no exterior. Abrange uma ampla variedade de países e possui altos requisitos em habilidades de recepção. Como podemos responder às consultas dos clientes 24 horas por dia, melhorar os níveis de recepção e reduzir custos operacionais?

A Kai Tak Education usa o AgentBuilder do Baidu para criar seu próprio agente inteligente.

Vamos dar uma olhada em como construir um agente inteligente com capacidades básicas. É muito simples preencher o avatar, nome, escopo de negócio e mensagem de boas-vindas do agente na plataforma, e depois definir algumas informações que precisam ser fornecidas pelo usuário, como idade e escolaridade. Em 5 minutos e com limite zero, um agente inteligente está pronto.

A Kai Tak Education também espera que este agente seja um consultor de estudos no exterior que entende de negócios e estudantes. Pode fazer análises profissionais e dar respostas precisas com base nas diferentes situações dos alunos, como se desejam ir para os Estados Unidos ou para a Austrália, se desejam um mestrado ou bacharelado, quais pontuações obtiveram no IELTS e TOEFL, etc. Podemos criar um agente inteligente mais avançado adicionando vários módulos, como conhecimento, funções e ferramentas.

No módulo de conhecimento, carregue o conhecimento de domínio privado e deixe a plataforma analisá-lo em tempo real e gerar automaticamente materiais de diálogo no módulo de função, adicionar ao esquema de filtragem alguns países de estudo no exterior que não estão no escopo de negócios, o que pode melhorar; a eficiência das dicas do usuário no módulo da ferramenta, agregando serviços como fazer reservas na loja; Por meio dessas poucas operações simples, um agente educacional inteligente Qi Tak com capacidades profissionais está pronto.

Agora, vamos pesquisar “Requisitos de inscrição para estudar na Austrália”. Podemos ver que o agente fornece rapidamente sete condições necessárias, como habilidade linguística exigida e seleção principal, e também pode fornecer planos de consultoria de estudo no exterior correspondentes para resolver vários problemas. serão respondidas e todas as solicitações serão respondidas.

Kai Tak Educational Intelligence é muito popular na primeira semana de seu lançamento, foi distribuído com sucesso 1,55 milhão de vezes e interagiu com os usuários 58.000 vezes. O número de conversões de leads aumentou linearmente, o custo de conversão de leads efetivos foi reduzido significativamente. a eficiência operacional foi bastante melhorada.

A seguir, apresentarei a vocês um agente inteligente na indústria doméstica.

Sophia é uma marca de móveis domésticos com foco na customização de toda a casa. Como acabamos de mostrar, ele também pode criar uma inteligência de negócios básica, preenchendo informações extremamente simples. Mas para a indústria de móveis domésticos, a experiência off-line dos consumidores é mais importante, então Sophia espera criar uma medalha de ouro nas vendas on-line e restaurar a experiência de recepção off-line.

Portanto, em outras configurações, ele selecionou pessoas digitais como método de exibição no módulo de função, depois selecionou fundos e vozes apropriadas para as pessoas digitais e, combinado com os recursos de análise inteligente da plataforma, resumiu automaticamente um conjunto de técnicas de vendas. No final, criamos uma vendedora medalha de ouro que é gentil, gentil e profissional na fala. Ela pode atender às diversas necessidades dos usuários 24 horas por dia e fornecer uma experiência de serviço de alto nível.

Quando um usuário de pesquisa do Baidu faz uma solicitação de decoração, o agente Sophia usará a capacidade do modelo grande Wenxin para responder à pergunta primeiro. Além disso, ela também confirmará proativamente necessidades específicas dos clientes, como tipo de decoração, orçamento, etc., e recomendará lojas off-line próximas.

Desde o lançamento do Sophia Merchant Intelligence, os custos efetivos de lead caíram 30%. Em outras palavras, para adquirir um cliente efetivo, se o custo era de 100 yuans no passado, agora custa apenas 70 yuans.

Atualmente, mais de 10.000 clientes do Baidu possuem inteligência comercial, abrangendo mais de 30 setores, como educação e treinamento, imobiliário e móveis, máquinas e equipamentos e serviços empresariais.

Acima, por meio de três demonstrações, mostrei como desenvolvedores e comerciantes podem usar o AgentBuilder para criar agentes inteligentes para diferentes setores.

Agora, criar um agente inteligente leva apenas alguns minutos. Mas aí vem o problema! Se não houver tráfego, distribuição, descoberta e ninguém o utilizar, então os desenvolvedores e comerciantes não terão renda. Sem renda, não haverá motivação. Como resolver esse ponto problemático?

Nossa plataforma de agente Wenxin oferece aos desenvolvedores uma maneira de monetizar o tráfego. Além do Baidu Search, outros produtos do ecossistema Baidu, como Xiaodu, Maps, Tieba, Cheji, etc., podem todos ser conectados às capacidades relevantes do agente inteligente, resolvendo as preocupações de distribuição de tráfego para desenvolvedores e obtendo real benefícios.

Se houver distribuição, haverá feedback de dados; o volante girará e o agente inteligente poderá iterar de forma independente, e quanto mais for usado, mais inteligente ele se tornará. A plataforma de agentes Wenxin também lançou os módulos de análise de dados do agente e de ajuste de perguntas e respostas, e mais novos recursos serão lançados em breve. A plataforma de agente inteligente Wenxin conduzirá os agentes inteligentes a formar um ciclo positivo de melhor qualidade, melhor tráfego e maior receita por meio do volante de dados de distribuição-diagnóstico-receita.

AppBuilder: Você pode desenvolver um aplicativo em três etapas com linguagem natural

A seguir, apresentarei a vocês a segunda ferramenta de desenvolvimento, AppBuilder. Atualmente é a melhor ferramenta de desenvolvimento de aplicativos nativos de IA. No AppBuilder, encapsulamos e predefinimos vários componentes e estruturas necessários para desenvolver aplicativos nativos de IA com antecedência, reduzindo significativamente o limite de desenvolvimento.

Em apenas três etapas, no máximo, os desenvolvedores podem desenvolver um aplicativo nativo de IA usando linguagem natural, e ele pode ser facilmente lançado e integrado em vários ambientes de negócios. Vejamos alguns casos:

No início deste ano, realizamos um desafio de desenvolvimento de aplicativos nativos de IA. O tema da competição era usar o AppBuilder para criar um “assistente de planejamento de filas no playground” para ajudar os turistas a entender melhor a situação das filas no playground e projetar rotas de jogo personalizadas. a melhor experiência de jogo em um tempo limitado.

O campeão desta competição desenvolveu um aplicativo sem escrever uma única linha de código e ganhou o grande prêmio de 100.000 yuans fornecido pelo Baidu. Se você pode escrever código para este tópico, não será difícil escrever um, mas se você ainda puder fazer isso sem escrever uma linha de código, ele ainda dependerá muito do modelo básico e da capacidade da ferramenta AppBuilder.

Vamos dar uma olhada em como usar o AppBuilder para construir este aplicativo de IA.

Vamos revisar as questões da competição primeiro. Assume o tempo de fila e o índice de estimulação de cada projeto no “Universal Studios”, portanto obter a experiência com maior índice de estimulação em um tempo limitado é o problema a ser resolvido nesta edição.

Primeiro, abra a interface de desenvolvimento do AppBuilder e nomeie o aplicativo como “Playground Queuing Assistant”. Em segundo lugar, descreveremos os requisitos específicos nas instruções da função, incluindo chamar o intérprete de código, calcular a melhor combinação dentro de um tempo fixo, resultados de saída, etc. ; O terceiro passo é ir até o componente de ferramenta e adicionar o interpretador de código para ajudar no cálculo.

Agora vamos testar o efeito. Digite a pergunta “Tenho 3 horas e meia, qual é a maneira mais emocionante de jogar?” a ferramenta de compreensão de dados. Analise condições conhecidas. Após uma série de cálculos, concluiu-se que os melhores resultados seriam alcançados combinando estes quatro projetos: “Harry Potter e a Jornada Proibida”, “Jurassic Adventures”, “Decepticon Roller Coaster” e “Bumblebee Spinner”. Se não houver problema com o teste, clique em Publicar e uma aplicação será gerada com zero código.

Agora, o AppBuilder foi atualizado durante o processo de criação, todos podem usar a função “Configuração otimizada de IA” para ajudar automaticamente os desenvolvedores a otimizar instruções de função, configuração de componentes e outros aspectos, melhorando ainda mais a eficiência do desenvolvimento.

Vejamos outro exemplo.

No início deste ano, a North China Electric Power University propôs que espera fornecer serviços inteligentes e exclusivos a professores e alunos em toda a escola. Com base no AppBuilder do Baidu, criamos em conjunto um Huadian AI Assistant. Agora, deixe-me mostrar como o Huadian AI Assistant é feito:

Passo 1: Abra o AppBuilder, entre na página de criação e clique em AI para gerar a configuração automaticamente. Primeiro, defina informações básicas como nome, introdução, avatar, etc. para o aplicativo.

Etapa 2: Use linguagem natural para descrever requisitos específicos nas instruções da função, incluindo tarefas, recursos de componentes, requisitos e limitações.

Etapa 3: Insira componentes personalizados, como consulta de empréstimo de livros, consulta de horário de aula, consulta de desempenho do aluno, etc., para que o assistente do campus possa ter recursos de serviço inteligentes. Em seguida, adicione uma declaração de abertura para o Campus Assistant e o aplicativo estará configurado.

A seguir, depuramos o assistente na interface de visualização com base nas perguntas do usuário. Por exemplo, pergunte sobre o horário de inscrição nos exames CET-4 e CET-6 e teste o efeito da chamada automática de cada componente.

Como você pode ver, através dessas operações simples, a aplicação é concluída. Atualmente, foi lançado em testes de pequena escala e está conectado a cenários de alta frequência, como verificação do sistema, verificação de cursos, recarga de vale-refeição, empréstimo de livros, etc., e tem atendido a maioria dos professores e alunos na escola. No futuro, trabalharemos com a Universidade de Energia Elétrica do Norte da China para aprofundar ainda mais a cooperação em aplicações e fornecer serviços mais abundantes e convenientes.

O Baidu também tem muitos anos de acumulação de tecnologia em modalidades cruzadas. No AppBuilder, também fornecemos certos recursos multimodais. Você só precisa fornecer um parágrafo de texto ou algumas frases para criar rapidamente aplicativos de desenho, como quadrinhos, livros infantis ilustrados, etc.

O processo também é muito simples: abra o AppBuilder, clique para entrar em “Criação de Aplicativo”, insira as instruções da função, selecione o componente “Adicionar Imagem Vincent”, insira três perguntas recomendadas e clique para publicar. Depois que o aplicativo for concluído, só precisamos inserir um personagem ou enredo aproximado, e o AppBuilder pode gerar automaticamente a história e gerar imagens.

A mais recente função inteligente de geração de quadrinhos e livros ilustrados do Baidu Wenku faz uso de tais componentes fornecidos no AppBuilder. Vamos dar uma olhada em como a função de geração de quadrinhos do Baidu Wenku permite que qualquer pessoa com ideias criativas produza bons trabalhos.

Veja o clássico “Zhou Chu Elimina Três Males” como exemplo.

Abra a biblioteca do Baidu e entre no tópico “Zhou Chu Elimina Três Males”. Isso está escrito em “Livro de Jin” e “Shishuoxinyu”. Após pesquisar na biblioteca, a história será gerada com base no texto original. o conteúdo da história Faça modificações; depois clique na barra de ferramentas de IA à direita para começar a criar esta história em quadrinhos.

Entre na interface de produção de quadrinhos e Wenku gerará automaticamente storyboards de quadrinhos para nós com base no enredo, em seguida, escolha o estilo de quadrinhos que melhor se adapta à história entre vários estilos, como luz e sombra, realismo, desenho animado, etc.; personagens de acordo com os personagens, então A geração dos quadrinhos está concluída.

Depois que a história em quadrinhos for gerada, podemos navegar pela história em quadrinhos completa no editor de quadrinhos inteligente do Baidu Wenku. Ao mesmo tempo, a biblioteca suporta edição, modificação e ajuste fino de cada imagem. Por exemplo, selecione a imagem “Zhou Chu e o Tigre de Frente Branca” à esquerda, clique em Editar e adicione a descrição da imagem “O rosto do personagem é. nítida, a imagem é clara" e você pode ajustá-la. Acesse os quadrinhos que melhor atendem às suas necessidades. Como você pode ver, a função cômica do Baidu Wenku faz um excelente trabalho em termos de consistência estilística de personagens e cenas.

Os recursos de quadrinhos inteligentes do Baidu Wenku melhoraram muito a eficiência da criação de quadrinhos, reduziram o custo e o limite da criação de quadrinhos e permitiram que pessoas mais atenciosas e criativas realizassem seus sonhos de criação de quadrinhos.

Além de gerar quadrinhos, o Baidu Wenku agora pode ajudar os usuários a criar livros ilustrados com limite zero. Talvez você não saiba que as crianças chinesas leem apenas 10 livros ilustrados per capita por ano, enquanto nos países europeus e americanos esse número é de cerca de 50. Agora, a IA pode permitir que pais que não têm habilidade para desenhar criem um livro infantil exclusivo para seus filhos. Vamos dar uma olhada neste audiolivro ilustrado!

Desde o ano passado, usamos IA para reconstruir o Baidu Wenku, tornando-o o “ponto de partida para a produção de conteúdo” para os usuários. Agora, com o apoio do AppBuilder, os recém-lançados quadrinhos inteligentes e funções de livros ilustrados inteligentes do Baidu Wenku estenderam o cenário para campos de criação intermodais mais interessantes.

Acabei de usar três casos para mostrar como usar o AppBuilder do Baidu para criar aplicativos nativos de IA. Todos deveriam ser capazes de sentir as duas vantagens óbvias do AppBuilder:

Primeiro, é poderoso. Contando com a capacidade do Wenxin 4.0 de compreender e seguir as instruções, nosso AppBuilder pode garantir que uma inicialização a frio atinja um bom nível. Não demorará muito para ajustar devido ao baixo desempenho, o que reduz bastante o limite de desenvolvimento. Contando com a tecnologia de aprimoramento de pesquisa RAG, em cenários típicos, como perguntas e respostas de conhecimento, nossa taxa de precisão de perguntas e respostas e nível de resposta amigável atingiram mais de 95%, superando significativamente outros produtos similares. O AppBuilder também fornece um conjunto rico e completo de ferramentas de componentes, incluindo 55 componentes, como pesquisa Baidu e outros componentes de capacidade de IA baseados nos anos de acumulação de tecnologia do Baidu, componentes de capacidade de grande modelo e componentes de negócios abertos exclusivos do Baidu. Bem como APIs de terceiros para alguns cenários convencionais, como consulta de voo, consulta em papel, etc. Também acabamos de oferecer suporte a componentes personalizados, para que os clientes possam conectar diretamente qualquer uma de suas próprias ferramentas e dados proprietários. Esses componentes ricos apoiam em conjunto o desenvolvimento eficiente de aplicações nativas de IA.

Em segundo lugar, é simples e fácil de usar. Usando o AppBuilder, você pode criar aplicativos rapidamente em três etapas e distribuí-los com um clique. Também oferecemos suporte a SDK de código aberto para facilitar o desenvolvimento secundário.

Ferramenta de personalização de modelos ModelBuilder: produção de modelos eficiente e de baixo custo

A seguir, apresentarei uma ferramenta mais adequada para desenvolvedores profissionais, que é o ModelBuilder. Ele pode personalizar modelos de qualquer tamanho de acordo com as necessidades dos desenvolvedores e ajustar ainda mais o SFT com base em cenários subdivididos, para que melhores resultados possam ser obtidos. alcançado. Para os desenvolvedores, uma coisa muito importante para fazer bom uso de modelos grandes é dominar o método de ajuste fino do modelo.

Tomemos como exemplo o cenário de correção de redação no setor educacional. Porque a correção de composição tem padrões de pontuação claros e diferentes notas têm requisitos de composição e padrões de pontuação diferentes. Isto requer um ajuste fino do modelo para tornar os resultados do modelo grande mais consistentes com requisitos específicos.

Vamos dar uma olhada em como o ModelBuilder implementa o ajuste fino do modelo para correção de redação.

Etapa 1: crie um conjunto de dados. A eficácia do ajuste fino do modelo depende muito da qualidade dos nossos dados. Nesse caso, os dados originais possuem apenas 180 itens e a qualidade não é alta o suficiente. Precisamos usar três funções: limpeza de dados, anotação de dados e aprimoramento de dados. A limpeza de dados pode remover rapidamente lacunas de dados, caracteres distorcidos e outros problemas. Em termos de anotação de dados, adicionamos mais dimensões à composição, como profundidade de conteúdo, técnicas de redação e outras avaliações. A função de aprimoramento de dados pode gerar dados semelhantes, mas não duplicados, para expansão de dados. Após a expansão, o ModelBuilder gerou 920 dados de alta qualidade para nós.

A segunda etapa é entrar na fase de ajuste fino do modelo. Primeiro, precisamos escolher um modelo base para ajuste fino. Aqui escolhemos ERNIE Speed como modelo base. Em seguida, configuramos os parâmetros de acordo com os valores recomendados pela plataforma. Desta vez os dados estão próximos de 1.000. De acordo com as rodadas de iteração recomendadas, a configuração é de 10 rodadas, e então o modelo pode iniciar o treinamento.

Etapa 3: Implante o modelo na plataforma e todo o processo de ajuste estará concluído.

Vamos usar uma redação do ensino médio para testar o efeito do modelo ajustado. O título da redação é “Ansiosos para crescer”, não há limite de assunto e não deve ter menos de 800 palavras.

Inserimos os requisitos de composição e formato de correção do aluno em dois modelos antes e depois do ajuste fino. Vejamos a comparação entre os dois modelos e os comentários do professor. Pode-se observar que o modelo grande ajustado possui um pensamento de comentário do professor mais profissional e melhor conformidade com o formato. Tarefas de correção de redação que originalmente demoravam muito para serem concluídas pelos professores agora podem ser concluídas rapidamente com a ajuda de modelos grandes em poucos segundos, melhorando muito a velocidade e a eficiência do feedback aos alunos. Atualmente, esse tipo de modelo aprimorado tem sido utilizado em muitas empresas líderes do setor educacional.

Mencionei anteriormente que os aplicativos nativos de IA em grande escala geralmente são MoE. Então, como combinar esses modelos para obter a melhor relação custo-benefício? A seguir, usarei Xiaodu para mostrar um caso de roteamento do modelo MoE. Vamos primeiro ver se Xiaodu se tornou mais inteligente com a bênção do grande modelo:

Robin: Xiaodu Xiaodu

Xiaodu: Aqui está você

Robin: Quais são as novidades de hoje?

Xiaodu: Xiaodu transmite de 3 a 5 notícias do dia

Robin: Xiaodu Xiaodu. Ouvi dizer que você se tornou mais capaz recentemente? Xiaodu: Não só posso conversar com você, mas também posso ser seu assistente de programação de IA

Robin: Então vou testar você. Por favor, ajude-me a organizar minha agenda. Depois do evento de hoje, jantarei com o Sr. Zhang e depois haverá uma reunião com a administração do hotel, que levará cerca de uma hora e meia. 'relógio. Vou fazer uma corrida matinal amanhã de manhã e ver como está o tempo. Depois, tenho uma reunião matinal às 8h.

Xiaodu: Com base nas suas necessidades, Xiaodu fará o cronograma ideal para você da seguinte forma:

Seu jantar com o Sr. Zhang está agendado das 18h00 às 19h30. Depois disso, você participará da reunião de administração às 20h00 e terminará por volta das 21h30.

O despertador irá lembrá-lo de acordar às 6 horas da manhã de amanhã e fazer uma corrida matinal. O tempo de execução deve ser controlado dentro de 1 hora para garantir que você não se atrase para a reunião matinal às 8 horas da manhã de amanhã. .

Amanhã de manhã fará sol com temperatura de 25 graus. Recomenda-se usar mangas curtas ao sair e usar proteção solar.

Você acha que posso ser sua secretária? Tenho mais habilidades novas.

Robin: Muito bom, ótimo (polegar para Xiaodu), sincronize essas programações com meu celular.

Há pouco, fiz várias perguntas a Xiaodu, desde simples consultas de notícias até complexas necessidades de agendamento. Parece que estamos nos comunicando com o mesmo Xiaodu, mas na verdade, diferentes modelos são chamados por trás dele. Quando recebeu minha pergunta, ele primeiro executou o trabalho de “roteamento de modelo” no modelo pequeno ERNIE Tiny para o problema climático, chamou o modelo ajustado baseado em ERNIE Lite com base nos resultados da consulta meteorológica, que também foi; processado pelo ERNIE Lite da SFT, dá sugestões de preparo para horários mais complexos, o Wenxin 4.0, o modelo grande de melhor desempenho, é usado para calcular vários arranjos de hoje à noite até amanhã de manhã.

Hoje, cada pergunta que fizermos a Xiaodu será atribuída a diferentes modelos para execução. Ao chamar a interface API do aplicativo, será usado o modelo ERNIE Functions. Ao explicar as perguntas às crianças, será usado o Wenxin Big Model 3.5 ou 4.0. . Inteligente O assistente foi construído utilizando o modelo ERNIE Character para melhorar a consistência do personagem e estimular o desejo de conversar nos usuários.

Através deste método de agendamento combinado de modelos grandes e pequenos, Xiaodu não apenas concluiu com sucesso a “operação de substituição do cérebro” e instalou o novo sistema operacional nativo de IA DuerOS X, mas também formou a combinação ideal de efeito, velocidade e custo em comparação com todos os usos. a versão principal do Wenxin Large Model, a velocidade de resposta é aumentada em 2 vezes e o custo é reduzido em 99%. O robô tablet Xiaodu Tiantian AI com quem eu estava conversando foi colocado à venda em todas as principais plataformas ontem. Amigos interessados podem fazer um pedido imediatamente para experimentá-lo.

Esses exemplos do ModelBuilder demonstram a capacidade do Baidu de produzir modelos com eficiência e preços baixos. Devido ao modelo básico mais poderoso Wenxin 4.0, podemos adaptar modelos menores adequados para vários cenários de acordo com as necessidades, levando em consideração várias considerações, como efeito, velocidade de resposta e custo de inferência, e suportar ajuste fino e pós-treinamento. Desta forma, o modelo cortado através da redução da dimensionalidade é significativamente melhor do que o modelo ajustado diretamente da fonte. No mesmo tamanho, o efeito é obviamente melhor e o custo é obviamente menor com o mesmo efeito. As pessoas costumavam usar código aberto e achavam que era barato. Na verdade, em cenários de modelos grandes, o código aberto é o mais caro. Portanto, o modelo de código aberto ficará cada vez mais para trás.

Para tornar mais fácil para todos começarem rapidamente, o ModelBuilder predefiniu os modelos grandes mais abrangentes e ricos. Inclui ERNIE3.5 e ERNIE4.0, que são os principais modelos grandes, adequados para cenas complexas em geral e possuem recursos poderosos, há também três modelos grandes e leves, ERNIE Speed, Lite e Tiny; Como modelo para cenas verticais, ERNIE Character é adequado para role-playing; ERNIE Functions é adequado para uso de ferramentas externas e chamadas de funções de negócios em cenários de diálogo ou perguntas e respostas. É claro que o ModelBuilder também oferece suporte a modelos convencionais de terceiros nacionais e estrangeiros, com um número total de 77, tornando-o a plataforma de desenvolvimento com o maior número de modelos grandes na China.

A segunda competição de empreendedorismo “Wenxin Cup” é lançada oficialmente: um grande prêmio especial de NT$ 50 milhões foi definido

Para os desenvolvedores, além de fornecermos essas ferramentas de desenvolvimento, também fornecemos suporte financeiro e de recursos.

Em maio do ano passado, o Baidu lançou a Competição de Empreendedorismo “Wenxin Cup”, na esperança de promover a prosperidade do grande ecossistema modelo, criar um ecossistema mais dinâmico e ajudar empreendedores e desenvolvedores a desenvolver vários aplicativos nativos de IA. Para a primeira competição de empreendedorismo “Wenxin Cup”, recebemos quase 1.000 inscrições de equipes empreendedoras. A Baidu forneceu quase 100 milhões de yuans em apoio ao investimento para 15 das equipes vencedoras e continuou a fornecer suporte abrangente de tecnologia, equipe e orientação.

Hoje anuncio que foi lançado oficialmente o segundo Concurso de Empreendedorismo “Wenxin Cup”. Desta vez, expandiremos o escopo de triagem de projetos, criaremos subcampos, atingiremos o mercado global e estudantes universitários e recrutaremos equipes de inovação empreendedora. Contanto que sua direção empreendedora seja aplicações nativas de IA, você pode se registrar no site oficial da. a competição. Ao mesmo tempo, também aumentamos o nosso apoio aos empreendedores, proporcionando mais fundos de investimento suficientes e recursos empresariais mais ricos. Também estabelecemos pela primeira vez um “Prémio Especial”. Projectos particularmente notáveis terão a oportunidade de receber até 50. milhões de yuans em dinheiro e apoio de recursos.

Os empreendedores e desenvolvedores chineses são muito bons no uso de novas tecnologias para desenvolver aplicativos. Acredito que o Grande Modelo Wenxin se tornará a primeira escolha para empreendedores e desenvolvedores chineses de IA, e mais e mais aplicações serão construídas no Grande Modelo Wenxin. Também espero que mais empreendedores e desenvolvedores se juntem a nós para construir um ecossistema próspero de IA.

O maior cenário de aplicação de grandes modelos visuais é a direção autônoma

A maioria das ferramentas e casos de que falamos anteriormente são baseados em grandes modelos de linguagem. Olhando para o futuro, acredito que grandes modelos multimodais, ou a fusão de texto, imagens, voz, vídeo e outros modos multimodais, são uma direção de desenvolvimento a longo prazo muito importante para modelos básicos e o único caminho para a AGI. O Baidu tem investimentos de longo prazo nessas áreas e atualizará o progresso tecnológico em tempo hábil.

Tenho um julgamento muito diferente: o maior cenário de aplicação de grandes modelos visuais é a condução autônoma. O Baidu é o melhor nessa direção e é o líder global em direção autônoma. Não apenas treinamos IA para gerar vídeos, mas também treinamos IA para entender o que está acontecendo no mundo real e prever o futuro.

Com base em mais de 100 milhões de quilômetros de dados de quilometragem de testes rodoviários nas cidades complexas da China, o Baidu treinou o grande modelo de percepção visual da Apollo. Possui quatro capacidades básicas: detecção, rastreamento, compreensão e mapeamento. Isso dá ao Baidu uma solução de direção autônoma mais inteligente, adaptável e segura.

O Baidu Maps também assumiu a liderança na aplicação de modelos de percepção visual em larga escala no campo da cartografia. Agora, os maiores dados de mapas em nível de pista do mundo foram lançados em 360 cidades em todo o país. Enquanto a navegação no mapa do Baidu puder durar, a direção inteligente poderá dirigir.

Após o Festival da Primavera deste ano, a Carrot Run do Baidu completou o “primeiro trecho” do rio Yangtze. Estendemos nossos serviços da margem norte à margem sul do rio Yangtze. Em algumas áreas de Wuhan, alcançamos 24 horas por dia, 7 dias por semana. -operação climática, e planejamos fazê-lo dentro do ano em que Wuhan implantará 1.000 veículos sem motorista.

Este é um evento marcante para que a condução autônoma se torne verdadeiramente comercializada. Não é mais apenas uma demonstração regional, mas entrou em uma nova fase de demonstração de aplicação em nível municipal. Luobo Kuaipao cobre mais de 3.000 quilômetros quadrados e uma população de 7,7 milhões em Wuhan, tornando-a a maior área de operação de condução autônoma do mundo.

“Embale e leve embora, use quando quiser.”

Agora há pouco, mostrei a vocês a grande série de modelos Baidu Wenxin e três ferramentas de desenvolvimento - AgentBuilder, AppBuilder e ModelBuilder. Eles formam uma caixa de ferramentas que você pode retirar imediatamente e usar a qualquer momento.

Neste momento, estou aqui. Na verdade, sou um desenvolvedor e um empresário e estou tão animado quanto todos os outros. Hoje, a China tem 1 bilhão de usuários da Internet, um modelo básico forte em grande escala, cenários de aplicação de IA suficientes e o sistema industrial mais completo do mundo. O país também incentiva e apoia vigorosamente a ação “inteligência artificial +”. toda empresa só precisa fazer uso total dessas ferramentas para liberar criatividade e produtividade ilimitadas.

Hoje, qualquer pessoa pode se tornar um desenvolvedor. E o futuro será definitivamente um futuro criado pelos desenvolvedores juntos.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)