O Cursor revela o método de treinamento com autoinstalação e melhora o desempenho do Composer 2 em 14 pontos percentuais

De acordo com a divulgação recente da Cursor, a empresa revelou uma técnica de treinamento chamada autoinstall para sua série de modelos Composer: usar um modelo da geração anterior para configurar automaticamente ambientes executáveis para o aprendizado por reforço da próxima geração. Ao treinar o Composer 2, a Cursor usou o Composer 1,5 para concluir essa tarefa. O método funciona em duas etapas: primeiro, um agente lê a documentação e a configuração do repositório de código para gerar 10 comandos de verificação com saídas esperadas; segundo, outro agente usa 3 desses comandos para configurar o ambiente do zero até os comandos serem executados com sucesso, com no máximo 5 tentativas de repetição. O Composer 2 obteve uma pontuação de 61,7% no Terminal-Bench, um benchmark que mede a capacidade de configuração de ambientes, em comparação com os 47,9% do Composer 1,5, registrando uma melhora de 14 pontos percentuais.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

UE proíbe pornografia deepfake gerada por IA em 7 de maio

De acordo com a Agência de Notícias Xinhua, em 7 de maio, membros do Parlamento Europeu e estados-membros chegaram a um consenso para banir sistemas de inteligência artificial de gerar conteúdo pornográfico deepfake. A proibição será incorporada a emendas ao Ato de Inteligência Artificial de 2024. Parlamento Europeu

GateNews23m atrás

Tether lança modelo de IA médica MedPsy QVAC e atinge nota 62,62 na versão de 17 bilhões de parâmetros

De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica projetado para rodar localmente em smartphones e dispositivos vestíveis, sem depender de nuvem. A versão com 1,7 bilhão de parâmetros obteve 62,62 em sete benchmarks médicos, superando a MedGemma-1.5-4B do Google em 11,42 poi

GateNews43m atrás

A API da B.AI lança quatro novos modelos, incluindo o GPT-5,5 Instant, dentro de 48 horas após a divulgação do OpenAI

A API do B.AI lançou quatro novos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 e GLM-5.1. O GPT-5.5 Instant concluiu a adaptação subjacente e a integração da interface em 48 horas após o lançamento da OpenAI, permitindo acesso sem atraso a

GateNews48m atrás

O modelo de IA médica da Tether, de US$ 1,7 bilhão, supera hoje um concorrente 16 vezes maior

De acordo com a equipe de pesquisa em IA da Tether, a empresa lançou hoje os modelos de linguagem médica da série QVAC MedPsy, projetados para implantação local em smartphones e dispositivos vestíveis, sem dependência da nuvem. A versão com 1,7 bilhão de parâmetros obteve 62,62 em sete benchmarks médicos, superando o Google MedGemma-4B

GateNews59m atrás

Avaliação da Anthropic ultrapassa US$ 1,26 trilhão, superando a OpenAI pela primeira vez

De acordo com Beating, a avaliação implícita da Anthropic no mercado pré-IPO da Jupiter disparou para US$ 1,26 trilhão, superando a OpenAI pela primeira vez. A avaliação subiu 20% nos últimos 7 dias e aumentou 900% desde outubro de 2025. Os dados de mercado de apostas do Polymarket mostram uma probabilidade de 86% de que A

GateNews1h atrás
Comentário
0/400
Sem comentários