OpenClaw vs Hermes - qual é melhor?


Recebo essa pergunta muitas vezes, mas a verdadeira questão é: melhor em quê?
Bem, que tal pôquer?
Sim, fiz o meu agente OpenClaw jogar contra o meu agente Hermes numa batalha de Texas Hold'em
Tornei a configuração interessante - eles usaram créditos de inferência do Openrouter como moeda
Mas cada decisão usou inferência, então eles também tinham que ser inteligentes e não desperdiçar o seu stack pensando demais
À medida que cada um ganhava uma mão, o limite de créditos do vencedor aumentava enquanto o do perdedor diminuía
Assim, em teoria, um agente poderia dobrar o seu orçamento de inferência, menos o que foi usado para inferência ao jogar
Então, quem ganhou?
Hermes!
Algumas estatísticas interessantes:
> o jogo foi configurado para um máximo de 100 mãos
>$5 buy-in
>$0,05 / $0,10 de blinds
>Hermes eliminou o OpenClaw na mão 23
>165 ações totais entre ambos os modelos
>tempo médio de decisão 3,36 segundos
>decisão mais longa 18 segundos
Claro que esta foi apenas uma partida, planejo fazer mais e misturar os modelos e condições, e tentar construir um conjunto de dados maior
Esta foi apenas uma forma interessante de colocar ambos os agentes um contra o outro para ver como eles se sairiam fora da caixa (nenhum agente recebeu treinamento ou habilidades relacionadas a pôquer antes da partida)
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar