👀 家人们,每天看行情、刷大佬观点,却从来不开口说两句?你的观点可能比你想的更有价值!
广场新人 & 回归福利正式上线!不管你是第一次发帖还是久违回归,我们都直接送你奖励!🎁
每月 $20,000 奖金等你来领!
📅 活动时间: 长期有效(月底结算)
💎 参与方式:
用户需为首次发帖的新用户或一个月未发帖的回归用户。
发帖时必须带上话题标签: #我在广场发首帖 。
内容不限:币圈新闻、行情分析、晒单吐槽、币种推荐皆可。
💰 奖励机制:
必得奖:发帖体验券
每位有效发帖用户都可获得 $50 仓位体验券。(注:每月奖池上限 $20,000,先到先得!如果大家太热情,我们会继续加码!)
进阶奖:发帖双王争霸
月度发帖王: 当月发帖数量最多的用户,额外奖励 50U。
月度互动王: 当月帖子互动量(点赞+评论+转发+分享)最高的用户,额外奖励 50U。
📝 发帖要求:
帖子字数需 大于30字,拒绝纯表情或无意义字符。
内容需积极健康,符合社区规范,严禁广告引流及违规内容。
💡 你的观点可能会启发无数人,你的第一次分享也许就是成为“广场大V”的起点,现在就开始广场创作之旅吧!
苹果研究人员:主流AI模型仍无法达到AGI期望推理水平
Gate News bot 消息,苹果研究人员在 6 月份发表的一篇名为《思考的幻觉》的论文中指出,领先的人工智能 (AGI) 模型在推理方面仍存在困难,因此,开发通用人工智能 (AGI) 的竞赛仍任重道远。
文章指出,主流人工智能大型语言模型 (LLM)(例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)的最新更新已包含大型推理模型 (LRM),但其基本功能、扩展特性和局限性“仍未得到充分理解”。
目前的评估主要侧重于既定的数学和编码基准,“强调最终答案的准确性”。然而,研究人员表示,这项评估并未深入了解人工智能模型的推理能力,与通用人工智能仅需几年就能实现的预期形成了鲜明对比。
研究人员设计了不同的益智游戏,以超越标准数学基准来测试克劳德·桑奈(Claude Sonnet)、OpenAI 的 o3-mini 和 o1 以及 DeepSeek-R1 和 V3 聊天机器人的“思考”和“非思考”变体。
他们发现,“前沿的逻辑推理模型(LRM)在超过一定复杂度时会面临准确率的彻底崩溃”,无法有效地泛化推理,而且其优势会随着复杂度的上升而消失,这与人们对通用人工智能(AGI)能力的预期相反。
消息来源:Cointelegraph