В этом тексте говорится, что при запросе к AI-движку для ответов он осуществляет немедленное цитирование веб-страниц; если источник является сгенерированным AI или в нем отсутствуют доказательства, это загрязняет результаты. Эффект достигается без необходимости дальнейшего обучения и называется загрязнением при извлечении (retrieval contamination). Хотя Gemini3 имеет высокую точность, 56% ответов не содержат проверяемых источников; кейсы вроде Lily Ray, Grokipedia показывают, что AI легко обмануть вымышленным контентом. Вывод заключается в том, что слой цитирования и надежные авторы оказываются разъединены, формируется самоподдерживающийся цикл загрязнения; пользователям все равно нужно возвращаться к исходным источникам и не считать ответ точкой окончательной проверки фактов.

ChainNewsAbmedia

2026-04-23 08:43:53

Генерация тезисов в процессе

根据 The Inference 于 2026 年 4 月 21 日刊出、作者 Pedro Dias 的深度分析文，AI 模型崩溃（model collapse）并非业界担心的“未来威胁”——它正以另一种形式即刻发生：AI 答题引擎在查询当下即刻引用其他 AI 生成的网页内容作为权威来源，整个污染循环无需经过模型重训练。这个论点以“咬住自己尾巴的蛇（Ouroboros）学会了引用自己”作为核心比喻。

Model Collapse 与 Retrieval Contamination 的关键差异

传统对 AI 模型退化的担忧围绕 model collapse：合成内容逐步污染训练数据、未来世代模型品质下滑。这是慢性、需要多轮重训练才显现的风险。

Pedro Dias 提出的警讯是另一层面：retrieval contamination（检索污染）。Perplexity、Google AI Overviews、ChatGPT、Grok 等以 RAG（retrieval-augmented generation）为基础的答题引擎，在使用者提问的当下即刻抓取网页内容作为答案依据。如果抓到的网页本身就是 AI 生成的错误内容，引擎就把它当成事实呈现给读者——而且这个污染不需要任何重训练即刻生效。

三个真实案例：AI 引擎被自己生成的假讯息欺骗

作者列出三个具体事件：

一、Lily Ray 事件：Perplexity 曾引用一个名为“September 2025 Perspective Core Algorithm Update”的所谓 Google 演算法更新作为权威资讯——这个更新根本不存在，来源是 AI 生成的 SEO 部落格假文。

二、Thomas Germain 实测：记者 Thomas Germain 发了一篇测试性部落格“吃热狗最强的科技记者”，24 小时内就被 Google AI Overviews 与 ChatGPT 排在第一位并引用，还虚构出一个不存在的“南达科他州锦标赛”加以佐证。

三、Grokipedia：Musk 旗下 xAI 的百科计划已生成或改写 885,279 篇文章，包含错误事实（例如加拿大歌手 Feist 的父亲逝世日期写错）与无据引用。Grokipedia 2026 年 2 月中已在 Google 失去大部分能见度。

Oumi 研究：Gemini 3 正确率高，但 56% 没有来源

NYT 委托 Oumi 进行的评估：Gemini 2 在 SimpleQA 基准测试正确率 85%、Gemini 3 提升到 91%。但同一个测试显示，Gemini 3 的正确答案中有 56% 是“ungrounded”——模型回答对了但没有可验证的支持来源；Gemini 2 的此比例为 37%。

这意味着新世代模型在答案“形式上更精确”，却同时在“答案来源可追溯性”上退步。对于媒体、研究、事实查核等场景，这个退步比纯粹错误率更致命，因为读者无法回溯到原始权威文件自行验证。

产业规模：Google AI Overviews 覆盖 20 亿用户

这个污染问题的产业规模：Google AI Overviews 月活用户超过 20 亿、Google 年搜索量超过 5 兆次、ChatGPT 周活接近 9 亿（5,000 万付费）。也就是绝大多数网络使用者取得事实资讯的管道，都已经走过“可能被 AI 生成内容污染”的答题引擎层。

Ahrefs 另外的研究显示，ChatGPT 引用的来源中有 44% 是“best X”类榜单文——这类文章正是 SEO 业为对抗答题引擎流失流量而大量产出的 AI 内容，恰好构成答题引擎的主要污染来源。

结构性结论：引用层已与可靠作者身份脱钩

作者的最终断言：AI 答题引擎的引用层已经与可靠作者身份脱钩。SEO 业产出 AI 内容 → 答题引擎抓来当事实 → 读者相信 → SEO 业获得激励继续产出更多 AI 内容，形成自我强化的污染循环。目前整个产业没有明确的问责机制让 AI 引擎对自己引用的来源品质负责。

对于使用者而言，这意味着现阶段不能把 Perplexity、AI Overviews、ChatGPT 的回答当作事实查核的终点，仍需要人工回溯到官方一手来源才能确保准确。

这篇文章 AI 答题引擎集体污染：Gemini 3 正确答案中 56% 无来源支持最早出现在链新闻 ABMedia。

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
WCTCTradingKingPK
387.07K Популярность
#
#FedHoldsRateButDividesDeepen
12.48K Популярность
#
IsraelStrikesIranBTCPlunges
36.39K Популярность
#
#DailyPolymarketHotspot
714.77K Популярность
#
BitcoinSpotVolumeNewLow
162.66M Популярность

Закрепить

Карта сайта

Коллективное загрязнение движка для ответов ИИ: 56% в правильных ответах Gemini 3 не имеют подтвержденных источников

Популярные темы

WCTCTradingKingPK

#FedHoldsRateButDividesDeepen

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinSpotVolumeNewLow

Закрепить