跳至主内容
版本:稳定版 (v4.x)

DocSearch 与 Algolia Crawler

非官方测试版翻译

本页面由 PageTurner AI 翻译(测试版)。未经项目官方认可。 发现错误? 报告问题 →

如果您在本网站找不到问题的答案,本页面将为您提供帮助。若仍有疑问,请随时通过 Discord 联系我们或告知支持团队

您也可以阅读我们的 Crawler FAQ 了解其运行机制:

有关 DocSearch 项目的疑问,请参阅 DocSearch 项目 FAQ

网站抓取频率是怎样的?

抓取任务每周随机时间自动执行一次。您可通过配置文件调整此计划,或在 Crawler 控制台 手动触发。

为何搜索结果中出现重复内容?

当多个 URL 指向相同内容时会出现此情况,例如 ./docs./docs/./docs/index.html

建议在网站中配置规范 URL,详见 Google 的"合并重复 URL"指南

Ultimately, it is possible to set the exclusionPatterns to all the patterns you want to exclude.

docsearch-scraperdocsearch-configs 仓库是否仍在维护?

我们已弃用旧版基础设施,但您仍可自行运行实例并接入 DocSearch v3

如何迁移

Every owner should have received a migration email from Algolia with the details. If you were not part of the previous index owners, or the maintainer has changed, you can request access via our support page.

邮件中已详述所有步骤,要使用新基础设施需执行:

  • 通过邮件中的邀请链接加入 Algolia 应用

  • 使用邮件中的凭证更新前端集成

docsearch({
container: '#docsearch',
appId: 'YOUR_NEW_ALGOLIA_APP_ID',
apiKey: 'YOUR_NEW_ALGOLIA_SEARCH_API_KEY',
indexName: 'YOUR_INDEX_NAME', // it does not change
});

如何处理旧版配置和凭证?

您可忽略它们,待所有用户迁移至新基础设施后我们将自动清理!

请使用专用控制台修改索引配置。

为何控制台显示两个 Algolia 应用?

为方便您熟悉新基础设施,我们保留了旧版 DocSearch 应用 (BH4D9OD16A) 的访问权限。BH4D9OD16A 将在所有 DocSearch 用户完成迁移前持续可用。

Search yields no results

若搜索无结果且浏览器开发者工具无报错,可能是索引存在问题。

请确认:

  1. 您的爬虫配置需与网站结构匹配

我们为多种网站生成器提供了配置模板,您也可以将其作为基础配置。调试选择器时,推荐使用URL测试工具

  1. 索引设置保持最新(若未更新,您会在搜索预览页看到提示横幅)

The Crawler only applies index settings at index creation time, to keep the Algolia dashboard as the source of truth. If you have drastically changed your config, or moved to a website generator, we recommend you to delete your index from the Algolia dashboard before starting a new crawl.

可以删除爬虫吗?

技术上可行,但删除后将导致功能异常。我们已自动创建与您DocSearch应用关联的默认爬虫,若删除后试图新建爬虫将无法按预期工作。

误删DocSearch爬虫怎么办?

最快的方式是通过Discord联系我们,或发送邮件至下方地址,我们将尽快处理。

爬虫能用于密码保护网站吗?

DocSearch应用集成的爬虫不支持需登录的密码保护网站。如需此功能,请使用标准Algolia方案 https://www.algolia.com/pricing 并添加爬虫组件。请注意:按使用量付费的爬虫虽可免费添加,但免费套餐存在功能限制。

迁移相关链接