跳至主内容
版本:稳定版 (v4.x)

DocSearch x Algolia Crawler

非官方测试版翻译

本页面由 PageTurner AI 翻译(测试版)。未经项目官方认可。 发现错误? 报告问题 →

如果您在本网站找不到问题的答案,本页面将为您提供帮助。若仍有疑问,请随时通过 Discord 联系我们或告知支持团队

您也可以阅读我们的 Crawler FAQ 了解其运行机制:

有关 DocSearch 项目的疑问,请参阅 DocSearch 项目 FAQ

网站抓取频率是怎样的?

抓取任务每周随机时间自动执行一次。您可通过配置文件调整此计划,或在 Crawler 控制台 手动触发。

为何搜索结果中出现重复内容?

当多个 URL 指向相同内容时会出现此情况,例如 ./docs./docs/./docs/index.html

建议在网站中配置规范 URL,详见 Google 的"合并重复 URL"指南

最终可通过设置 exclusionPatterns 排除所有需要过滤的模式。

docsearch-scraperdocsearch-configs 仓库是否仍在维护?

我们已弃用旧版基础设施,但您仍可自行运行实例并接入 DocSearch v3

如何迁移

所有所有者应已收到 Algolia 发送的迁移邮件。若您未在旧版 index 所有者列表中或维护者已变更,可通过支持页面申请访问权限。

邮件中已详述所有步骤,要使用新基础设施需执行:

  • 通过邮件中的邀请链接加入 Algolia 应用

  • 使用邮件中的凭证更新前端集成

docsearch({
container: '#docsearch',
appId: 'YOUR_NEW_ALGOLIA_APP_ID',
apiKey: 'YOUR_NEW_ALGOLIA_SEARCH_API_KEY',
indexName: 'YOUR_INDEX_NAME', // it does not change
});

如何处理旧版配置和凭证?

您可忽略它们,待所有用户迁移至新基础设施后我们将自动清理!

请使用专用控制台修改索引配置。

为何控制台显示两个 Algolia 应用?

为方便您熟悉新基础设施,我们保留了旧版 DocSearch 应用 (BH4D9OD16A) 的访问权限。BH4D9OD16A 将在所有 DocSearch 用户完成迁移前持续可用。

搜索无结果

若搜索无结果且浏览器开发者工具无报错,可能是索引存在问题。

请确认:

  1. 您的爬虫配置需与网站结构匹配

我们为多种网站生成器提供了配置模板,您也可以将其作为基础配置。调试选择器时,推荐使用URL测试工具

  1. 索引设置保持最新(若未更新,您会在搜索预览页看到提示横幅)

爬虫仅在创建索引时应用index settings,以确保Algolia控制台作为唯一数据源。若您大幅修改了配置或更换了网站生成器,建议先在Algolia控制台删除旧索引再重新爬取。

可以删除爬虫吗?

技术上可行,但删除后将导致功能异常。我们已自动创建与您DocSearch应用关联的默认爬虫,若删除后试图新建爬虫将无法按预期工作。

误删DocSearch爬虫怎么办?

最快的方式是通过Discord联系我们,或发送邮件至下方地址,我们将尽快处理。

爬虫能用于密码保护网站吗?

DocSearch应用集成的爬虫不支持需登录的密码保护网站。如需此功能,请使用标准Algolia方案 https://www.algolia.com/pricing 并添加爬虫组件。请注意:按使用量付费的爬虫虽可免费添加,但免费套餐存在功能限制。

迁移相关链接