跳至主内容
版本:旧版 (v1.x - v2.x)

DocSearch索引是如何构建的?

非官方测试版翻译

本页面由 PageTurner AI 翻译(测试版)。未经项目官方认可。 发现错误? 报告问题 →

本节将带您了解我们如何从您的页面构建DocSearch索引。

一切从您的页面开始

1st step

通过selectors选择器提取有效负载

2nd step

我们将根据您配置的选择器聚焦高亮信息。

遍历HTML文档流并构建有效负载

3rd step

该有效负载将成为从您页面提取的唯一数据。

遍历有效负载并开始推送记录

4th step

当向临时记录添加元素时即建立索引(若min_indexed_level值为0

基于当前临时记录堆叠元素

5th step

根据文档流中的位置关系,我们尽可能嵌套元素以保留上下文并提升相关性。

循环迭代直至匹配到text文本元素

6th step

发现更新文本元素时执行覆盖操作

7th step

添加更高层级元素时移除暂存的深层元素

8th step

上下文信息与层级关系在遇到新层级时必须更新。此操作确保新出现的子章节能与前文内容明确区隔。

如需更多帮助,请通过Discord联系我们或告知技术支持团队。