s02

文档解析

知识层

多格式文本提取与智能分块

PDF/MD/TXT 多格式支持,句子边界感知分块
分块策略直接影响知识图谱质量——按句子边界切割并保留重叠上下文,确保实体关系不被截断