Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SAP Sybase SQL Anywhere 16.0 (中文) » SQL Anywhere 服务器 - SQL 用法 » 查询和数据修改 » 全文搜索 » 文本配置对象概念和参考 » 创建或变更文本配置对象时指定的内容

 

PREFILTER 子句 - 指定外部前置过滤器算法

前置过滤是从 Word、PDF、HTML 或 XML 之类的文件中提取文本数据的过程。在文本索引环境中,前置过滤允许只提取想要索引的数据,而避免索引不必要的内容,例如 HTML 标记。对于某些文档类型(例如 Microsoft Word 文档),需要使用前置过滤发挥全文索引的有用功能。

SQL Anywhere 不提供内置的前置过滤器功能。但是,您可以创建外部前置过滤器库,根据需要执行前置过滤,然后修改文本配置对象来指向它。

下表说明了 PREFILTER EXTERNAL NAME 的值对文本索引和查询字符串处理方式的影响。

文本索引 查询字符串
  • GENERIC 和 NGRAM 文本索引   外部前置过滤器获取一个输入值(文档)并根据前置过滤器库指定的规则进行过滤。结果文本将在建立或更新文本索引之前传递给术语断开器。

  • GENERIC 和 NGRAM 文本索引   查询字符串不通过前置过滤器,因此 PREFILTER EXTERNAL NAME 子句的设置不会影响查询字符串。

SQL Anywhere 安装的 ExternalLibrariesFullText 目录中包含前置过滤器和术语断开器示例代码供您研究。该目录可在 Samples 目录下找到。关于 samples 目录的位置,请参见示例目录

 另请参见