Click here to view and discuss this page in DocCommentXchange. In the future, you will be sent there automatically.

SQL Anywhere 12.0.1 » SQL Anywhere 服务器 - SQL 的用法 » 查询和修改数据 » 全文搜索 » 文本配置对象概念和参考 » 创建或变更文本配置对象时指定的内容

 

MAXIMUM TERM LENGTH 子句 - 设置最大术语长度

根据术语断开器算法的不同,MAXIMUM TERM LENGTH 设置的使用方法也不同。

MAXIMUM TERM LENGTH 的值必须小于或等于 60。如果将其设置为小于 MINIMUM TERM LENGTH,则 MINIMUM TERM LENGTH 会自动调整为与 MAXIMUM TERM LENGTH 相等。

如果未定义,则会从缺省文本配置对象的设置中获取 MAXIMUM TERM LENGTH 的缺省值,通常为 20。

下表说明了 MAXIMUM TERM LENGTH 的值对文本索引和查询字符串处理方式的影响。

文本索引 查询字符串
  • GENERIC 文本索引   对于 GENERIC 文本索引,MAXIMUM TERM LENGTH 指定插入到文本索引中的术语的最大长度(以字符为单位)。

  • NGRAM 文本索引   对于 NGRAM 文本索引,MAXIMUM TERM LENGTH 用于确定术语分解后形成的 n 元语法词的长度。如何选择适当的 n 元语法词长度取决于相应的语言。对于英文,典型值为 4 个或 5 个字符;对于中文,典型值为 2 个或 3 个字符。

  • GENERIC 文本索引   对于 GENERIC 文本索引,将忽略长度大于 MAXIMUM TERM LENGTH 的查询术语,因为它们不会在文本索引中存在。

  • NGRAM 文本索引   对于 NGRAM 文本索引,查询术语将分解成长度为 n 的 n 元语法词,其中 n 与 MAXIMUM TERM LENGTH 的值相同。然后数据库服务器使用 n 元语法词搜索文本索引。长度小于 MAXIMUM TERM LENGTH 的术语将被忽略,因为它们与文本索引中的 n 元语法词不匹配。因此,除非参数是长度为 n 的前缀,否则邻近搜索不会工作。

 另请参见