差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン | 次のリビジョン両方とも次のリビジョン | ||
dokuwiki:localize [2007/07/29 12:11] – osamu | dokuwiki:localize [2007/07/29 12:14] – osamu | ||
---|---|---|---|
行 72: | 行 72: | ||
^D</ | ^D</ | ||
のように、入力した文字が分かち書きされて表示されればOK。 | のように、入力した文字が分かち書きされて表示されればOK。 | ||
+ | |||
行 154: | 行 155: | ||
を追加。 | を追加。 | ||
- | DokuWikiの最近のバージョンでは、日本語を含むアジア圏の文字を1文字1単語とみなして検索する修正が入っているが、これを使うと例えば「文字を探す」で検索すると「文」「字」「を」「探」「す」のすべての文字が検索結果でハイライトされたりして具合がよくない。上記の修正を加えたときは、idx_tokenizer($string,& | + | DokuWikiの最近のバージョンでは、日本語を含むアジア圏の文字を1文字1単語とみなして検索する修正が入っているが、これを使うと例えば「文字を探す」で検索すると「文」「字」「を」「探」「す」のすべての文字が検索結果でハイライトされたりして具合がよくない。上記の修正を加えたときは、idx_tokenizer($string,& |
<code php> | <code php> | ||
$asia = @preg_replace('/ | $asia = @preg_replace('/ | ||
if(!is_null($asia)) $word = $asia; //recover from regexp failure | if(!is_null($asia)) $word = $asia; //recover from regexp failure | ||
</ | </ | ||
- | という2行をそれぞれコメントアウトしたほうがよい。 | + | という2行をコメントアウトする。 |
+ | また、indexer.phpにwordlen()という関数があるが、これも同じくアジア圏の文字は1文字1単語とみなす処理が入っているので | ||
+ | <code php> | ||
+ | if(preg_match('/' | ||
+ | $l += ord($w) - 0xE1; // Lead bytes from 0xE2-0xEF | ||
+ | </ | ||
+ | の2行もコメントアウトする。 | ||
//2005-12-8 - Mecabのプロセスがハングアップして残ってしまうのを避けるために'' | //2005-12-8 - Mecabのプロセスがハングアップして残ってしまうのを避けるために'' |