日本語の扱い
日本語使用の問題点
- Wiki 項目名に日本語を使う(記法に沿ってリンクを作成する)と、日本語のリンクができる。
- リンクを踏むと、自動的に URL エンコードされて移動。
- まだページがないので「作成」を実行すると、作成されるファイルのファイル名は、たとえば、「日本語の扱い」であれば、%E6%97%A5%E6%9C%AC%E8%AA%9E%E3%81%AE%E6%89%B1%E3%81%84.txt のようになる。
- PukiWiki ではこれの % 抜きで日本語ファイルを扱うが、DokuWiki にはそのような機能がない。
- オンラインでの使用に問題はないが、WinSCP でダウンロードする際に、個々の「%」が「%25」に変換されるため、バックアップを取ったり書き戻したりするのに問題が生じる。
- 全く別の問題として、連絡に使用されるメール送信のコードが UTF-8 になり、日本語のメール標準の ISO-2022-JP ではないことがある。これについては、メールにおける UTF-8 の使用がだんだん拡がっており、UTF-8 で受信できるメーラーも多いので、そのままでもなんとかなる。
解決方法・機能補強など
- 項目(文書)名の表示については、ファイル名は英数半角にしておいて、「管理」‐「サイト設定」で「最初の見出しをページ名とする」(useheading) をオンに。
- この方法をとれば、個々のテキストファイルの名前に自分でつけた英数半角のファイル名を使うので、日本語のコードを変換したものよりはファイルの判別がしやすい。
- また、リンクにポインタを置いたときにブラウザのステータスバーに表示されるリンク先も、明快な英数半角のものになる。
- ローカルであらかじめデータファイルを作成するときも、この方式ならファイル名が決定しやすい。
- この機能を使うことにより、ファイル数やページあたりリンク数が多くなったときに速度が遅くなったりするのかどうかについては、未検証。
- ついでに、この方式を使うと、実体ファイル名に項目名が縛られなくなるので、リンク切れの心配なく項目名の手直しができる。(そのファイルへのリンクがあるページの内容を更新・保存したときに項目名が自動的にアップデートされる。)
- 検索には MeCab を使ってインデックス作成するとよいという情報あり。
- デフォルトでもマルチバイトの文字単位でパースして検索対象にする機能があるので、最低限使える。検索時にダブルクォーテーションで囲めば、ちゃんと文字列で検索される。
- メールをどうしても ISO-2022-JP で送信したい場合、PHP スクリプトにコード変換機能を追加する必要がある。higuchi.com / DokuWikiの日本語対応 が参考になる。