namazuまわり

ここ数日namazu.cgiがInternal Server Errorを返すのでなにがおこったのかとおもって、一日費やしていろいろやってみました。あげくの果てにわかったことが、いつの間にか環境が更新されていて、$HOME/cgi-bin/以下しかcgiが使えなくなったらしいということです。結局いろんなもんのパスを書き直さなければなりませんでした。管理者としてはこれほど重要な事柄はきちんとインフォメーションして欲しいと思います。ftpでもsiteコマンドが使えなくなっていました。たとえばFFFTPからパーミッションの変更ができなくなるということです。とにかくなんのアナウンスもなくこういうことを行われると自分のミスかと思って焦るので、mita.cc.keio.ac.jpの管理者には猛省を促したいと思います。

さて、その付随物といってはなんですが。以前に日記でnamazuとUnicodeについて言及しました。とっととUnicodeに対応しろ、というやつです。しかし、そもそも解析の際、namazuはnkfを通じて、検索対象の文字列を得ていたわけです。したがって、Unicodeの文書に対応できないという問題は、namazuの問題ではなく、nkfの問題だったわけです。このほどめでたくnkf 2.0.1においてnkfはUTF-8に対応しました。

学校のサーバのnkfは古いので、とりあえず自分の領域にnkfをインストールしてみました。これでUTF-8で書かれた日本語の文章に関しても、namazuから検索ができるようになりました。とりあえず問題は解決です。あとはUTF-8でエンコードされた多言語混在の文書をどう扱うかです。これはnamazuの問題なわけで今後に期待です。もっともアラビア語やペルシア語まではもとめませんが。

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください