Q: Kabayaki とは何ですか?
全文検索するためのソフトウェアです。
現在、非常に広く使われている全文検索エンジン Namazu をベースに、GUI による管理機能等を追加して、より使いやすくしたのが Kabayaki です。
GUI による管理機能等、検索エンジン以外の機能も持っているので、全文検索システムと呼ぶことができます。
:: 最初に戻る
Q: Namazu とは何ですか?
現在非常に広く使われている、オープンソースの日本語全文検索システムです。
Kabayaki のベースにもなっていて、Web サイト内の検索やローカルファイルの検索等に利用できます。なお、Kabayaki の持つ以下の特長は、Namazu 由来のものです。
- あらかじめ検索用インデックスを作成
→検索時間が文書の量と直接に比例しない高速な検索が可能
→検索が実行される度にサーバーにかかる負荷が少ない - 文章を単語単位に分割してキーワードを抽出する方式
→検索結果に表示される文書が、ユーザーの望む文書である確率を上げる - 既定値では検索結果をスコア順に表示
Namazu についての詳細は、Namazu の公式サイトを参照してください。
:: 最初に戻る
Q: Kabayaki と Namazu の違いは?
Namazu をおいしく調理したのが Kabayaki です。
検索エンジン部分やインデクサ等のコアの部分は同じですが、Web ブラウザからの統合的な管理・設定を可能にしたり、複数の検索結果画面を付属させたり、 Namazu を使いやすいように料理してあるのが Kabayaki です。
また、製品版 Kabayaki には、機能・性能を大幅に向上させた高性能文書フィルタが付属しているため、対応文書フォーマットも増えています。さらに、製品版 Kabayaki の機能である、Web スパイダ、ユーザー辞書も Namazu にはない機能です。
:: 最初に戻る
Q: Kabayaki の検索結果の「スコア」とは何ですか?
検索文字列が文書中に登場するたびにスコアの数値が加算されます。
Kabayaki での検索結果は、デフォルトではスコア順でソートされて表示されるようになっています。基本的には、指定された検索文字列の登場回数が多い文書ほど、表示されるスコアの数値が高くなります。
ただし、登場回数が同じでも、たとえば検索文字列がタイトルに使用されている文書は、そうでない文書よりもスコアが高くなります。また、複数の検索文字列が指定された場合、ヒット数の少ない文字列を含む文書の方がスコアが高くなる傾向があります。
:: 最初に戻る
Q: 検索結果画面の変更方法は?
Kabayaki の検索結果画面の表示を変更するためには、テンプレートと呼ばれる雛型ファイルを変更します。
会社のロゴを表示させたい、ページのレイアウトを変更したい等の場合は、すべてテンプレートの変更で対応可能で、プログラム (.cgi 等) を変更する必要はありません。
なお、タイムインターメディア社では、検索結果画面のカスタマイズも請け負っています。以下に該当する場合は、ご相談ください。(価格表)
- HTML コードを直に編集してテンプレートを変更するための人員または予算が不足
- 検索結果に表示する項目を増やしたい
:: 最初に戻る
Q: 検索結果画面は、どこまで変更可能ですか?
検索結果画面に使用するスタイルシートの設定、使用する画像、検索結果画面全体のレイアウト変更等、テンプレートファイルの HTML コーディング修正により可能な変更であれば、全て自由に変更していただけます。
これに対し、検索結果への独自項目追加、日付の表示形式の変更等、プログラム(.cgi 等) を変更する必要がある修正は、タイムインターメディア社にカスタマイズを依頼していただく必要があります。
:: 最初に戻る
Q: 別のサーバーにある文書も検索対象にできますか?
はい。Kabayaki サーバー以外のマシンに格納されている文書も検索対象にすることができます。
Web サイト上のページ:
製品版 Kabayaki に標準搭載されている Web スパイダの機能を使用してページを取得できます。コンテンツ設定で基点 URL (http://domainname.com/dirname/) を指定するだけで OK のため、Web サーバーが Kabayaki サーバーと同じマシンであるか別のマシンであるかは、特に意識する必要はありません。Web ページを、あらかじめ wget 等を使用して全取得しておく必要もありません。Web スパイダは、ページ中のリンクをたどって、自動的にページを収集します。
ファイルサーバー上のファイル:
Linux の場合は、Samba サーバーや NFS サーバーとして動作しているマシンのファイルシステムを、Kabayaki サーバー上でマウントすれば、ローカルに存在するファイルシステムと同様に Kabayaki 管理画面でファイルパスを指定できます。
Windows では UNC パスでの指定 (\servername\dirname\) が可能ですが、Kabayaki の標準機能では、認証の掛かっているとファイルを収集できないため注意してください。
データベース:
Kabayaki Enterprise Search に標準搭載されている DB Spider では、Kabayaki サーバー以外のサーバーがデータベースサーバーという構成でも、DB の情報を取得対象とすることが可能です。
:: 最初に戻る
Q: Namazu で発見されたセキュリティ脆弱性には対策を加えていますか?
Namazu 2.0.13 以前が影響を受ける Namazu におけるクロスサイトスクリプティングの脆弱性の問題、および、Namazu 2.0.15 以前が影響を受けるディレクトリトラバーサルの問題は、どちらも Kabayaki では問題が発生しないことを、動作レベルおよびコードレベルで確認済みです。
Namazu を単独で使用する場合も、Red Hat 上で RPM パッケージをインストールして運用していて、namazu.cgi、pnamazu がインストールされていない状態ならば直接影響を受けません。
:: 最初に戻る
Q: 今あるホームページに組み込めますか?
はい。実際に外部公開のホームページに組み込んでいただいている事例が多数存在しています。
弊社タイムインターメディアのサイトも、サイト内検索には Kabayaki を使用しています。
:: 最初に戻る
Q: 社内 Web システムのページを検索できますか?
はい。イントラネットでのご利用も多数実績があります。
:: 最初に戻る
Q: インデクシング中の検索は可能ですか?
はい。インデクシング中、再構築中も検索は実行できます。
:: 最初に戻る
Q: 実装言語は何ですか?
Perl と C を使用しています。
:: 最初に戻る
Q: WebAPI は提供されていますか?
標準での提供はありませんが、カスタマイズの実績はありますため、ぜひお気軽にご相談ください。
:: 最初に戻る
Q: 使用しているユーザーに権限のない文書を、検索結果に表示されないようにしたい
Kabayaki Enterprise Search では、Active Directory の権限情報に応じて、ユーザーに権限のない文書を検索結果に非表示とすることが可能です。詳細は、Kabayaki Enterprise Search の製品ページを参照してください。
:: 最初に戻る
Q: DB Spider とは何ですか?
DB Spider は、ファイルや Web ページの代わりにデータベースの内容を全文検索の対象とすることを可能にします。あらかじめ検索用のインデックスを作成しておく方式のため、検索実行時にデータベースの処理に負荷をかけることはありません。Kabayaki Enterprise Search のオプション機能として提供しています。
:: 最初に戻るQ: サポートではどのようなことをしてもらえますか?
専属スタッフによる、電話・メールによる操作、使用方法についてのテクニカルサポートを行わせていただきます。また、年 2 ~ 3 回行われる Kabayaki ソフトウェアのバージョンアップ版無償提供も含まれます。
:: 最初に戻る