シグネチャ・ファイル

出典: くみこみックス

2009年1月26日 (月) 05:25; Worker (会話 | 投稿記録) による版
(差分) ←前の版 | 最新版を表示 (差分) | 次の版→ (差分)

 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列(特徴ベクトル)を並べたもの.単語が出現する可能性のある文書を絞り込むために用いる.

【出典】Interface編集部 編;組み込み技術用語集,Interface 2007年8月号 別冊付録,CQ出版社,2007年8月.

表示