シグネチャ・ファイル

出典: くみこみックス

 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列(特徴ベクトル)を並べたもの.単語が出現する可能性のある文書を絞り込むために用いる.

【出典】Interface編集部 編;組み込み技術用語集,Interface 2007年8月号 別冊付録,CQ出版社,2007年8月.

表示