シグネチャ・ファイル
出典: くみこみックス
版間での差分
(新しいページ: ' 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列...') |
(新しいページ: ' 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列...') |
最新版
文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列(特徴ベクトル)を並べたもの.単語が出現する可能性のある文書を絞り込むために用いる.
【出典】Interface編集部 編;組み込み技術用語集,Interface 2007年8月号 別冊付録,CQ出版社,2007年8月.