シグネチャ・ファイル

出典: くみこみックス

版間での差分
(新しいページ: ' 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列...')
最新版 (2009年1月26日 (月) 05:25) (ソースを表示)
(新しいページ: ' 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列...')
 

最新版

 文書中のすべての単語(形態素あるいは文字Nグラム)をハッシュ関数で数値化し,OR演算で結合して得られる固定長のビット列(特徴ベクトル)を並べたもの.単語が出現する可能性のある文書を絞り込むために用いる.

【出典】Interface編集部 編;組み込み技術用語集,Interface 2007年8月号 別冊付録,CQ出版社,2007年8月.

表示