データ・マイニング

出典: くみこみックス

 データウェア・ハウス(大規模データベース)において基本となるデータ処理技術は,データ・マイニングと呼ばれている.データ・マイニングの考え方はもともと統計学に見られていたが,近年では人工知能(特に学習),クラスタリング,可視化,データベースなどの分野と関連して論じられている.もっと具体的にデータ・マイニングを考えると,データの有用な要約の発見法ということになるだろう.また,データベースにおけるデータ・マイニングに対応する技術は,特にデータベースにおける知識発見(KDD:Knowledge Discovery in Database)と呼ばれることもある.データ・マイニング・システムとデータベース・システムの本質的な違いは,前者ではデータベース中に隠れている知識を取り出し,加工して利用できることにある.よって,データ・マイニングにより発見された知識を基に意思決定などを行う.データ・マイニングはデータベースと密接に関連する.実際,データベースにおいて,SQLなどの問い合わせ言語を用いると,データベースについての問い合わせを行える.しかしSQLでは,当たり前の知識を取り出すことはできるが,データベースの中に隠れているさまざまな知識を取り出すことはできない.知識発見のためには,さまざまな分野の新しい技術が必要となる.

【出典】Interface編集部 編;組み込み技術用語集,Interface 2007年8月号 別冊付録,CQ出版社,2007年8月.

表示