データマイニングの定義

データマイニングとはかなり統計学と密接につながっていることを最近になって知りました。言われてみれば判別分析や重回帰分析なんか応用しやすそうです。ちょっと勉強してみようと思って、まず手始めにデータマイニングの定義を調べると「KDDのプロセス中の知識の発見の段階」だそうです。その文中のKDD(Knowledge Discovery in Database=データベースからの知識発見)は「有用で、かつ既知でない知識をデータから抽出する自明でない一連の手続き」と定義されているとか。もうちょっと調べると、ニューラル・ネットワークなんかの話も出てきました。

どうやら体系化された理論があるわけではなく、大量のデータから有用な情報を取り出すための方法を寄せ集めたもののことをデータマイニングと呼んでいるだけのような印象がありますが、どうなんでしょう。