2012年2月3日金曜日

集合知プログラミング

【協調フィルタリング】
多くのユーザの嗜好情報を蓄積し、あるユーザと嗜好の類似した他のユーザの情報を用いて自動的に推論を行う方法論

類似の評価
・ユークリッド距離
多次元空間中での2点間の距離,近いほど類似度が高い.
正規化されていないデータに大して脆弱

・ピアソン係数
正規化されていないデータではこちらのほうが有効


(例)映画の評者といくつかの映画に対する評価データ
◇アイテムの推薦方法
 似ているユーザーの探索 : 共に評価している映画に対して類似度計算
 アイテムの推薦 : ユーザーが見ていない映画に対する評点に類似度で重み付けして合計を計算し,類似度の総和で除算

◇アイテムベースのフィルタリング
 - 製品同士の類似度 - 
既に見た映画と見てない映画の類似度を計算.
既に見た映画の評点を導出した類似度で重み付けして総和をとり,類似度の総和で除算

0 件のコメント:

コメントを投稿