集合知プログラミング

【協調フィルタリング】
多くのユーザの嗜好情報を蓄積し、あるユーザと嗜好の類似した他のユーザの情報を用いて自動的に推論を行う方法論

類似の評価
・ユークリッド距離
多次元空間中での2点間の距離,近いほど類似度が高い.
正規化されていないデータに大して脆弱

・ピアソン係数
正規化されていないデータではこちらのほうが有効


(例)映画の評者といくつかの映画に対する評価データ
◇アイテムの推薦方法
 似ているユーザーの探索 : 共に評価している映画に対して類似度計算
 アイテムの推薦 : ユーザーが見ていない映画に対する評点に類似度で重み付けして合計を計算し,類似度の総和で除算

◇アイテムベースのフィルタリング
 - 製品同士の類似度 - 
既に見た映画と見てない映画の類似度を計算.
既に見た映画の評点を導出した類似度で重み付けして総和をとり,類似度の総和で除算

コメント

このブログの人気の投稿

Callback関数を知らん人がまず理解すべきことのまとめ。

C言語でBluetoothスタックを叩きたい人のBluetooth開発入門その1

C++プログラミング入門(1) // 倉庫番プログラムの実装