Maybaygiare.org

Blog Network

A Simple Introduction to Collaborative Filtering

最近では、YouTubeのビデオ、Netflixの映画、Amazonの製品を見るかどうかにかかわらず、より多くのものを表示したり、購入したりする この開発のための機械学習アルゴリズムと推奨システムの出現に感謝することができます。

推薦システムは範囲が広いため、他のユーザーからシステムによって収集された相互作用やデータを使用して情報をフィルタリングするcollaborative filteringと呼ばれる重要なアプローチについてはゼロにします。 これは、特定の項目の評価に同意した人々が将来再び同意する可能性が高いという考えに基づいています。

推薦システムに関するクイックプライマー

推薦システムは、ユーザーが製品、映画、曲などのアイテムを与える”評価”または”好み”を予測しようとする情報フィルタリングのサブクラスです。

推薦システムは、そのユーザーとの相互作用の痕跡を通じてユーザーの興味を学習することにより、パーソナライズされた情報を提供します。 機械学習アルゴリズムと同様に、レコメンダーシステムは、ユーザーの過去の行動に基づいて予測を行います。 具体的には、経験に基づいて一連のアイテムのユーザー設定を予測するように設計されています。

数学的には、推奨タスクは次のように設定されています:

  • ユーザーのセット(U)
  • Uに推奨されるアイテムのセット(I)
  • アイテムIのuへの可能性を予測するユーザーの過去の対話データに基づいて機能を学ぶ

レコメンダシステムは、推論に使用されるデータに基づいて大きく二つのタイプに分類されます。

  1. アイテム属性を使用するコンテンツベースのフィルタリング。
  2. アイテム属性に加えて、ユーザーの行動(相互作用)を使用する共同フィルタリング、。

職場での推薦システムの重要な例には、次のものがあります:

  • Amazonや他のショッピングサイト上の製品の推奨事項
  • Netflix上の映画やテレビ番組の推奨事項
  • ニュースサイト上の記事の推奨事項

Collaborative filteringは、他のユーザーからシステムによって収集された相互作用とデータを使用して情報をフィルタリングします。 これは、特定の項目の評価に同意した人々が将来再び同意する可能性が高いという考えに基づいています。新しい映画を見たいときは、友人におすすめを尋ねることがよくあります。

コンセプトは簡単です。 当然のことながら、私たちは私たち自身に似た味を共有する友人からの勧告に大きな信頼を持っています。

ほとんどの共同フィルタリングシステムは、いわゆる類似性インデックスベースの技術を適用します。 近傍ベースのアプローチでは、多数のユーザが、アクティブユーザとの類似性に基づいて選択される。 アクティブユーザーの推論は、選択されたユーザーの評価の加重平均を計算することによって行われます。

共同フィルタリングシステムは、ユーザーとアイテムの関係に焦点を当てています。 アイテムの類似性は、両方のアイテムを評価したユーザーによるそれらのアイテムの評価の類似性によって決定されます。

コラボレーションフィルタリングには二つのクラスがあります。

  • ユーザーベースで、ターゲットユーザーと他のユーザーの類似性を測定します。
  • アイテムベース、ユーザーレートをターゲットにしたり、他のアイテムと対話するアイテムとの類似性を測定します。

Pythonを使用した共同フィルタリング

共同メソッドは、通常、ユーティリティ行列を使用して実行されます。 レコメンダーモデルのタスクは、各ユーザーに対する適合または類似性の有用性を予測する関数を学習することです。 効用行列は通常、非常にまばらで巨大であり、値を削除しています。

次の行列では、各行はユーザーを表し、列はPixarの異なる映画に対応しています。 コサイン類似性は、ベクトルの類似性を見つけるために必要な最も単純なアルゴリズムです。 最初の行列に続く効用行列である最後のデータには、ユーザーが与える可能性のある”ルート”による期待される評価の可能性を予測するために必要な部分的なデータのみが含まれています。

次の行列では、各行はユーザーを表し、列は異なるムービーに対応しますが、そのユーザーとターゲットユーザーの間の類似性を記録する最後のものを除きます。 各セルは、ユーザーがその映画に与える評価を表します。

cosine_similarity(p,q)=p.q

|p|。/q/

協調フィルタリングテーブル

cosine_similarity(joe, beck) =

pythonとの協調フィルタリング

新しいユーザーがプラットフォームに参加すると、行(ユーザー)または列(ムービー)のコサインまたは相関類似性を計算し、k-最近傍である項目を推奨する最も単純なアルゴリズムを適用する。P>CF表2

これらは、類似度尺度の問題を扱うことができる多くの方程式であり、いくつかは次のとおりです:p>

  • ピアソンの類似性
  • Jaccardの類似性
  • スピアマンランク相関
  • 平均二乗差
  • 近接インパクト人気の類似性

関連データサイエンスについての詳細を読む

関連データサイエンスについての詳細を読む

コメントを残す

メールアドレスが公開されることはありません。