v Těchto dnech, zda se podíváte na video na YouTube, film na Netflix nebo produktu na Amazon, dostanete doporučení pro další věci na prohlížení, jako je, nebo koupit. Za tento vývoj můžete poděkovat nástupu algoritmů strojového učení a doporučujících systémů.
Doporučující systémy jsou dalekosáhlé v rozsahu, takže budeme soustředit se na důležitý přístup nazývá kolaborativní filtrování, které filtruje informace pomocí interakce a údaje shromážděné systém od jiných uživatelů. Je založen na myšlence, že lidé, kteří souhlasili při hodnocení určitých položek, se pravděpodobně v budoucnu znovu dohodnou.
Rychlý Nátěr Na tom, Doporučující Systémy
doporučující systém je podtřídou filtrování informací, který se snaží předpovědět, „rating“ nebo „preference“, uživatel bude dát položky, jako jsou produkt, film, píseň, atd.
doporučující systémy poskytují personalizované informace tím, že se učí zájmům uživatele prostřednictvím Stop interakce s tímto uživatelem. Stejně jako algoritmy strojového učení, doporučující systém dělá predikci na základě minulého chování uživatele. Konkrétně je navržen tak, aby předpovídal preference uživatele pro sadu položek na základě zkušeností.
matematicky je úkol doporučení nastaven na:
- Sada uživatelé (U)
- Sada položek (I), které mají být doporučeno, aby U
- Naučit se funkce založené na uživatele minulosti interakce data, která předpovídá pravděpodobnosti, z položky I U
Doporučující systémy jsou obecně rozděleny do dvou typů na základě údajů dělat závěry:
- filtrování založené na Obsahu, který používá atributy položky.
- kolaborativní filtrování, které kromě atributů položky používá chování uživatelů (interakce).
některé klíčové příklady doporučujících systémů v práci zahrnují:
- doporučení Produktu na Amazon a další nákupní weby
- Film a TV show doporučení na Netflix
- doporučení Článku na zpravodajských webech
Co je Kolaborativní Filtrování?
kolaborativní filtrování filtruje informace pomocí interakcí a dat shromážděných systémem od ostatních uživatelů. Je založen na myšlence, že lidé, kteří souhlasili při hodnocení určitých položek, se pravděpodobně v budoucnu znovu dohodnou.
koncept je jednoduchý: když chceme najít nový film se dívat, budeme se často požádat naše přátele o doporučení. Přirozeně máme větší důvěru v doporučení přátel, kteří sdílejí chutě podobné našim.
většina spolupracujících filtračních systémů používá takzvanou techniku založenou na indexu podobnosti. V přístupu založeném na sousedství je řada uživatelů vybrána na základě jejich podobnosti s aktivním uživatelem. Závěr pro aktivního uživatele se provádí výpočtem váženého průměru hodnocení vybraných uživatelů.
kolaborativní filtrační systémy se zaměřují na vztah mezi uživateli a položkami. Podobnost položek je určena podobností hodnocení těchto položek uživateli, kteří hodnotili obě položky.
existují dvě třídy kolaborativního filtrování:
- User-based, které měří podobnost mezi cílovými uživateli a ostatními uživateli.
- Item-based, který měří podobnost mezi položkami, které cílí uživatelé hodnotit nebo komunikovat s ostatními položkami.
Kolaborativní filtrování Pomocí Python
Kolaborativní metody jsou obvykle dopadlo pomocí nástroje matrix. Úkolem doporučujícího modelu je naučit se funkci, která předpovídá užitečnost přizpůsobení nebo podobnosti každému uživateli. Matice nástrojů je obvykle velmi řídká, obrovská a odstranila hodnoty.
v následujících maticích představuje každý řádek uživatele, zatímco sloupce odpovídají různým filmům podle Pixaru. Kosinová podobnost je nejjednodušší algoritmus potřebný k nalezení podobnosti vektorů. Poslední, což je nástroj matrix po první matice obsahuje pouze dílčí údaje, které je zapotřebí předvídat pravděpodobnosti, očekávané hodnocení pomocí „root“, která by mohla být dána uživatelem.
v následujících maticích každý řádek představuje uživatele, zatímco sloupce odpovídají různým filmům, s výjimkou posledního, který zaznamenává podobnost mezi tímto uživatelem a cílovým uživatelem. Každá buňka představuje hodnocení, které uživatel dává tomuto filmu.
cosine_similarity (p, q) = p. q
|p|.|q|
cosine_similarity(joe, beck) =
Když se nový uživatel připojí k platformě, můžeme použít nejjednodušší algoritmus, který vypočítá kosinus nebo korelace podobnosti řádků (uživatelé) nebo sloupce (filmy) a doporučuje položky, které jsou k-nejbližších sousedů.
Jedná se o mnoho rovnic, které se mohou zabývat otázkou podobnosti, některé zahrnují:
- Pearson podobnosti
- tato aplikace je úžasné podobnosti
- Spearman rank correlation
- Průměr kvadratických odchylek
- Blízkost–dopad–popularita podobnosti
RelatedRead Více O vědecká Data.