Maybaygiare.org

Blog Network

A Simple Introduction to Collaborative Filtering

These days whether you look a video on YouTube, a movie on Netflix or a product on Amazon, you ’ re going to get recommendations for more things to view, like or buy. Tästä kehityksestä voi kiittää koneoppimisen algoritmeja ja suosittelujärjestelmiä.

Suosittelijajärjestelmät ovat laajuudeltaan kauaskantoisia, joten siirrymme tärkeään lähestymistapaan nimeltä collaborative filtering, joka suodattaa tietoa käyttämällä järjestelmän muilta käyttäjiltä keräämiä vuorovaikutuksia ja tietoja. Se perustuu ajatukseen, että ihmiset, jotka ovat samaa mieltä arvioidessaan tiettyjä asioita, ovat todennäköisesti samaa mieltä uudelleen tulevaisuudessa.

nopea pohjustus Suosittelujärjestelmille

suosittelujärjestelmä on tiedon suodatuksen alaluokka, joka pyrkii ennustamaan ”arvosanan” tai ”mieltymyksen”, jonka käyttäjä antaa kohteelle, kuten tuotteelle, elokuvalle, laululle jne.

Suosittelujärjestelmät tarjoavat yksilöityä tietoa oppimalla käyttäjän kiinnostuksen kohteet tämän käyttäjän kanssa tapahtuvan vuorovaikutuksen jäljiltä. Aivan kuten koneoppimisalgoritmit, suosittelijajärjestelmä tekee ennustuksen, joka perustuu käyttäjän aiempaan käyttäytymiseen. Erityisesti, se on suunniteltu ennustamaan käyttäjän mieltymys joukko kohteita perustuu kokemukseen.

matemaattisesti suositustehtäväksi asetetaan:

  • käyttäjien joukko (U)
  • joukko kohteita (i), joita U
  • opettelee käyttäjän aikaisempaan vuorovaikutustietoon perustuvan funktion, joka ennustaa kohteen I likinäköisyyden U

Suosittelujärjestelmät luokitellaan karkeasti kahteen tyyppiin päätelmien tekemiseen käytettävän tiedon perusteella:

  1. sisältöpohjainen suodatus, jossa käytetään kohteen attribuutteja.
  2. Kollaboratiivinen suodatus, joka käyttää kohteen attribuuttien lisäksi käyttäjän käyttäytymistä (vuorovaikutuksia).

joitakin keskeisiä esimerkkejä suosittelujärjestelmistä työssä ovat:

  • tuotesuositukset Amazonilla ja muilla ostossivustoilla
  • elokuva-ja tv-ohjelmasuositukset Netflixissä
  • Artikkelisuositukset uutissivustoilla

mikä on Yhteissuodatus?

yhteistoiminnallinen suodatus suodattaa tietoa käyttämällä järjestelmän muilta käyttäjiltä keräämiä vuorovaikutuksia ja tietoja. Se perustuu ajatukseen, että ihmiset, jotka ovat samaa mieltä arvioidessaan tiettyjä asioita, ovat todennäköisesti samaa mieltä uudelleen tulevaisuudessa.

konsepti on yksinkertainen: Kun haluamme löytää uuden elokuvan katsottavaksi, pyydämme usein ystäviltämme suosituksia. Luotamme luonnollisesti enemmän sellaisten ystävien suosituksiin, joilla on samanlainen maku kuin meillä itsellämme.

useimmissa yhteistoiminnallisissa suodatusjärjestelmissä sovelletaan niin sanottua samankaltaisuusindeksipohjaista tekniikkaa. Naapurustopohjaisessa lähestymistavassa joukko käyttäjiä valitaan sen perusteella, että he ovat samankaltaisia aktiivisen käyttäjän kanssa. Päättely aktiivisesta käyttäjästä tehdään laskemalla valittujen käyttäjien luokitusten painotettu keskiarvo.

Yhteistyösuodatusjärjestelmät keskittyvät käyttäjien ja kohteiden väliseen suhteeseen. Kohteiden samankaltaisuus määräytyy molempien kohteiden luokitusten samankaltaisuuden perusteella.

on olemassa kaksi Yhteissuodatusluokkaa:

  • Käyttäjäpohjainen, joka mittaa kohdekäyttäjien ja muiden käyttäjien samankaltaisuutta.
  • Kappalepohjainen, joka mittaa samankaltaisuutta kohdekäyttäjien arvostamien tai niiden kanssa vuorovaikutuksessa olevien kohteiden ja muiden kohteiden välillä.

yhteistoiminnallinen suodatus Pythonin

yhteistoiminnallisia menetelmiä käytetään tyypillisesti hyödyllisyysmatriisin avulla. Suosittelijamallin tehtävänä on opetella toiminto, joka ennustaa sopivuuden tai samankaltaisuuden hyödyllisyyttä jokaiselle käyttäjälle. Hyödyllisyysmatriisi on tyypillisesti hyvin harva, valtava ja siitä on poistettu arvot.

seuraavissa matriiseissa jokainen rivi edustaa käyttäjää, kun taas sarakkeet vastaavat Pixarin eri filmejä. Kosinin samankaltaisuus on yksinkertaisin algoritmi, joka tarvitaan vektorien samankaltaisuuden löytämiseen. Viimeinen, joka on ensimmäistä matriisia seuraava hyötymatriisi, sisältää vain osittaista tietoa, jota tarvitaan ennustamaan käyttäjän mahdollisesti antaman ”juuren” odotetun luokituksen likaisuus.

seuraavissa matriiseissa jokainen rivi edustaa käyttäjää, kun taas sarakkeet vastaavat eri elokuvia, paitsi viimeinen, joka tallentaa kyseisen käyttäjän ja kohdekäyttäjän samankaltaisuuden. Jokainen solu edustaa luokitusta, jonka käyttäjä antaa kyseiselle elokuvalle.

kosine_similaarisuus(p, q) = p.q

|p/./ q|

collaborative filtering table

cosine_similarity(joe, beck) =

collaborative filtering with python

kun uusi käyttäjä liittyy alustaan, käytämme yksinkertaisinta algoritmia, joka laskee kosinin tai korrelaation samankaltaisuuden riveistä (käyttäjät) tai sarakkeista (elokuvat) ja suosittelee kohteita, jotka ovat lähimmät naapurit.

CF taulukko 2

nämä ovat monia yhtälöitä, jotka voivat käsitellä kysymystä samankaltaisuustoimenpiteistä, muutamia ovat:

  • Pearsonin samankaltaisuus
  • Spearman rankingkorrelaatio
  • keskimääräiset potenssierot
  • läheisyys–vaikutus–suosio samankaltaisuus

RelatedRead More About Data Science

Vastaa

Sähköpostiosoitettasi ei julkaista.