Maybaygiare.org

Blog Network

Szavak leírása

szavak leírása

a leíró szavak motorjának ötlete akkor jött, amikor a motort a kapcsolódó szavakhoz építettem (ez olyan, mint egy szinonimaszótár, de sokkal szélesebb körű kapcsolódó szavakat ad, nem csak szinonimákat). Miközben szóvektorokkal és a conceptnet “HasProperty” API-jával játszottam, kicsit szórakoztam, amikor megpróbáltam megszerezni azokat a mellékneveket, amelyek általában leírnak egy szót. Végül rájöttem, hogy van egy sokkal jobb módja ennek: parse könyvek!

a Gutenberg projekt volt a kezdeti korpusz, de az elemző kapzsibbá és kapzsibbá vált, és végül körülbelül 100 gigabájtnyi szövegfájlt tápláltam be – többnyire fikciót, sok kortárs művet is beleértve. Az elemző egyszerűen átnézi az egyes könyveket, és előhúzza a főnevek különböző leírásait.

Remélhetőleg ez több, mint egy újdonság, és néhány ember valóban hasznosnak találja az íráshoz és az ötletbörzéhez, de egy ügyes kis dolog, hogy megpróbálja összehasonlítani két főnevet, amelyek hasonlóak, de valamilyen jelentős módon különböznek egymástól – például a nem érdekes: “nő” versus “férfi” és “fiú”versus ” lány”. Az inital gyors elemzésével úgy tűnik, hogy a fikció szerzői legalább 4x nagyobb valószínűséggel írják le a nőket (szemben a férfiakkal) a szépséggel kapcsolatos kifejezésekkel (súlyuk, jellemzőik és általános vonzerejük tekintetében). Valójában a” gyönyörű ” valószínűleg a nők legszélesebb körben használt mellékneve a világ összes irodalmában, ami teljesen összhangban van a nők általános egydimenziós ábrázolásával sok más médiaformában. Ha valaki további kutatást szeretne végezni ezzel kapcsolatban, tudassa velem, és sokkal több adatot tudok adni neked (például körülbelül 25000 különböző bejegyzés van a “nő” számára – túl sok ahhoz, hogy itt megjelenjen).

Az eredmények kékessége a relatív gyakoriságukat jelenti. Az egérmutatót egy másodpercre egy elem fölé húzhatja, és a frekvencia pontszámnak fel kell jelennie. Az” egyediség ” rendezés alapértelmezett, és a bonyolult algoritmusomnak köszönhetően a melléknevek egyedisége alapján rendezi őket az adott főnévhez képest más főnevekhez képest (valójában nagyon egyszerű). Ahogy az várható volt, kattintson a “rendezés használati gyakoriság szerint” gombra a melléknevekhez az adott főnév használati gyakorisága szerint.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.