Maybaygiare.org

Blog Network

Descrevendo palavras

descrevendo palavras

a ideia para o motor de palavras descrevendo veio quando eu estava construindo o motor para palavras relacionadas (é como um thesaurus, mas lhe dá um conjunto muito mais amplo de palavras relacionadas, em vez de apenas sinônimos). Enquanto brincava com vetores de palavras e a API” HasProperty ” da conceptnet, eu me diverti um pouco tentando obter os adjetivos que comumente descrevem uma palavra. Finalmente percebi que há uma maneira muito melhor de fazer isso: livros de análise!

Projeto Gutenberg foi o corpus inicial, mas o analisador ficou mais ganancioso e mais ganancioso e eu acabei alimentando – o em algum lugar em torno de 100 gigabytes de arquivos de texto-na maioria ficção, incluindo muitas obras contemporâneas. O analisador simplesmente olha através de cada livro e tira as várias descrições de substantivos.

esperançosamente é mais do que apenas uma novidade e algumas pessoas realmente vão achar útil para a sua escrita e brainstorming, mas uma pequena coisa agradável a tentar é comparar dois substantivos que são semelhantes, mas diferentes de alguma forma significativa – por exemplo, o sexo é interessante: “mulher” contra “homem ” e” rapaz “contra ” rapariga”. Em uma análise rápida inital, parece que os autores de ficção são pelo menos 4x mais propensos a descrever mulheres (em oposição aos homens) com termos relacionados à beleza (em relação ao seu peso, características e atratividade geral). Na verdade,” bela ” é possivelmente o adjetivo mais amplamente utilizado para as mulheres em toda a literatura do mundo, o que está em consonância com a representação geral unidimensional das mulheres em muitas outras formas de mídia. Se alguém quer fazer mais pesquisa sobre isso, deixe-me saber e eu posso dar-lhe muito mais dados (por exemplo, há cerca de 25000 entradas diferentes para “mulher” – muitos para mostrar aqui).

A azuleza dos resultados representa a sua frequência relativa. Você pode pairar sobre um item por um segundo e a pontuação de frequência deve aparecer. A ordenação de “singularidade” é padrão, e graças ao meu algoritmo complicado™, Ele ordena-os pela singularidade dos adjetivos para esse substantivo em particular em relação a outros substantivos (na verdade, é bastante simples). Como seria de esperar, você pode clicar no botão “Ordenar por frequência de Uso” para adjetivos por sua frequência de uso para esse substantivo.

Deixe uma resposta

O seu endereço de email não será publicado.