1. NRC Word-Emotion Association Lexicon aka NRC Emotion Lexicon aka EmoLex: association of words with eight emotions (anger, fear, anticipation, trust, surprise, sadness, joy, and disgust) and two sentiments (negative and positive) manually annotated on Amazon's Mechanical Turk. Available in 40 different languages.
Version: 0.92
Number of terms: 14,182 unigrams (words), ~25,000 word senses
Association scores: binary (associated or not)
Creators: Saif M. Mohammad and Peter D. Turney
https://saifmohammad.com/WebPages/AccessResource.htmКак видите этот словарь создан вручную, т.е. эмоции оценивались субъективно. Естественно об получении объективных подтекстов речи никакой не идёт; где подтексты это словарное-энциклопедические определения и ссылки на синонимичные кластеры из других текстов.
Что такое «ссыслки на синонимичные кластеры»? Это эмоции которые вызывают другие, неявно-подтекстуально имеющиеся в виду тексты.
To develop their poetry generation system, Bena and Prof. Kalita first gathered a large corpus of text from the Project Gutenberg and UC-Santa Cruz Dreambank databases. They browsed through the Gutenberg database looking for words included in EmoLex, an emotion-lexicon dataset developed by the National Research Council of Canada.
https://techxplore.com/news/2020-02-language-creative-poetry.htmlЗначит изначально накладывается субъективное восприятие составителей EmoLex на выбор слов и фраз, при генерации того что называется «Машинной Поэзией».
The researchers then split the resulting dataset into different 'emotion categories," looking at the number of EmoLex words contained in each extract, and used this data to the train a deep neural network. The model they trained is an adaptation of GPT-2, an architecture that learns to generate new fragments of text by modeling the style of language used in the data its trained on.
Я считаю ошибкой искать слова! Нужно искать синонимичные кластеры, поскольку они описывают какими подтекстами наделены слова и фразы. Значит эксперимент изначально порочен!
"We also fed our artificial neural network a combination of dream data and poetry to create what is known as 'dream poetry,'" Bena explained. "In the end, we had five separate emotion models for the emotions of joy, sadness, trust, anger and anticipation, but we also had a dream poetry model. This system, as stated previously, focuses less on the structure found in a lot of poetry generation work and more on a free-verse style of poetry that looks to imitate and reproduce the finesse and creativity of real poets."
А почему пять? а если это смесь эмоций, как отделить одну от другой? Между тем наличие ссылок на синонимичные кластеры позволяет идентифицировать эмоции почти с абсолютной точностью, каковая определяется при сравнении подтекстов содержащихся в индивидуальных профилях.
The researchers asked human users to evaluate the poems created by their system, while also employing the Coh-Metrix tool to assess the quality of the verses it generated. They found that it produced poems that effectively elicited sadness and joy 87.5% and 85% of the time, respectively. In addition, when trained on both dream data and poetry, their system generated unique 'dreamlike' poetry verses that captured elements of what is known as 'dream poetry' with a score of 3.2 on the Likert scale.
Река-канал видите даже при таких грубейших ошибках был достигнут совершенно поразительный результат, что объясняется использованием контекстов как замены синонимичных кластеров при создании словаря и:
“Our findings suggest that text can, in fact, be generated so that it elicits emotion in readers and that it can resemble the types of creativity that artists look to inject in their work," Bena said.