Проблема решается за счет применения для распознавания картинок аннотирующих их текстов, с чем Согласен OpenAI:
We find that, just as a large transformer model trained on language can generate coherent text, the same exact model trained on pixel sequences can generate coherent image completions and samples. By establishing a correlation between sample quality and image classification accuracy, we show that our best generative model also contains features competitive with top convolutional nets in the unsupervised setting.
Тем не менее OpenAI понимает:
Unsupervised and self-supervised learning,1 or learning without human-labeled data, is a longstanding challenge of machine learning.
https://openai.com/blog/image-gpt/Так вот, машинное обучение, которое ищет rrr3, сводится к поиску текстов и их использованию с задействованием обратной связи. А та порнография, о которой говорится в статье, есть перепевы 75-ти летней технологии.
Если же текстов для машинного обучения нет, то OpenAI пытается их создать, угадывая новые слова на основе близких к данному текстов. Что является, по моему убеждению, интересной идеей, но неправильно исполненной.