Тут штука вот в чём.
перебором букв и увеличением количества букв в слове можно построить словарь всех мыслимых слов. (я когда то писал такую програмку, большой словарь получился
Но словарь реально существующих слов значительно меньше.
Между словами, стоящими в алфавитном порядке в этом словаре может уместиться куча слов из первого словаря.
Так что тут всё значительно проще можно сделать, экономичнее. И называется эта вещь "спелчекер".
Берётся длина слова - количество букв в слове. Сортируется таблица словаря - отбираются слова с такой же длиной.
Отбираются слова, содержащие все буквы данного слова и не содержащие других, лишних букв. И Вы не поверите, как мало вариантов останется.
Чем длинее слово - тем труднее придумать ещё одно из тех же самых букв. Чем короче - тем проще.
И вот там, где проще (спелчекеры исправляют только незначительные орфографические ошибки) и применяется человеческий интеллект - способность понимать, какое из вариантов слова, составленное из данных букв должно стоять ПО СМЫСЛУ в данном предложении.
И это налагает отпечаток интеллектуальности на данную задачу.
1. Надо восстановить исходное предложение
2. Предложение ДОЛЖНО иметь смысл.
3. Исходное предложение должно быть единственным
4. Другие варианты должны быть отсеяны по каким-то критериям
Что же может сделать человек? Может составить все доступные предложения в данном случае, подставляя на место неизвестных слов, слова, подобранные из даных букв.
Ах, да, последний пункт.
5. Слова расположенные рядом в предложении не должны противоречить здравому смыслу.
Таким образом, восстановить новую инормацию, которая нигде ранее не встречалась, будет невозможно.
Соответственно, при распознании можно опираться только на человеческий опыт о взаимном расположении слов в предложении, принадлежности слов к классам и взаимном расположении классов в предложении. (Отношениях классов)
Эту информацию можно получить и в электронном виде, что требует чтения текстов, определения класса слова, определения членов класса, и небольшого кода по определению, является ли написанное правдой, то есть реально в нашем мире и при каких условиях.
Или же эти данные могут забить в компьютер милиарды китайцев