7.невыявленная иерархичность невыявленное количества элементов
8.возможность разделения на области - перед автомобиля, зад автомобиля
9.возможность поиска по имени - поиск детали руль
10.возможность построения иерархии связей между объектами - построение устройства мотора машины
машина состоит из иерархических объектов и пассажиров
лифт состоит из сложной системы объектов и пассажиров
лечение лекарством состоит из сложной системы биологических процессов и пациента
иерархия с уровнями
корпус=2 объект иерархия=117 2u0 2d1 2d3 level=1 contact=2
/ \
/ \
мотор=1 руль=3
иерархия=117 иерархия=117
1u2 1d4 3u2 3d0
level=2 level=2
contact=2 contact=1
\
\
поршень=4
иерархия=117
4u1 4d0
level=3
contact=1
иерархия=117
1u2 1d4
2u0 2d1 2d3
3u2 3d3
4u1 4d0
мотор
иерархия=117
тип иерархии117=11
Типы объектов:
1) Тип объекта первого рода: 1=неизвестность 2=шум 3=xарактеристика 4=объект 5=группа 6=система
2) Тип объекта второго рода: 1=неизвестность 2=шум 3=объект 4=связь Объектов 5=тип категории связи Объектов 6=приоритет 7=группа 8=система
3) Тип объекта третьего рода(группа): 1=неизвестность 2=шум 3=список из объектов
4=группа системы из объектов 4=группа источника из объектов
5=базовая группа из объектов 6=общая группа из объектов
4) Тип объекта четвертого рода(тип группы или тип иерархии):
0-скомпрометированная иерархия
1-иерархия глаголов(куча значений глаголов для объекта - настоящее, прошедшее, возможности)
2=неструктурируемый массив разнотипных объектов
3=неструктурируемый массив разнотипных групп объектов
4=неструктурируемый массив разнотипных систем
5=неструктурируемый массив однотипных объектов
6=неструктурируемый массив однотипных групп объектов
7=неструктурируемый массив однотипных систем
8=иерархия объектов безуровневая без оценок
9=иерархия групп объектов безуровневая без оценок
10=иерархия систем безуровневая без оценок
11=иерархия объектов уровневая без оценок
12=иерархия групп объектов уровневая без оценок
13=иерархия систем уровневая без оценок
14=иерархия объектов безуровневая с оценкой
15=иерархия групп объектов безуровневая с оценкой
16=иерархия систем безуровневая с оценкой
17=иерархия объектов уровневая с оценкой
18=иерархия групп объектов уровневая с оценкой
19=иерархия систем уровневая с оценкой
оценка-отдельный объект с номером и именем
данные иерархии117=1u2 1d4
уровень в иерархии117=2
контактов в иерархии117=2
иерархия без уровней
вадим=2 иерархия=119 2l1 2l4 2l3 contact=3
/ | \
коля=1 | сергей=3 иерархия=119 3l2 3l4 contact=2
иерархия=119 | /
1l2 ольга=4
contact=1 иерархия=119 4l2 4l3
contact=2
иерархия=119
1l2
2l1 2l4 2l3
3l2 3l4
4l2 4l3
иерархия без уровней с весами связей
Москва=2 иерархия=121 2l1с3 2l4с5 2l3с2 contact=3
/ 3 |5 \2
Самара=1 | Орел=3 иерархия=121 3l2с2 3l4с4 contact=2
иерархия=121 | /4
1l2с3 Тула=4
contact=1 иерархия=121 4l2с5 4l3с4
contact=2
иерархия=121
для с1(длина в км): c2(время пути) с3(стоимость проезда) с4(преобразование в железнодорожную иерархию)
1l2(с1)3
2l1(с1)3 2l4(с1)5 2l3(с1)2
3l2(с1)2 3l4(с1)4
4l2(с1)5 4l3(с1)4
интерфейс иерархий
типы объектов -
1.хосты
2.области (цепочка из хостов)
3.связи
4.приоритеты
5.объединяющий тип объекта для хоста и приоритета - запись
типы операций -
чтение ветви в массив
- составление списка нисходящих хостов от узла
- нахождение восходящего хоста от узла
запись ветви из массива
дополнение к концу определенной ветви (конец ветви - самая правая запись для правой части записи) (для односвязанного списка-ветвь по умолчанию это весь список)
дополнение к определенному хосту
- дополнение к конечному хосту ветви
составление списка всех хостов с заданным приоритетом
обход дерева иерархии по правой стороне по областям
обход дерева иерархии по левой стороне по областям
дискридитация определенного хоста в иерархии
дискридитация определенной ветви в иерархии
удаление определенного хоста из иерархии
удаление определенного хоста в области с удалением всех нисходящих узловых хостов
удаление определенного хоста в области со смыканием области и порождением двух различных систем
//====
переменные -
текущий хост
адрес первой области поиска
адрес последней области поиска
адрес первой области перебора
адрес последней области перебора
адрес текущей области
массив текущей области
массив управляющих адресов областей с меткой
массив выходных адресов областей с меткой о соответствии
массив выходных адресов областей с меткой об обработанности
выходная иерархия
выходной хост
массив выходных приоритетов
переменная хранения типа иерархии
В самой иерархии 0-х(3) - это хост х с возможностью дозаписи нисходящих хостов, (3) - количество свободных подключений к нему, (0)-это бесконечная возможность дозаписи
После дозаписи расположение элементов в иерархии меняется - 0-2(2) и подключающийся к нему хост 3 превращаются в 2-3(0) 0-2(1)
промужуточный адрес для управления областями для работы с иерархией
0-0 - дескредитация всей иерархии
0- дескредитация области
-0 дескредитация хоста
ffffffff-ffffffff перебор всей иерархии
ffffffff-1 перебор всех нисходящих связанных с этим хостом хостов
1-ffffffff - перебор всех нисходящих областей этого хоста
1
/
-2--
/ / \
3 4 5
1-2 2-3 2-4 2-5
иерархию надо делать сразу универсальной, чтобы много не возится с интерфейсами
1 длина иерархии
2 записи
- уровень или группа(прилагательное или характеристика)
- первичный объект
- или ноль и тогда нет сортировки
или цена каждой связи к вторичному объекту по выбору максимума если >0
или цена каждой связи к вторичному объекту по выбору минимума если <0
- число связей
- вторичные объекты
== объект ==
какие операции с объектами?
- поиск значения имени объекта по справочнику
берется имя, берется объект со списком имен, по нему находится адреса объектов с данными именами
- поиск имени объекта по характеристике
берется характеристика, берется объект со списком адресов всех объектов, по нему находится список адресов объектов и по списку адресов объектов проверяются все характеристики объектов на соответствие указанной характеристике
- поиск имени объекта по смыслу
берется иерархия смысла, упрощается, берется объект со списком смыслов, по нему находится список адресов объектов с данными смыслами, усложняется смысл, из списка остаются соответствующие этому смыслу объекты, смысл снова циклически усложняется
- разложение объекта на первичные составляющие - анализ
берется объект, характеристика с его составляющей информацией раскладывается методом комбинаторики на иерархию или иерархии(каждая иерархия с дополнительной краткой смысловой иерархией), характеристики, номера подходящих объектов и системы
- разложение объекта на вторичные составляющие - анализ
берется объект, характеристика с его составляющей информацией раскладывается методом комбинаторики на иерархию или иерархии(каждая иерархия с дополнительной краткой смысловой иерархией), характеристики, номера подходящих объектов и системы, системы переходят на следующий уровень обработки, с стремлением системы свестись к объектам и переменным входным данным и шуму
- заполнение объекта объектами - синтез
берется объект, методом комбинаторики и оптимизации заполняется объектами
- заполнение объекта вторичными объектами - синтез или усовершенствование
берется объект, методом комбинаторики и оптимизации его объекты переходят на новый уровень сложности, заполнясь вторичными объектами
== система ==
Система отличается от объекта тем, что действует по сложным или по непредсказуемым для анализа закономерностям
Обучение Универсальной Экспертной Системы стремится выразить систему как объект анализа или синтеза
Обучение заключается в извлечении новой информации и её структуризации из потока информации, состоящего из шума, помех, атак, ошибок, старой информации и новой информации
Для этого информация обрабатывается в несколько этапов:
первый этап = информация разделяется на:
1 возможный шум, который отбрасывается
2 возможную информацию
второй этап = информация разделяется на:
1 старую информацию, которая отбрасывается
2 возможно новую информацию
третий этап = информация разделяется на:
1 структурируемую информацию
2 неструктурируемую информацию
затем цикл обработки может повторятся, пока не закончится неструктурируемая информация
============================================
обучение заключается в следующих процессах:
1.построение новых объектов в случае появления новых объектов
2.построение новых объектов в случае появления новых характеристик
3.построение новых групп глаголов в случае появления новых объектов о которых известно что они глаголы
4.составление новых групп глаголов из опыта применения отдельных объектов (покупка при обмене характеристиками обладания)
5.составление новых групп структур строения и действия глаголов из опыта применения отдельных объектов (из обмена денег на товары узнал о рынке и глаголе торговля)
6.составление новых групп объектов из опыта применения отдельных объектов(узнал о кольцах после покупки кольца)
7.составление новых групп систем из опыта применения отдельных объектов(из применения монеты узнал о кольцах)
8.составление новых закономерностей поведения систем из опыта применения отдельных объектов(надел кольцо, узнал об обхвате)
9.составление структуры строения и действия отдельных систем из закономерностей поведения системы(узнал структуру кольца из того что оно держится на пальце)
10.составление новых групп структур строения и действия систем из закономерностей поведения систем(узнал об круге из того что кольцо держится на пальце)
11.составление новых групп глаголов из составленных закономерностей поведения отдельной системы(узнал глагол одевать из соединения кольца и пальца)
12.составление новых групп объектов из составленных закономерностей поведения отдельной системы(зацепился камнем кольца за палец, узнал о ободе и камне)
13.составление новых групп глаголов из составленных закономерностей поведения систем(надел несколько колец, узнал что кольца можно одевать)
14.составление новых групп объектов из составленных закономерностей поведения систем(зацеплялся камнями колец за палец, узнал они цепляются)
15.заполнение весовыми коэффициентами объектов-операций для иерархий
16.заполнение узнанными весовыми коэффициентами иерархий
17. заполнение объектов новыми узнанными источниками объектов
18. заполнение источников объектов узнанной информацией об источниках объектов
19. заполнение источников объектов узнанной информацией об величине оплаты за информацию информаторам
цель - научиться складывать
1+2=3
объект1 = 1
объект2 = +
объект3 = 2
объект4 = =
объект5 = 1
я знаю четыре объекта - 1 2 и =
у меня даже есть их свойства и характеристики
= - это постановка одной или двух задач по анализу объектов и сведению их в один или два объекта
пробую разложение обоих чисел поставить на счетчик и получаю три
?проводить сначала анализ сокращающий количество объектов
анализ 1+2 , результат - удаление обоих объектов из анализа и получение объекта-результата
купец купил кольцо у бродяги за монету - удаление лишних объектов из анализа, в результате четыре объекта - купец владеющий купленным кольцом, бродяга владеющий монетой
11
x11
----
1
10
1
10
=====================================================
Система выявления ошибок для Универсальной Экспертной Системы
Ошибка это факт, расходящийся с действительностью
причинами ошибки могут быть
1) неправильные признаки факта
2) неполные признаки, из которых выведен неправильный факт
3) ошибочный алгоритм, дающий неправильный результат
4) дефект строения, дающий неправильный факт
5) совпадение фактов, в сумме производящие признаки факта, расходящегося с действительностью
6) проведение атаки, имитирующей признаки неправильного факта
7) проведение атаки, изменяющей внутреннюю информацию о фактах
для каждой причины возможно свое выявление и исправление причины, дающей ошибку
Есть две системы взаимодействующие друг с другом - Универсальная Экспертная Система и внешний мир
любой объект кроме внутренних объектов может быть ошибкой, однако точка взаимодействия Универсальной Экспертной Системы и внешнего мир должна стремится к безошибочности, она содержит только шум и погрешность измерения.. внутренние объекты будет определять пользователь на основе анализа.. все внутренние объекты как минимум трижды резервированы и постоянно проверяются на соответствие с помощью контрольных сумм.. поэтому чтобы хватало скорости вычислений внутренние объекты желательно обрабатывать с максимальным приоритетом
исправление ошибок - поиск похожих по смыслу иерархий, в которых слова различаются всего на несколько букв, поиск слов отличающихся всего на несколько букв
================
Пример анализа:
дворник идет по зеленой улице глядя на закат
объект N 101 = дворник
объект N 102 = улица
объект-связь N 201 = ходьба, копия объекта из группы "ходьба", процесс, характеристика связи объектов = частица "по"
вывод это связь объекта с другими объектами через ?(вхождение в группу)
вывод это заполнение объектов характеристиками
вывод - существует объект дворник
вывод - дворник главный объект предложения
вывод - существует объект улица
вывод - существует объект ходьба
поскольку ходьба присуща людям - вывод - дворник возможно человек
вывод - дворники возможно могут ходить - нечеткая логика
вывод - люди возможно могут ходить - нечеткая логика
вывод - улица это возможно поверхность - нечеткая логика
вывод - улица это возможно плоскость - нечеткая логика
вывод - улица может иметь ? цвет,? название
вывод - дворник может глядеть(смотреть)
вывод -
объект N 101
====================
название:
дворник
обычно:
1.человек
2.мужчина
3.неизвестно
объект N 102
====================
название:
улица
обычно:
1.асфальтированная
объект N 103
====================
название:
закат
обычно:
1.красный
объект N 201
====================
название:
ходьба
обычно:
1.процесс
объект N 202
====================
название:
взгляд
обычно:
1.процесс
дворник бежит по дороге
почему дворник тут на верху иерархии?
почему именно "дворник бежит по дороге" а не "дорога бежится под дворником"?
вроде бы равноценные объекты - дорога и дворник
просто свойство языка - описывать графы составляющие системы в последовательном формате записи.. хотя возможно и паралельное описание - когда речь говорит одно, а например язык жестов - другое.. но в общем свойство языка - это последовательное описание графов составляющих системы
для последовательного описания графа нужен опорный узел - именно он и ставится на вершине иерархии
и дело уже не в том что дворник выше по социальному статусу чем дорога, а в том, что в описании системы взаимодействия дворника и дороги - он - опорный узел описания графа
Пример анализа:
аналогичные предложения:
дворник смотрит на луну
луна смотрится дворником
дворником смотрится луна
дворник в процессе смотрения луны
дворник занимается смотрением луны
дворник занимается просмотром луны
дворник занят смотрением луны
дворник занят просмотром луны
объект дворник какой? смотрящий - входит в группу смотрящих_потеницально_по_источнику_в_тексте1 и смотрящих_в_текущее_событие_текста1
объект луна какая? смотрящаяся
объект-глагол "смотрение" 100 изменяет два объекта - объект 101 характеризующийся как дворник и объект 102 характеризующийся как луна
объект 101 связан с объектом 102 посредством глагола смотрение и составляет иерархию первого уровня, где связаны их характеристики первого уровня, причем дворник наверху иерархии, а луна внизу иерархии
Пример анализа:
иерархия
200 201 202 203 204 205 206 207 208 209 210 211 212 213 214
Дворник идет по зеленой улице , глядя на луну . Луна круглая и очень красивая
дворник
| \
идет[ходьба] глядит[смотрение]
1.по 1.на - частности, направление иерархичности
| |
улица луна
1.зеленая 1.круглая - частности, характеристики
2.красивая
2.1очень
предположение что объекты 208 и 210 двух иерархий один и тот же,
поскольку
1) он сходен по написанию
2) он возможно сходен по имени - нужно определение имен объектов по внешним характеристикам предложения первого уровня из группы объектов, характеризующихся схожими признаками,
группа объектов, характеризующаяся схожими признаками выбирается по предположительной характеристике системы, говорящей о характере системы, какого она стиля - технического, литературного, компьютерного, выбирается порядок приоритетов при выборе стиля из списка стилей
, анализ схожести
3) он входит в одно и то же предложение второго уровня
4) он входит в один и то же источник информации
дворник - агенс
идет - значит улица или поверхность или/и географический объект
всё что подчинено ходьбе автоматически входит в группы поверхность или/и географический объект
смотрит - значит луна визуальный объект
всё что подчинено просмотру автоматически входит в группу визуальный объект
Дополнение
Тренер вручил юному футболисту его первую медаль
В данном предложении слово футболист является косвенным дополнением, а слово медаль - прямым.
тренер
| \
вручил вручил
| \
медаль-вручил-футболист
1.его первая 1.юный
Валентность - число актантов, которые может присоединять глагол.
авалентные (безличные: «Светает»)
одновалентные (непереходные: «Пётр спит»)
двухвалентные (переходные: «Пётр читает книгу»)
трёхвалентные («Он даёт книгу брату»)
четырехвалентные?(мать любит дочь),(купец купил кольцо у бродяги за монету)
Например, у безличного глагола светает валентность нулевая, у непереходного глагола спать валентность 1 (на подлежащее), у глагола купить валентность 3 или 4 (кто, что, у кого; в ряде трактовок также - за сколько).
Так, например, у глагола покупать валентность на винительный падеж (покупать кого? что?), а у глагола помогать - на дательный (помогать кому? чему?).
Обстоятельство
Однажды в студеную зимнюю пору я из лесу вышел
я
|
вышел
1.из
1.1 однажды
1.2 в студеную зимнюю пору
|
лес
бумага - верхушка иерархии
порвать не совсем
смять катышками
распрямить наполовину
бумага
смятая
катышками
смятая катышками
Ломоносов в Российской грамматике (1755) насчитывал 10 временных форм глагола (§ 268):
1 настоящее: трясу
6 прошлых:
прошедшее неопределенное (ср. Past Simple): тряс
прошедшее однократное: тряхнул
давнопрошедшее (ср. Плюсквамперфект) первое: тряхивал
давнопрошедшее второе: бывало тряс
давнопрошедшее третие: бывало трясывал
прошедшее совершенное (ср. Перфект): вытряс
3 будущих.
будущее неопределенное (ср. Future Simple): буду трясти
будущее однократное: тряхну
будущее совершенное (ср. Future Perfect): вытряхну
К настоящему времени число временных форм глагола в русском языке заметно сократилось. Осталось только 5 временных форм глагола:
1 настоящее -ем
2 прошлых (совершенное - съел и несовершенное-ел)
и 2 будущих (совершенное - съем и несовершенное - буду есть)
разнокоренные слова с схожим смыслом
надо было ему идти -> надо чтобы он пошёл
однокоренные слова с разным слыслом
шл - шлют шли
http://company.yandex.ru/technology/mysrem - система морфологического анализа MyStem
http://www.aot.ru - морфологический словарь "Диалинг"
http:/
www.keva.ru/stemka/stemka.html - система морфологического анализа
http:/
www.ruscorpora.ru - корпус русского языка(различные тексты)
иерархия_глаголов_системы=0, в соответствии с которыми она функционирует
иерархия_глаголов_купца=2000, в соответствии с которыми он торговал
иерархия_глаголов_купца=2001, в соответствии с которыми он торгует
иерархия_глаголов_купца=2004, в соответствии с которыми он будет торговать
иерархия_глаголов_купца=2005, в соответствии с которыми он обычно торгует
иерархия_глаголов_купца=2002, в соответствии с которыми он планирует1 торговать
иерархия_глаголов_купца=2003, в соответствии с которыми он планирует2 торговать
иерархия_глаголов_купца=2006, в соответствии с которыми он может1 торговать
иерархия_глаголов_купца=2007, в соответствии с которыми он может2 торговать
иерархии работы в 00000000/iera/00000002
настройки иерархий в 00000000/iera/00000003
в ней:
1 число иерархий
2 номер первой иерархии
3 тип иерархии
4 номер второй иерархии
5 тип иерархии
в русском языке
существительное - 12 форм
прилагательные - 24 формы
наречия - 1 форма
предлоги - 1 форма
считать деепричастия и причастия формами глагола
таблица
мама ед.ч им.п
мамы ед.ч. р.п
маме ед.ч. д.п
маму ед.ч. в.п
мамой ед.ч. т.п
маме ед.ч. пр.п
мамы мн.ч им.п
мам мн.ч. р.п
мамам мн.ч. д.п
мам мн.ч. в.п
мамами мн.ч. т.п
мамах мн.ч. пр.п
в суффиксе может хранится семантическая информация
-онок -ёнок - детеныш
приставка
при- - означает присоединие или приближение
однако есть исключения
обтябёнок не детеныш октября
припевать
перебиваться
в морфологическом словаре должны быть
местоимения, предлоги, союзы и проч.
ошибки:
пропуск буквы
замена буквы
вставка буквы
смена порядка следования букв(транспозиция)
компанией "Диктиум" предложен алгоритм коррекции ошибок
1.клавиатурная близость клавиш - анеудот=анектод
2.ошибки в безударных гласных - аностасия=анастасия
3.фонетическая похожесть букв - брюнеtка=брюнетка
4.парные буквы - автограв=афтограф
5.вставка лишнего пробела - сло во=слово
6.отсутствие пробела или дефиса - футбольныйклуб=футбольный клуб
7.схожесть написания символов - 4естно=честно,xpucTuaHuH=христианин
8.символы в разных раскладках - <лизнец=близнец
9.ошибки после шипящих и ц - жолтый=жёлтый
10.замена ё на е, ъ на ь, й на и
11.замена звонких и шипящих букв - в=ф
12.перевод транслитерации на русское написание - kartinki=картинки
парадигмы - компьютеры vs литература
омонимия:
дракон (животное)
дракон (корабль)
при исправлении ошибов важен контекст слова
белый грип=белый гриб птичий грип=птичий грипп
Мишка очень любит мёд - разбор предложений - неясно кто Мишка - ласкательное имя или ласкательное животное
в английском апострофами обозначаются и притяжателный падеж и сокращения
причем притяжательный падеж а англ может быть не только от существительных, но и от глаголов, хотя формально притяжательности у глаголов нет
last gone's daughter=last gone is(was) dauther
==========================
семантический анализ речи
уровни совершенства семантического анализа речи:
1) анализ первого уровня - ограниченое число глаголов(как действий), ограниченное число существительных (как объектов манипуляции):
включить компьютер
открыть Word
закрыть это окно
распануть
удалить выделенный текст
скопировать выделенное
скопировать все файлы этого каталога на флешку
2) анализ второго уровня - пополнение базы данных и извлечение из неё информации по запросу
Валерий мой коллега, его телефон 123-4567
Катя моя сетра, её домашний телефон это 234-5678
Петр Петров мой деловой партнер, встреча с ним запланирована в 12 часов на улице Никитская 27
когда должна состоятся встреча с Петровым?
набрать Катю
3) анализ третьего уровня - использование в словах изменяемых окончаний
4) анализ четвертого уровня - использование в словах изменяемых суффиксов и префиксов
5) анализ пятого уровня - поиск ассоциативной информации в базе
Какой график работы у моего делового партнера Петра Петровича?
Где поближе можно пообедать?
====================
Технические нюансы:
Аналитическая Система состоит из следующих частей:
1.промежуточная полноценная база надежной информации
2.промежуточная полноценная база ненадежной информации
3.промежуточная неполноценная база ненадежной информации
4.блок анализа
5.блок синтеза
6.блок ввода запроса
7.блок анализа информации запроса
8.блок синтеза ответа на основе информации запроса и информационной базы
9. блок ввода информации для пополнения информационной базы
10.блок анализа вводимой информации
11.блок упаковки информационной базы - превращение объектов в характеристики объектов, составление словаря слов из объектов - скомпрометированных иерархий, скомпрометированных объектов, превращенных в ссылки в словаре, удаление шума
12.блок удаления мусора из информационной базы
11.блок совершенствования информац