GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.5 (5)<< < Пред.   Поиск:  
 Автор Тема: На: Система и метод создания и улучшения словаря для ИИ.
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 26 апр 20 16:52
Кто занимается ИИ? Программисты, которые не имеют ни малейшего представления о том что такое мышление. Они думают что программы это ИИ.
Нет. Без понимания смысла слов компьютер не в состоянии понять человека и думать, без понимания словарных определений.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 26 апр 20 17:47
Действительно, как вы собираетесь работать с языком не зная значений слов? Возможно ли это?
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 05 июн 20 9:44
Machine learning systems are cheaper to train now than ever before. That’s the assertion of ARK Invest, which today published a meta-analysis indicating the cost of training is improving at 50 times the pace of Moore’s law, the principle that computer hardware performance doubles every two years.
https://venturebeat.com/2020/06/04/ark-invest-ai-training-costs-dropped-100-fold-between-2017-and-2019/

Все используют словарь аннотируя.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 10 июн 20 10:44
Изменено: 10 июн 20 10:45
Вот сотрите (для референций я буду использовать английский словарь, поскольку русского не существует): слово «go» определено приблизительно 100 определениями, включая идиомы и пр. фразы:
https://www.dictionary.com/browse/go?s=t
Аннотируя слова текста по методу и способу моего патента US8447789B2:
https://patents.google.com/patent/US8447789B2/en?inventor=Ilya+Geller
вы отсекаете 98-99 для кааждого слова каждой фразы.
Фраза, обычно, состоит как минимум из двух слов, как описано в моем другом патенте US8504580B2:
https://patents.google.com/patent/US8504580B2/en?inventor=Ilya+Geller
То есть в результате вы получаете фразу из нескольких уникально определенных и индексированных слов, что позволяет вам мгновенно сопоставить ее с точно таким же способом обработанным запросом, и выдать мгновенно-же верный ответ.
Русские же заявили: «The Russian MiG-35 Fighter Jet’s Voice Assistant Will Advise Pilots in the Air»,
https://voicebot.ai/2020/06/10/the-russian-mig-35-fighter-jets-voice-assistant-will-advise-pilots-in-the-air/
Но как они могут проиндексировать слова не имея словаря? Нет ни одного, пригодного для этой цели, словаря Русского языка!
Русские нагло врут.
[Ответ][Цитата]
Влад
Сообщений: 1944
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 10 июн 20 12:55
Цитата:
Автор: Ilya Geller
Русские же заявили: «The Russian MiG-35 Fighter Jet’s Voice Assistant Will Advise Pilots in the Air»,
Но как они могут проиндексировать слова не имея словаря? Нет ни одного, пригодного для этой цели, словаря Русского языка!
Русские нагло врут.

«Инженеры Корпорации «МиГ» (входит в ПАО «ОАК») получили патент на интеллектуальную систему защиты высокоманевренных боевых самолетов от выхода за диапазон критических перегрузок. Новая разработка повысит безопасность пилотирования и позволит летчику вести интенсивный воздушный бой без отвлечения на приборную панель».

«Многофункциональный легкий истребитель МиГ-35 получит экспертную систему, которая будет давать советы летчику, как вести себя в сложных ситуациях. Об этом заявил летчик-испытатель российской самолетостроительной корпорации «МиГ» Дмитрий Селиванов».

«Он рассказал, что в новой машине есть речевой информатор Рита, дающий подсказки в нештатных ситуациях. По словам Селиванова, виртуальный помощник разговаривает с летчиком приятным и спокойным женским голосом, «даже если пожар в двигателе случается».
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 10 июн 20 13:32
Цитата:
Автор: Влад


«Инженеры Корпорации «МиГ» (входит в ПАО «ОАК») получили патент на интеллектуальную систему защиты высокоманевренных боевых самолетов от выхода за диапазон критических перегрузок. Новая разработка повысит безопасность пилотирования и позволит летчику вести интенсивный воздушный бой без отвлечения на приборную панель».

«Многофункциональный легкий истребитель МиГ-35 получит экспертную систему, которая будет давать советы летчику, как вести себя в сложных ситуациях. Об этом заявил летчик-испытатель российской самолетостроительной корпорации «МиГ» Дмитрий Селиванов».

«Он рассказал, что в новой машине есть речевой информатор Рита, дающий подсказки в нештатных ситуациях. По словам Селиванова, виртуальный помощник разговаривает с летчиком приятным и спокойным женским голосом, «даже если пожар в двигателе случается».


Bing can return a natural language result telling the user the Eiffel Tower is 1,063 feet, even though the word “Eiffel” never appeared in the search query and the word “tall” never appears in the result.
https://blogs.microsoft.com/ai/bing-vector-search/

Как видите Майкрософт использует синонимы, находя ответы на вопрос. Чтобы использовать синонимы слова должны быть уникально определены: например из 100 значений слова “go” должно быть выбрано только одно, которое находится в контексте текста. Только зная это значение возможно определит какие синонимы к нему относятся (см. https://www.thesaurus.com/browse/go?s=t), и возможно искать по смыслу их используя. Видите сколько групп синонимов имеет слово “go”? А надо выбрать одну.

Подобного Английскому словарю Русского не существует в природе.

Значит, максимум что русские могут использовать (для своего сундука) так это стандартную SQL технологию, в которой выбор одного значения слова “go” Производится вручную, где уникальность слова задается не аннотирующим текстом — а строкой и колонкой таблицы. И где существует заранее выбранный ряд ответов на заранее выбранный ряд вопросов (см. DB2, Oracle или SAP).

То есть речь не идет о голосовом помощнике в смысле ИИ, а о старье в духе SQL.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 10 июн 20 17:38
Alice, the voice assistant developed by Russian search engine giant Yandex, for instance, is now a visual artist, able to converse on the subject and paint on command, even of abstract concepts. Meanwhile, the voice assistant recently installed at Moscow’s airport to answer customer queries is booming, with almost a third of all incoming calls to the customer service center handled instead by the AI.

Это все тоже пиздеш! Если конечно Yandex не продемонстрирует нормальный словарь с синонимами и идиомами. Словарь типа вот этого — https://www.dictionary.com/ — дело чертовски нескорое и очень дорогое. А без словаря нет ИИ.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 12 июн 20 11:34
Изменено: 12 июн 20 11:34
Идея проста: в словаре есть 10—100 словрных определений на слово. Например на слово «работа».
Путем сравнения этих многих, 10—100 структурированных в наборы взвешенных фраз определений (т.е. текстов из словаря), c контекстом текста (со словом «работа») выясняется какое определение подпадает под контекст текста. Тогда из 10—100 остается только одно определение, а оставшиеся 9—99 определений игнорируются.
Фраза обычно состоит из 1—5 слов, где все эти слова получают свое единственное, подходящее под контекст текста со словом «работа» определение. То есть фразы становятся осмысленными, передающими истинный смысл текста.
Остальные фразы, со словами которые не подходят под контекст, я называю «лексическим шумом», и они мешают пониманию смысла текста со словом «работа». Их игнорирование есть непременное условие успеха поиска текстуальной информации.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 30 июн 20 3:16
Главная и основная проблема в поиске информации это лексический шум, то есть неверно понятые фразы. Проблема решаема за счет аннотирования слов запроса и ответа по их словарным определениям. Другого решения нет, я пробовал в NIST TREC QA.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 07 июл 20 15:59
Изменено: 07 июл 20 16:00
ZeRO-2 reduces the memory needed for training using three strategies: reducing model state memory requirements, offloading layer activations to the CPU, and reducing memory fragmentation. ZeRO-2 can reduce model state memory requirements up to 8x by partitioning gradients and parameters across parallel processes. Layer activation values are saved from the forward training pass to be used later in the backward pass, but ZeRO-2 temporarily moves them from the GPU's memory to the host CPU's memory. Finally, memory allocation can fail even when memory is available, if the available memory is not contiguous. ZeRO-2 reduces fragmentation by pre-allocating contiguous memory chunks for temporary uses such as activations and gradients.
https://www.infoq.com/news/2020/07/microsoft-ai-speedup/

Чушь собачья и дезинформация. То, что «эти» называют «тренировкой данных» есть на самом деле аннотация слов их словарными, энциклопедическими определениями и референциями из текстов. Именно эти аннотации создают уникальность фраз, наполняют их индивидуальным смыслом и позволяют мгновенно их найти.
Технология эта линейная, никоим образом поиск определений и референций укоротить нельзя, параллельные процессы невозможны. Если распараллеливать то возможна потеря информации, что есть риск.
Короче кажется в Майкрософте либо мудаки, либо они парят мозги. Это то же самое как если вы начнете читать книгу с предпоследней страницы.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 22 июл 20 16:09
Ослы хреновы? Тупицы?

https://cloud.ibm.com/docs/watson-knowledge-studio-data?topic=watson-knowledge-studio-data-glossary#gloss_D

dictionary

A collection of words that can be used to pre-annotate documents. A new annotation is created for each word in the document text that matches a term in the dictionary. A machine learning model can be configured with one or more independent dictionaries, which are typically domain-specific, such a dictionary for pharmaceuticals and a dictionary for wealth management

Говорил вам что такое ИИ? Объяснял, говнюки задрипаные?
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 30 июл 20 5:20
IBM поняло что такое словарь и как его использовать:

IBM: dictionary: Word sense disambiguation is the selection of the meaning of a word with multiple meanings that makes the most sense in the given context. For example, word sense disambiguation helps distinguish the meaning of the verb 'make' in ‘make the grade’ (achieve) vs. ‘make a bet’ (place).

https://www.ibm.com/cloud/learn/natural-language-processing

Запатентовал 10 лет назад.
[Ответ][Цитата]
Ilya Geller
Сообщений: 4879
На: Система и метод создания и улучшения словаря для ИИ.
Добавлено: 29 сен 20 11:38
Как видите Оракл прислушался:
Oracle Virtual Assistant uses specialized vertical and customer-specific dictionaries and thesauri, in addition to the standard language resources, to derive meaning representations.
https://docs.oracle.com/en/cloud/saas/service/18b/favau/natural-language-processing.html#natural_lang_search
[Ответ][Цитата]
 Стр.5 (5)1  2  3  4  [5]<< < Пред.