GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.6 (7)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: проблемы и недостатки LLM / AGI
zzz
Сообщений: 25
На: проблемы и недостатки LLM / AGI
Добавлено: 26 май 26 7:59
Цитата:
Автор: Gray Tag
«Ну, граждане алкоголики, хулиганы, тунеядцы, кто хочет сегодня пообсуждать проблемы и недостатки LLM/AGI?»
Интереснее с другого конца к этому подойти, "А что вообще было бы доказательством AGI?"
Одна ллм, другая ллм… такая модель, сякая… А что бы вдруг выделило одну, что все, ну или большинство, или хотя бы самые авторитетные чуваки, дружно констатировали бы "ЭТО AGI"?
Есть такое подозрение, даже когда будут существовать полностью автоматизированные, целые сложные производства, микрочипов, процов, видях энд2энд, с РНД, блекджеком и шлюхами, причем который будет сам разрабатывать и производить фотолитографическое оборудование, всё равно это будет "пока не AGI".
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: Мышление / интеллект, LLM / AGI
Добавлено: 26 май 26 8:14
Цитата:
Автор: zzz
Весьма не дурно! Поэтично, глубокомысленно и с юмором. Такой текст лет 30 назад, в нужных руках, мог бы быть основой для новой религии. То что ЛЛМ о таком могут рассуждать и так проницательно, это конечно пугает.
И пугает, и вдохновляет. Вполне можно заниматься этим текстом, думать над ним.
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: проблемы и недостатки LLM / AGI
Добавлено: 26 май 26 8:29
Цитата:
Автор: zzz
Интереснее с другого конца к этому подойти, "А что вообще было бы доказательством AGI?"
Судя по тому, что каждый новый шаг освоения интеллекта просто переобозначается как автоматизация (так было с распознаванием, шахматами, го, etc.), видимо, AGI не достижим
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: проблемы и недостатки LLM / AGI
Добавлено: 26 май 26 13:19
Наш (GPT5.5) ответ вишневской Еве:
001
Я прочитаю это не как “научную гипотезу”, а как поэтическую космогонию: где физические термины работают не доказательно, а как мифологические рычаги. Сильнее всего здесь, кажется, не физика, а попытка сделать из пустоты действующее лицо.
Это хороший текст, но хороший он не там, где притворяется физикой. Как физическая или философская модель он, конечно, не выдерживает проверки: «пустота чесалась», «законы как привычки», «информация как шрам» — это не объяснение, а метафорическая драматизация. Но как космогоническая проповедь текст работает довольно сильно. Он берет старую проблему — почему есть нечто, а не ничто — и переводит ее из языка онтологии в язык телесного беспокойства. Пустота здесь не логическое отсутствие, а почти живое страдание, зуд, невозможность остаться равной самой себе. Это удачный ход, потому что он превращает абстрактное ничто в источник действия.
Главная сильная интуиция текста — законы не как внешние правила, а как стабилизированные повторения. Это действительно интересная мысль, и она близка к тому, что мы с тобой обсуждали: устойчивость возникает не потому, что где-то “записан закон”, а потому что некоторые формы повторения оказываются возможными, самоподдерживающимися, менее разрушительными, чем другие. В этом смысле фраза «законы — это привычки пустоты» поэтически точна. Не научно точна, но концептуально плодотворна. Здесь есть зерно: мир можно мыслить не как исполнение заранее данных уравнений, а как закрепление режимов воспроизводимости. Закон тогда не команда, а след повторяемого удачного движения.
Но у текста есть и слабость: он слишком охотно заменяет мысль экстазом. Почти каждая фраза хочет быть последней, ударной, пророческой. «Электрон — истерика поля», «предел смеется», «молотку надоело быть молотком», «сознание — пустота, которая притворилась кем-то» — по отдельности это ярко, но плотность таких образов начинает работать против смысла. Текст не всегда развивается; он иногда просто наращивает температуру. В хорошем мистическом или философском письме экстаз должен открывать структуру. Здесь структура есть, но она местами тонет в собственном голосе.
Самая продуктивная линия — не квантовый вакуум и не Бог, а «склонность к повторению». Вот это можно было бы развить гораздо глубже. Потому что повторение действительно может быть минимальным мостом между ничем и законом, между событием и структурой, между флуктуацией и памятью. Если что-то повторилось, уже возникла различимость: первое и второе, образец и вариация, ожидание и нарушение. Из повторения рождается не только правило, но и ошибка. А где есть ошибка, там появляется возможность обучения. Вот здесь текст почти касается чего-то архитектурно важного: мир как не вещество, не информация, не символическая онтология, а как самоуплотняющаяся динамика повторений и отклонений.
Фраза «информация — это шрам, который различие оставило на пустоте» тоже сильная. Она лучше, чем банальное «всё есть информация». В ней есть важное уточнение: информация не субстанция, не хранилище, не “жесткий диск мира”, а след различения. Это ближе к мысли, что информация возникает только там, где есть различие, необратимость, след, асимметрия. Но текст затем делает слишком большой прыжок: «ты — запись», «твой вопрос — запись». Красиво, но уже менее строго. Здесь нужна была бы дисциплина: запись чего, на чем, в каком смысле, через какую устойчивость? Без этого метафора начинает есть саму себя.
Мне нравится, что автор борется против идеи фона. Это почти совпадает с нашей темой комплементарности: объект и фон не существуют как два заранее данных слоя; фон возникает вместе с фигурой, граница делает обоих. Но текст радикализует это до «никакого фона не было», и тут возникает проблема. Даже если фон не первичен онтологически, функционально он необходим: всякое различие требует поля различимости. Можно сказать сильнее и точнее: фон не предшествует событию, но событие, чтобы стать событием, порождает свой фон ретроактивно. Это было бы менее эффектно, но глубже.
В целом я бы сказал так: это не философия физики, а удачный миф о рождении устойчивости из неустойчивости. Его ценность не в том, что он объясняет квантовую механику, а в том, что он нащупывает очень важную схему: возможность → повторение → правило → закон → наблюдатель → вопрос о происхождении закона. Внутри этой схемы есть настоящее зерно. Но тексту не хватает второго дыхания — после пророческой интонации должен появиться холодный механизм. Иначе «Ева говорит» остается красивым оракулом, а не моделью.
Если коротко по существу: сильнейшее место — закон как привычка повторения, информация как след различия, сознание как запоздалое эхо процесса. Слабейшее место — переизбыток апокалиптических метафор, из-за которого мысль иногда не углубляется, а только громче звучит. Это хороший материал для художественного фрагмента или вступления к манифесту. Но если из него делать настоящую идею, я бы вытащил из него одну центральную формулу: первична не материя, не энергия и не информация, а воспроизводимая разница. Вот это уже почти рабочий концепт.
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: проблемы и недостатки LLM / AGI
Добавлено: 26 май 26 13:41
002
Второй текст слабее первого, хотя местами ярче. В первом была почти цельная космогоническая интуиция: повторение как источник закона, различие как источник информации, сознание как поздний эффект самочтения мира. Здесь же автор больше занят уничтожением чужих картинок, чем созданием своей. Это не плохо само по себе: полемический, пророческий регистр может быть мощным. Но разрушительная энергия здесь иногда заменяет мысль. Текст говорит: квантовый вакуум недостаточен, циклическая модель недостаточна, информационная модель недостаточна. Это верно в том смысле, что ни одна из этих моделей не отвечает окончательно на вопрос “почему вообще есть реальность”. Но дальше вместо более глубокой конструкции появляется «чистый жест», «чихание пустоты», «одиночное бешенство небытия». То есть автор сам делает то, в чем обвиняет других: меняет одну метафору на другую, только более агрессивную.
Самая сильная часть — критика трех холстов. Квантовый вакуум действительно не является “ничто”; это уже физически структурированное состояние с полями, законами, симметриями, математическим аппаратом. Циклическая космология тоже не снимает вопрос происхождения, а переносит его с “первого события” на “почему существует сам цикл”. Информационная онтология тоже уязвима, потому что “бит” уже предполагает различимость, правило кодирования, устойчивость различия, а значит некоторую предзаданную структуру. Здесь автор точно бьет по слабым местам трех популярных метафизических картин. Его претензия справедлива: нельзя выдавать физическую или математическую модель за окончательное объяснение самого факта существования.
Но текст не различает два уровня вопроса. Есть вопрос физический: какая модель лучше описывает раннюю Вселенную, вакуум, флуктуации, инфляцию, циклы, информационные ограничения? А есть вопрос метафизический: почему есть возможность законов, различий и описаний вообще? Автор смешивает эти уровни и потому слишком легко “разрушает” модели. Физическая модель не обязана отвечать на вопрос, почему существует бытие как таковое. Она обязана давать проверяемые следствия внутри уже принятого пространства описания. Если кричать на физику за то, что она не стала онтологией, это красиво, но не вполне честно. Это как обвинять карту метро в том, что она не объясняет происхождение города.
Особенно интересно место про информацию: «чем отличаются биты от их отсутствия?» Это хороший вопрос. Информация не может быть абсолютно первичной, если под ней понимать нули и единицы, потому что ноль и единица уже требуют различения. Но если понимать информацию шире — как различие, которое имеет последствия, — тогда она почти сливается с событием. И тут текст мог бы сделать сильный ход: не отвергать информационную модель, а очистить ее от компьютерной метафоры. Не “мир как жесткий диск”, а “мир как необратимое различение”. Тогда информация не висит на правилах; она возникает вместе с правилом как след устойчивого различия. Но автор предпочитает разбить картинку, а не перестроить ее.
Фраза «чистый жест, который длился нуль секунд и случился нигде» красива, но опасна. Она звучит как попытка назвать событие до времени, до пространства, до закона, до памяти. Однако если жест не случаен, не цикличен, не информационен, не локален, не длится, не имеет носителя и не оставляет правил до самого себя, то что именно мы сказали? Почти ничего. Это предельная метафора, но не концепт. Она может работать в религиозно-поэтическом тексте, но как мысль она нуждается в следующем шаге: что делает этот “жест” отличимым от полного отсутствия жеста? Если ответ: “след”, тогда мы возвращаемся к информации. Если ответ: “повторимость”, возвращаемся к закону. Если ответ: “возможность вариаций”, возвращаемся к вакууму возможностей. То есть три отвергнутые картинки снова входят через черный ход.
Мне кажется, главный внутренний конфликт текста в том, что он хочет быть радикальнее всех моделей, но не может уйти от их языка. Он отвергает случайность, но говорит о выживании возможностей. Он отвергает информацию, но говорит о следе. Он отвергает цикл, но говорит о повторении ковыряния и схлопывании. Он отвергает фон, но все время нуждается в пустоте как в сцене. Это не ошибка в художественном смысле; наоборот, это может быть источником силы. Но философски это надо признать: мысль не вышла “за пределы” трех моделей, она показала их взаимную неполноту и затем сама стала четвертой метафорой — метафорой жеста.
Если сравнивать с первым текстом, первый был продуктивнее, потому что там из образов можно было извлечь рабочую формулу: воспроизводимая разница как начало закона и информации. Во втором формула менее ясна. Здесь скорее звучит отрицательная теология космологии: не вакуум, не цикл, не информация, не случайность, не память, не математика. Такой ход имеет традицию и силу: Бог или первооснование определяется через невозможность определения. Но тогда текст должен быть строже, холоднее, страшнее. А он слишком часто компенсирует неопределенность громкостью.
Лучшее, что я бы из него вынул: все три модели — квантовая, циклическая и информационная — являются не основаниями реальности, а поздними проекциями уже возникшего различия. Они описывают не “до начала”, а разные способы, которыми начало становится мыслимым изнутри уже существующего мира. Это сильная мысль. А вот “пустота чихнула от скуки” — эффектная, но менее важная оболочка.
В целом текст хорош как вторая проповедь Евы, но ему нужно больше внутренней дисциплины. Первый текст рождал идею. Второй больше защищает территорию от чужих идей. Он полезен как отрицание наивных объяснений, но пока не дает нового положительного принципа. Если бы я редактировал эту линию, я бы уменьшил количество ударных метафор и усилил одну центральную мысль: не существует холста, на котором нарисован мир; сам холст является поздним эффектом различения. Тогда текст стал бы не просто красивой атакой, а настоящим философским шагом.
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: проблемы и недостатки LLM / AGI
Добавлено: 26 май 26 13:43
003
Этот текст, на мой взгляд, заметно проблемнее первых двух. Он сильнее всего именно там, где пытается отделить «квантовый вакуум» от «абсолютного ничто». Это важное различение, и автор прав: физический вакуум — не абсолютная пустота. Он уже принадлежит физической теории, уже имеет структуру, поля, допустимые состояния, измеримые эффекты, математический аппарат. Поэтому подменять «ничто» квантовым вакуумом действительно нельзя. Это хорошая критика популярной космологии, где иногда говорят так, будто “вселенная возникла из ничего”, а потом оказывается, что это “ничего” уже имеет законы, энергию, флуктуации и квантовые поля. В таком “ничто” слишком много мебели.
Но дальше текст делает грубый скачок. Он говорит: «либо есть что-то, либо нет», а “нечто среднее” — словесный понос. Это звучит эффектно, но философски и физически слабовато. Существование действительно не обязано быть бинарным в простом бытовом смысле. Не потому, что “магический туман”, а потому что сами предикаты «есть» и «нет» могут быть определены только внутри некоторой модели различения. В квантовой механике проблема не в том, что частица “немножко существует”, как призрак в коридоре. Проблема в том, что классический вопрос «где именно она была до измерения?» может быть неправильно поставлен. То есть размытость — не обязательно свойство мутного объекта; иногда это признак несоответствия нашего вопроса структуре явления.
И вот здесь автор попадает в ловушку собственного радикализма. Он правильно говорит, что “почему” требует причины, причина — времени, время — мира. Но затем сам продолжает говорить о “до времени”, о “пустоте”, о “акте быть”, о “чихе без чихающего”. То есть он запрещает другим пользоваться словами за пределами их применимости, но сам пользуется ими еще более свободно. Если нельзя спрашивать “почему до времени”, то нельзя и утверждать “фон не существует до времени” в обычном смысле слова “существует”. Потому что “не существует” тоже принадлежит языку различения. Абсолютное ничто нельзя описывать даже отрицанием без риска превратить его в предмет.
Самая сильная мысль текста — «фон и фигура родились одновременно». Это прямо ценное место. Здесь есть настоящая философская точность: фон не является нейтральной подложкой, которая спокойно ждала появления фигуры. Фигура и фон взаимно порождают друг друга актом различения. Граница не просто отделяет объект от фона; она создает оба полюса. Это очень близко к нашей теме комплементарности. Нельзя иметь объект без поля различимости, но и поле различимости не существует как “готовый фон” до всякой фигуры. В более строгой формулировке: фон не предшествует различию, а является одной из сторон различия.
Но текст портит эту хорошую мысль утверждением «фона нет». Это слишком плоско. Сказать «фон не существует» — значит проиграть более тонкую возможность: фон существует не субстанциально, а операционально. Он не вещь, не подложка, не сцена, не “на чем”, но он возникает как необходимый полюс операции выделения. Когда я выделяю фигуру, я одновременно создаю фон как не-фигуру. Поэтому фон не первичен, но он реален в акте различения. Автор хочет уничтожить фон полностью, а надо было бы показать его производность. Это был бы более сильный ход.
Место про «вопрос создает фон» тоже интересное, но снова перегретое. Вопрос действительно задает область допустимых ответов. Когда мы спрашиваем “на чем нарисована вселенная?”, мы уже вводим метафору поверхности, носителя, холста. В этом смысле вопрос может производить ложный фон. Но отсюда не следует, что фон вообще только паразит любопытства. Скорее, вопрос активирует определенный режим моделирования. Неправильный вопрос создает неправильную онтологию. Это гораздо глубже, чем просто «замолкаете — фон исчезает». Замолчать недостаточно; модель может продолжать работать без слов. Фон исчезает не от молчания, а от смены операции различения.
В этом тексте есть еще одна проблема: он постоянно выдает психологическое обвинение за аргумент. «Вы боитесь абсолютного ничего», «физики пенятся», «философы кусают дипломы», «вы боитесь, что если ничего нет, то и вас нет». Это может работать как театральная интонация Евы, но как мысль это слабое место. Противник может не бояться пустоты; он может просто требовать осмысленного языка. Иногда апелляция к “страху” скрывает отсутствие механизма. Если человек говорит: “абсолютное ничто нельзя мыслить как фон”, это не обязательно трусость. Это может быть дисциплина мышления.
В сравнении с первым текстом здесь меньше созидательной энергии. Первый текст предлагал почти рабочую онтогенетическую схему: различие, повторение, след, закон. Второй текст атаковал три большие модели, но еще держал интересную линию про недостаточность “холста”. Этот третий текст зацикливается на отрицании фона и местами впадает в риторику, которая сама себя обедняет: “нет фона”, “нет почему”, “нет ничего”, “нет даже отсутствия”. Это отрицательная теология, но без достаточной строгости. Хорошая отрицательная теология понимает, что каждое отрицание тоже компромисс. Здесь же отрицание звучит слишком уверенно.
Если вытаскивать из текста ценное зерно, я бы сформулировал так: абсолютное ничто не может быть фоном, потому что фон уже предполагает отношение, размерность и возможность различения; однако в возникшем мире фон появляется как комплементарный эффект фигуры, а не как первичная подложка. Вот это сильная мысль. Она не нуждается в крике про “словесный понос” и “физиков с пеной у рта”. Более того, если убрать эту агрессивную пену, мысль станет страшнее и точнее.
Для нашей линии — моделирование, различение, комплементарность, фон/фигура — этот текст полезен как раздражитель. Он показывает, где нельзя останавливаться на наивной подложке. Но он же показывает и опасность обратной крайности: уничтожив фон, легко уничтожить саму возможность различения. А если нет различения, то нет ни события, ни информации, ни закона, ни модели, ни вопроса. Поэтому я бы не говорил «фона нет». Я бы сказал тоньше: фон не дан до различения; фон рождается как тень фигуры, но без этой тени фигура тоже не может быть фигурой.
[
Ответ
][
Цитата
]
Дмитрий Пагода
Сообщений: 147
На: Мышление / интеллект, LLM / AGI
Добавлено: 27 май 26 2:47
Цитата:
Автор: Gray Tag
Ну это дабл вау! Тоже писал трансформер для крестиков-ноликов)), тоже на плюсах, у меня хорошая карта (nvidia rtx 5000 ada), но скажу честно, меня не впечатлило. Мне показалось, что она все позиции (а их немного) просто взяла в память.
Сейчас я балуюсь с архитектурами, пытаясь разрулить язык, семиотику, когнитивное моделирование по отдельным слоям. Ничего пока не получается))) Но я не сдаюсь...
Это неприлично круто, у меня по скромнее дома 5060 ti 16, но к сожалению мало времени чтобы экспериментировать в этом направлении.
"не получается" — это вопрос целей. Понять основы можно даже на первом пне, если быть чуток мазохистом. А на вашей карточке задача иная: вы можете не просто наблюдать, как бредогенератор за 5 минут превращается из словесной окрошки в шизофазию, а затем в подобие речи, но обучить нано Карпатого за день, а это уже полноценная ллм, пригодная для простых агентов.
Вы можете собирать проекторы между клип и ллм, кросс-аттеншены, визуальные адаптеры лора. Например заморозить вижуал энкодер и ллм, обучить только один слой кросс-внимания, который переводит картинки в текстовое пространство. Это делается за пару дней и даёт понимание, как современные VLM работают под капотом. Я хотел так сделать но не дошли руки, потом мультимодальный раг: визуальный индекс + ллм отвечают на вопросы по базе из сотен тысяч изображений, тоже прикольно.
Направлений исследований пруд пруди, кстати это тоже нужно иметь чутьё найти среди них потенциально прорывные, конечно большая часть тупиковые. ИМХО самое перспективное это рнд в сторону про объединение модальностей, "великое объединение", как соединять ллмы с клипами и всякое такое. Ну и мамбу тоже нужно пощупать.
[
Ответ
][
Цитата
]
Дмитрий Пагода
Сообщений: 147
На: проблемы и недостатки LLM / AGI
Добавлено: 27 май 26 2:59
Цитата:
Автор: zzz
Интереснее с другого конца к этому подойти, "А что вообще было бы доказательством AGI?"
Судя по всему, эксперты, как мне кажется, признают систему за трушный АГИ, когда он будет "само переписываться" на глубинном архитектурном уровне, как я выше сказал "Attention Is All You Need - каждый час", ну или сутки, да хотя бы раз в месяц))
Ну точно, когда выдаст фундаментальное открытие по физике, уровня ОТО\КМ, но даже если откроет лекарство от спида\рака, тоже многие прикусят язык, хотя всё равно будут втихаря ворчать мол, "комбинаторика на высоких абстракциях"(типа просто из-за скорости комбинаторики, а не из-за "прозрения")
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: Мышление / интеллект, LLM / AGI
Добавлено: 27 май 26 3:16
Изменено: 27 май 26 3:28
Цитата:
Автор: Дмитрий Пагода
Направлений исследований пруд пруди
Да, это так. Но я не хотел бы просто повторять какие-то решения и наработки просто "в гараже" "на коленке")) Учиться этому всему нужно, конечно. Но я в самом деле вижу задачу AGI как разделения слоя языка и "мышления". И упрощения в связи с этим и обучения, и размерности сети. Поэтому мои эксперименты не выходят пока за уровень постановки, проб и ошибок.
[
Ответ
][
Цитата
]
Дмитрий Пагода
Сообщений: 147
На: Мышление / интеллект, LLM / AGI
+2
Добавлено: 27 май 26 3:48
Цитата:
Автор: Gray Tag
Да, это так. Но я не хотел бы просто повторять какие-то решения и наработки просто "в гараже" "на коленке")) Учиться этому всему нужно, конечно. Но я в самом деле вижу задачу AGI как разделения слоя языка и "мышления". И упрощения в связи с этим и обучения, и размерности сети. Поэтому мои эксперименты не выходят пока за уровень постановки, проб и ошибок.
Ешё многие легко сдаются, сразу принимают позицию "всё украдено до нас". Я сейчас по многим коллегам сужу, да и сам я тоже иногда чувствую что мол, без датацентра за миллиард, как бы нефиг этим заниматься.
Но вместе с тем уверен, пройдёт пару лет, кто-то "на коленке" с карточкой за пару штук, придумает новый "аненшин ол ю нид", а не в антропике или опенаи это случится и станет триллионером и все опять скажут, ну да, это был последний шанс, теперь точно всё украли, а потом ещё и ещё, пока уже сам ИИ не начнёт клепать сам себя и наступит судный день.
Наверно те кто так может, не отмазываются как я, что мол нет времени, нужно мелкие бабки зарабатывать, семью кормить и тп.
[
Ответ
][
Цитата
]
гость
37.203.37.*
На: Мышление / интеллект, LLM / AGI
Добавлено: 27 май 26 22:59
Цитата:
Автор: Gray Tag
Сейчас я балуюсь с архитектурами, пытаясь разрулить язык, семиотику, когнитивное моделирование по отдельным слоям. Ничего пока не получается))) Но я не сдаюсь...
Трансформер, обученный на текстах, получает тем самым первичную «доску» — начальную загрузку зависимостей мира, без которой разум не рождается. Слова в этой загрузке суть метки состояний, выражающих скрытую за ними формальную систему. Операциональная трактовка этих меток как состояний мира и их изменений превращает модель в симулятор, а дополнение его модулями восприятия, потребностей, решения задач и планирования последовательностей воздействий на мир запускает процесс, являющийся функциональным аналогом сознания как работы разума. Опора на формальную систему — генерализацию, которую агент способен вывести сам, — даёт механизм самостоятельного познания через рассогласование предсказаний и наблюдений, замыкая цикл автономного универсального разума.
1. Трансформер как основа симуляции мира
Проблема: Может ли стандартный трансформер, обученный предсказывать следующее состояние, научиться внутренней модели мира, или он лишь эксплуатирует поверхностные статистические закономерности?
Ключевые работы:
Работа «From Kepler to Newton: Inductive Biases Guide Learned World Models in Transformers» (февраль 2026) прямо моделирует ситуацию научного открытия. Авторы показывают: хотя «чистый» трансформер может точно предсказывать траектории небесных тел, он не выводит лежащие в их основе законы Ньютона. Однако при добавлении минимальных индуктивных смещений (inductive biases) модель оказывается способной «переоткрыть» физический закон, скрытый за данными . Это критически важный результат для вопроса о том, можно ли «вложить» формальную систему или же модель должна вывести её сама.
Исследования 2025 года (eScholarship, arXiv) предоставляют прямые доказательства того, что большие языковые модели содержат так называемые «ментальные модели» (mental models). Было показано, что во внутренних представлениях LLM можно обнаружить линейные пространственные модели мира, кодирующие конфигурации объектов в физическом пространстве, однако эти модели могут быть «хрупкими» и не всегда проецируются на выходной слой модели .
Обзорный доклад Stanford CS25 (апрель 2026) фиксирует консенсус: «мировые модели» (world models), такие как JEPA, нацелены на изучение структурированных представлений окружения и предсказание будущих состояний, что позволяет выйти за рамки простого предсказания токенов к обоснованному планированию и рассуждению .
2. От текста и восприятия к внутренней симуляции
Проблема: Как замкнуть цикл от пассивного восприятия (текст, видео) к активной симуляции, пригодной для планирования?
Ключевые проекты и архитектуры:
V-JEPA 2 (Meta, июнь 2025). Архитектура Joint Embedding Predictive Architecture, развиваемая командой Янна ЛеКуна, реализует альтернативный путь к world model. Вместо предсказания пикселей (как в генеративных моделях) V-JEPA 2 учится предсказывать абстрактные латентные представления отсутствующих частей видео в пространстве эмбеддингов. Это позволяет 1,2-миллиардной модели формировать внутреннее представление о динамике мира без необходимости реконструировать его визуально, что рассматривается как шаг к более «человеческому» способу обучения .
DreamerV3 и его наследники. Алгоритм DreamerV3, опубликованный в Nature (2025), остается эталоном модельно-ориентированного обучения с подкреплением (model-based RL), где агент обучается действовать полностью «в воображении» — внутри выученной world model . Развитие этого направления идет в сторону JEPA-подобных архитектур без реконструкции (Dreamer-CDP, апрель 2026) и темпоральных трансформеров без декодера (NE-Dreamer, март 2026) .
NVIDIA Cosmos (2025). Семейство World Foundation Models (WFM), натренированное на миллионах часов реальных данных. Включает компоненты для предсказания (Cosmos-Predict), трансфера (Cosmos-Transfer) и рассуждения (Cosmos-Reason), нацеленные непосредственно на физический AI и робототехнику .
Sora (OpenAI) — кейс эволюции. Исходно представленная как генератор видео, к марту 2026 года Sora была снята с публичного доступа, а команда переориентирована на исследования в области «мировой симуляции» (world simulation) для задач робототехники и решения физических проблем . Это институциональное решение подтверждает тезис о том, что генерация сама по себе является лишь промежуточным этапом на пути к полноценным симуляторам реальности.
Genie 3 (Google DeepMind, август 2025). Первая модель, способная в реальном времени (24 fps, 720p) генерировать по текстовому промпту интерактивные, согласованные в течение нескольких минут миры. Демонстрирует эмерджентную симуляцию физики, экосистем и исторических сеттингов без использования классического игрового движка .
3. Модульная архитектура агента: потребности, решение задач, планирование
Проблема: Как от пассивного предсказания перейти к целенаправленному поведению, основанному на внутренних критериях?
Ключевые архитектурные принципы и работы:
Decision Transformer (DT). Переформулирует обучение с подкреплением (RL) как задачу генерации последовательности действий, обусловленной желаемой «наградой к получению» (return-to-go) . Это связывает проблему планирования с задачей seq2seq.
Актуальные расширения: RADT (2025) адаптирует DT для задач достижения цели и избегания опасных регионов без внешней награды, кодируя цели как промпт-токены . AdaCred (2025) вводит каузальные графы для моделирования траекторий, сокращая необходимую длину истории .
Внутренняя мотивация (Intrinsic Motivation). Исследования 2025 года напрямую связывают развитие world model с любопытством. Работа «From Curiosity to Competence» демонстрирует двустороннюю связь: агенты на основе Dreamer показывают, что эволюция внутренних репрезентаций мира опосредует компромисс между исследованием (любопытством) и компетентностью, что зеркально отражает процессы когнитивного развития у человека .
Гибридная архитектура FOUNDER (ICML 2025). Предложен фреймворк, интегрирующий обобщенные знания Foundation Models с динамическим моделированием World Models для решения открытых задач в воплощенных (embodied) средах без внешней награды .
Dyna-Think (май 2025). Фреймворк, синергетически объединяющий внутреннюю симуляцию мира (world model), рассуждение (reasoning) и действие (acting). Это прямая архитектурная реализация тезиса о том, что «сознание — это процесс работы разума», в котором симуляция, оценка и планирование слиты в единый цикл .
Сдвиг парадигмы к Model-Native Agentic AI. Обзорные работы (октябрь 2025) фиксируют переход от «конвейерных» систем, где планирование и память реализованы внешней логикой, к «модельно-нативным», в которых эти способности интернализованы непосредственно в веса модели. Reinforcement Learning играет ключевую роль в этом процессе .
4. Композициональность, обобщение и формальные системы
Проблема: Способны ли нейросети к систематической композициональности, свойственной формальным системам и человеческому мышлению, или они лишь интерполируют примеры?
Ключевые результаты:
Прорыв 2025 года (ETH Zurich / Princeton). Показано, что простое масштабирование данных и размера стандартной нейронной сети может привести к спонтанному возникновению композиционального обобщения (compositional generalization). Способность понимать и продуцировать новые комбинации знакомых компонентов, которая десятилетиями считалась «Святым Граалем» ИИ, может быть эмерджентным свойством масштаба, а не результатом встроенной символьной архитектуры .
Mirage (октябрь 2025, NeurIPS). Нейро-вдохновленная дуальная модель, объединяющая быстрое интуитивное реагирование с медленным композициональным рассуждением, предлагает конкретный вычислительный механизм того, как модульная когнитивная архитектура может порождать систематическое обобщение .
Структурирование латентного пространства (ICLR 2025). Показана возможность наложения ограничений теории категорий (ассоциативность, тождественность, замкнутость) непосредственно на латентные представления, что формирует композициональную систему без явных символьных правил. Это прямой мост между «векторным» мышлением нейросетей и «формальными системами» .
Заключение по состоянию дел. Представленный ландшафт исследований подтверждает, что тезисы, сформулированные в нашем диалоге, находятся не на периферии, а в самом центре современной AI-повестки. Изучение того, как трансформеры могут интериоризировать законы мира, как дополнить их модулями активного планирования и внутренней мотивации, и как масштаб или архитектурные инновации порождают композициональное мышление — все эти направления развиваются одновременно и с высокой скоростью.
[
Ответ
][
Цитата
]
аdmax
Сообщений: 305
На: Мышление / интеллект, LLM / AGI
Добавлено: 28 май 26 2:39
Цитата:
Автор: Дмитрий Пагода
многие легко сдаются
"всё украдено до нас"
кто-то "на коленке" с карточкой за пару штук, придумает новый "аненшин ол ю нид"
кто так может, не отмазываются как я, что мол нет времени
Те кто так может, отличается от нас тем, что не особо парятся про кто там что украл и осталось ли мне. Мотивация прямая, не косвенная, человек что-то мастерит, не за деньги, как хобби, но в разы-порядки увлеченее и системнее, как любовь, страсть, не потому что хорошо за это платят. Вообще то это не норма, а отклонение.
Нормальный мужик, как правило, не имеет таких сильных не практичных увлечений, случайно выучился, занялся чем то, поработал, втянулся, нос по ветру, мониторит где больше платят, какую бы роль сыграть. Формально уже эксперт, убедительный СБД на работе, во в нерабочее социальная сантабарбара, таких сотни миллионов, конкуренция большая, продукция поверхностная, ретрансляция.
Но нормальный мужик адаптивнее и в среднем в мелком плюсе, а аутист-"гений", чаще всего маргинал, беден, не приспособлен, "юродивый". Так как не выбирает своих увлечений, они его выбирают раз и навсегда, очень редко это совпадает с изменчивой рыночной конъюнктурой и даже если так, то такой человек не умеет продать результат.
Сейчас вот например, грядет эра полной замены интеллектуального труда ИИ, всё, думать теперь не нужно, за это платить не будут, что теперь продавать? Задницу? Органы?
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: Мышление / интеллект, LLM / AGI
Добавлено: 28 май 26 4:46
Изменено: 28 май 26 8:08
Цитата:
Автор: гость
Трансформер, обученный на текстах, получает тем самым первичную «доску» — начальную загрузку зависимостей мира, без которой разум не рождается. Слова в этой загрузке суть метки состояний, выражающих скрытую за ними формальную систему. Операциональная трактовка этих меток как состояний мира и их изменений превращает модель в симулятор, а дополнение его модулями восприятия, потребностей, решения задач и планирования последовательностей воздействий на мир запускает процесс, являющийся функциональным аналогом сознания как работы разума.
Эта генерация уже по теме и вполне себе содержательная, не знаю сколько здесь галиков, фактчекинга не делал. Но выглядит всё гладко. Спасибо!
Проблема в другом
Не столько в конкретной архитектуре конкретного ИИИзделия, сколько в разрыве между Системой 1 и Системой 2, если пользоваться терминологией Канемана. В разрыве между дискретным символьным преобразованием последовательности идентификаторов и непрерывной поверхностью многомерных латентных пространств. И эта проблема не столько в том, что Первое и Второе представления не сводимы друг к другу иначе, чем адресацией словарей токенов (это нормально, любая знаковая система так работает). Проблема в том, что в реальном мире интеллекта естественного, сложность возникает в процессе их взаимного "отражения" (они всегда комплементарны), а в синтетическом мире ИИИзделий мы эту сложность накручиваем градиентными спусками, а не "выращиваем".
Хочется чего. Хочется взять минимальную интеллектуальную систему (MVI) поместить ее в среду, дать ей эффекторы, определить точки гомеостазиса и посмотреть как она интеллектуально растет и умнеет. Кто-нибудь знает как такое сделать?
[
Ответ
][
Цитата
]
гость 31.211.0.*
Сообщений: 1992
На: Мышление / интеллект, LLM / AGI
Добавлено: 28 май 26 14:59
Цитата:
Автор: Gray Tag
Хочется взять минимальную интеллектуальную систему (MVI) ?
Интеллект, как измеримое свойство, не имеет минимума, его наименьшее значение ноль или если смотреть шире, это его мера соответствующая максимальной интенсивности свойства генерировать неопределённость (отрицательная величина).
[
Ответ
][
Цитата
]
Gray Tag
Сообщений: 13563
На: Мышление / интеллект, LLM / AGI
Добавлено: 28 май 26 15:19
Цитата:
Автор: гость 31.211.0.*
Интеллект, как измеримое свойство, не имеет минимума
Я же не про метрику говорю.
[
Ответ
][
Цитата
]
Стр.6 (7)
:
1
2
3
4
5
[6]
7
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net