Большие языковые модели кажутся умными, потому что говорят бегло, уверенно и в огромных масштабах. Но беглость - это не понимание, а уверенность - это не восприБольшие языковые модели кажутся умными, потому что говорят бегло, уверенно и в огромных масштабах. Но беглость - это не понимание, а уверенность - это не воспри

[Перевод] Почему большие языковые модели застряли в пещере Платона (и что будет дальше)

5м. чтение
0cbe3c36429281570dacba8989c32555.png

Большие языковые модели кажутся умными, потому что говорят бегло, уверенно и в огромных масштабах. Но беглость - это не понимание, а уверенность - это не восприятие. Чтобы ухватить реальное ограничение сегодняшних ИИ-систем, полезно вернуться к идее возрастом более двух тысяч лет.

В "Государстве" Платон описывает аллегорию пещеры: узники, закованные в цепи внутри пещеры, могут видеть только тени, проецируемые на стену. Никогда не видев реальных объектов, отбрасывающих эти тени, они принимают видимость за реальность и лишены возможности испытать настоящий мир.

Большие языковые модели живут в очень похожей пещере.


LLM не воспринимают мир - они о нем читают

LLM не видят, не слышат, не касаются и не взаимодействуют с реальностью. Они обучены почти полностью на тексте: книгах, статьях, постах, комментариях, расшифровках и фрагментах человеческого самовыражения, собранных из истории и интернета. Этот текст - их единственный вход. Их единственный "опыт".

LLM видят только "тени": тексты, созданные людьми, описывающими мир. Эти тексты - их целая вселенная. Все, что LLM знает о реальности, приходит отфильтрованным через язык, написанный людьми с разной степенью интеллекта, честности, предвзятости, знаний и намерений.

Текст - это не реальность. Это человеческое представление реальности. Оно опосредовано, неполно, предвзято и дико гетерогенно, часто искажено. Человеческий язык отражает мнения, недопонимания, культурные слепые пятна и откровенную ложь. Книги и интернет содержат экстраординарные инсайты, но также теории заговора, пропаганду, порнографию, насилие и чистую чушь. Когда мы обучаем LLM на "всем тексте", мы не даем им доступ к миру. Мы даем им доступ к человеческим теням на стене.

Это не незначительное ограничение. Это основной архитектурный дефект современного ИИ.


Почему масштаб не решает проблему

Преобладающее предположение в стратегии ИИ было таким: масштаб исправляет все - больше данных, модели покрупнее, больше параметров, больше вычислений. Но больше теней на стене не равняется реальности.

Поскольку LLM обучены предсказывать статистически наиболее вероятное следующее слово, они отлично справляются с производством правдоподобного языка, но не с пониманием причинности, физических ограничений или реальных последствий. Вот почему галлюцинации - это не баг, который можно исправить патчем, а структурное ограничение.

Как неоднократно утверждал Ян ЛеКун, одного языка недостаточно как основы для интеллекта.


Сдвиг к мировым моделям

Вот почему внимание все больше поворачивается к world models (мировым моделям): системам, которые строят внутренние представления о том, как работают среды, учатся на взаимодействии и симулируют результаты перед действием.

В отличие от LLM, мировые модели не ограничены текстом. Они могут включать временные ряды данных, сенсорные входы, циклы обратной связи, данные ERP, таблицы, симуляции и последствия действий. Вместо вопроса "Какое наиболее вероятное следующее слово?" они задают гораздо более мощный вопрос:

"Что произойдет, если мы сделаем это?"


Как это выглядит на практике

Для руководителей это не абстрактные исследовательские дебаты. Мировые модели уже появляются (часто без соответствующей маркировки) в областях, где одного языка недостаточно.

  • Цепочки поставок и логистика: Языковая модель может суммировать сбои или генерировать отчеты. Мировая модель может симулировать, как закрытие порта, рост цен на топливо или провал поставщика распространяется по сети, и тестировать альтернативные ответы перед вложением капитала.

  • Страхование и управление рисками: LLM могут объяснять политики или отвечать на вопросы клиентов. Мировые модели могут изучать, как риск на самом деле эволюционирует во времени, симулировать экстремальные события и оценивать каскадные потери при разных сценариях - то, что ни одна текстовая система не может делать надежно.

  • Производство и операции: Цифровые двойники фабрик - это ранние мировые модели. Они не просто описывают процессы; они симулируют, как машины, материалы и тайминг взаимодействуют, позволяя компаниям предсказывать отказы, оптимизировать пропускную способность и тестировать изменения виртуально перед касанием реальной системы.

Во всех этих случаях язык полезен, но недостаточен. Понимание требует модели того, как ведет себя мир, а не только того, как люди о нем говорят.


Как подготовиться к эре мировых моделей - прямо сейчас

Весь этот разговор о переходе от языковых моделей к мировым моделям поднимает практический вопрос: как профессионалам и компаниям готовиться к этому сдвигу уже сегодня?

Проблема в том, что пока мировые модели развиваются в лабораториях и специализированных приложениях, понимание их принципов работы требует экспериментирования с современными ИИ-системами. Нельзя строить будущее, не понимая настоящего.

Сервисы вроде BotHub дают возможность экспериментировать с разными подходами к ИИ прямо из браузера - от языковых моделей до более сложных архитектур.

a0fcd18c93b77cd5181f5a10897e08cb.png

Для доступа не требуется VPN, можно использовать российскую карту.

Не привязывайтесь к одному источнику информации. Привяжитесь к инструментам, которые помогают видеть полную картину.


Пост-LLM архитектура

Это не значит отказываться от языковых моделей. Это значит поставить их на правильное место.

В следующей фазе ИИ:

  • LLM становятся интерфейсами, копилотами и переводчиками

  • Мировые модели обеспечивают заземление, предсказание и планирование

  • Язык располагается поверх систем, которые учатся на самой реальности

В аллегории Платона узники освобождаются не изучением теней более внимательно - они освобождаются, повернувшись и столкнувшись с источником этих теней, и в конечном счете с миром за пределами пещеры.

ИИ приближается к похожему моменту.

Организации, которые распознают это рано, перестанут принимать беглый язык за понимание и начнут инвестировать в архитектуры, моделирующие их собственную реальность. Эти компании не будут просто строить ИИ, который убедительно говорит о мире - они построят ИИ, который действительно понимает, как он работает.

Поймет ли ваша компания это? Сможет ли ваша компания построить свою мировую модель?

Источник

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.