LLM

Новости / Программирование
LLM пожирают много памяти, а PagedAttention решает эту проблему
LLM, такие как GPT и PaLM, меняют методы работы и взаимодействия, обеспечивая работу всего: от помощников-программистов до универсальных чат-ботов. Однако, запуск этих невероятно мощных моделей обходится очень дорого, зачастую в 10 раз дороже, чем традиционный поиск по ключевым словам. Скрытый пожиратель памяти: кэш KV LLM имеет в основе модель Transformer, которая генерирует текст по одному слову за раз, пишет xrust. Для эффективной работы необходимо запоминать «контекст» предыдущих токенов. Эта память хранится в так называемом кэше «ключ-значение» (KV). Можно представить его как кратковременную память LLM для разговора. Проблема в том, что этот кэш KV огромен, и его размер динамически увеличивается и уменьшается для каждого запроса. Существующие системы сталкиваются с этой проблемой, поскольку обычно хранят кэш KV в одном непрерывном блоке памяти. Такой подход приводит к двум серьёзным проблемам. Первая - Фрагментация памяти: Внутренняя фрагментация. Системы заранее выделяют
2 520 15 сентября 2025, 06:37 2
Новости / Программирование
LLM учатся решать не сложные математические задачи
LLM, большие языковые модели, продемонстрировали превосходную производительность в понимании языка, генерации текста, синтезе кода и многих других задачах. Однако, математические рассуждения им по-прежнему не по зубам. Недавно разработчики ИИ научили его решать некоторые математические головоломки, пишет xrust. На победном пути стояли тонкие настройки, использующие синтетические данные. Экспериментальные результаты с моделью open-llama-3B на трех различных тестовых наборах данных показывают, что модель выдает правильное решение. ИИ дали следующий набор чисел: 34, 18, 31. 41, 19, 55. Проводя над ними операции, нужно было получить «-110». Следует отметить, что отсутствие специальной математической подготовки стало основным препятствием при выработке алгоритма решения. Однако, задача была решена.
3 486 25 августа 2025, 07:34 3
Новости
Алису учат мультизадачности: Яндекс встраивает ИИ-агентов в браузер
Вместо обычного поиска «забронировать столик» Алиса скоро сама заполнит форму и завершит заказ. Xrust.ru узнал: Яндекс готовит бета-версию «Яндекс.Браузера» с ИИ-агентом на базе больших языковых моделей — летом помощник не просто найдёт информацию, а совершит действие на сайте. От запроса к действию ИИ-агент способен: Анализировать данные и принимать решения по заданным параметрам Взаимодействовать с формами сайтов: бронировать, оплачивать, регистрировать Обучаться на ошибках и ускорять решения клиентских задач в 2–3 раза Xrust.ru считает: это шаг к браузеру, где поисковая строка превращается в волшебную палочку реальных действий.
6 048 21 июня 2025, 20:16 5