Чат-бот Grok от X получил обновление с «улучшенной логикой»

Grok-1.5 обладает «улучшенной логикой», особенно когда речь идет о задачах, связанных с кодированием и математикой. Модель более чем в два раза превзошла результаты Grok-1 в популярном математическом тестировании MATH и на 10 процентных пунктов превзошла результаты теста HumanEval на способность к созданию языков программирования и решению задач, передает incrussia.ruТрудно предсказать, как эти результаты отразятся на реальном использовании. Широко используемые тесты ИИ, которые измеряют такие эзотерические вещи, как успеваемость на экзаменах по химии для выпускников, плохо справляются с задачей определения того, как человек сегодня взаимодействует с моделями. Одним из улучшений, которое должно привести к заметным преимуществам, является объем контекста, который Grok-1.5 может понять по сравнению с Grok-1.Чат-бот может обрабатывать контексты до 128 тыс. токенов. Здесь «токены» относятся к фрагментам необработанного текста (например, слово «фантастический» разделено на «фан», «тас» и «тик»). Контекст или контекстное окно относится к входным данным (в данном случае к тексту), которые модель рассматривает перед созданием выходных данных (дополнительного текста).Модели с маленькими контекстными окнами склонны забывать содержание даже самых недавних разговоров, в то время как модели с более крупными контекстами избегают этой ловушки и, как дополнительное преимущество, лучше понимают поток данных, которые они принимают.«Grok-1.5 может использовать информацию из значительно более длинных документов, — пишет x.AI в своем блоге. — Более того, модель может обрабатывать более длинные и сложные запросы, сохраняя при этом способность следовать инструкциям по мере расширения контекстного окна».Отличие модели Grok от x.AI от других генеративных моделей ИИ — они отвечают на вопросы по темам, которые обычно закрыты для других моделей, например, заговоры и более противоречивые политические идеи. Модели также отвечают на вопросы с «бунтарской жилкой», как описал это Маск, и откровенно грубо выражаются, если их об этом просят. Неясно, какие изменения чат-бот вносит в эти области. X.AI не упоминает об этом в своем блоге.Grok-1.5 скоро будет доступен ранним тестерам X вместе с «несколькими новыми функциями». Объявление было сделано после того, как x.AI открыл исходный код Grok-1. Совсем недавно Маск заявил, что больше пользователей X — особенно тех, кто платит за премиум-план X за $8 в месяц — получат доступ к чат-боту Grok, который ранее был доступен только клиентам X Premium+ (за $16 в месяц).