реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Разработчики Guilty Gear Strive анонсировали кроссовер с Cyberpunk: Edgerunners — первый трейлер и детали четвёртого сезона 36 мин.
Mistral AI и NVIDIA представили корпоративную ИИ-модель Mistral NeMo 12B со «здравым смыслом» и «мировыми знаниями» 2 ч.
Microsoft: неправильно называть «деградацией» повышение цен на Game Pass 13 ч.
iPhone на iOS 17.4 и новее оказалось невозможно взломать с помощью Cellebrite 17 ч.
Видео: геймплейная демонстрация фэнтезийного MMO-экшена Soulframe от создателей Warframe 21 ч.
Intel улучшает XeSS, но собственной функции генерации кадров по-прежнему нет 21-07 09:07
Сбой с CrowdStrike затронул 8,5 млн компьютеров с Windows по всему миру 21-07 07:35
Пострадавшие от сбоя с CrowdStrike системы будут восстанавливаться несколько недель 21-07 06:31
Глобальный сбой из-за обновления CrowdStrike затронул 8,5 млн ПК на Windows: Microsoft выпустила инструмент для починки пострадавших систем 21-07 00:48
Новая статья: SCHiM — тень и её человек. Рецензия 21-07 00:04
Nvidia готовит для Китая антисанкционный ИИ-ускоритель новейшего поколения Blackwell 2 ч.
Intel представила чипы Raptor Lake Refresh с отключёнными E-ядрами для встраиваемых устройств 2 ч.
Акции тайваньских компаний упали в цене после выбытия Джо Байдена из президентской гонки в США 2 ч.
Китайская XPeng поможет Volkswagen при разработке электромобилей для глобального рынка 4 ч.
В рамках 2-нм техпроцесса Samsung увеличит количество EUV-слоёв на 30 % 5 ч.
Новая статья: Обзор ноутбука Digma Pro Fortis M: учёба удобнее, работа эффективнее 11 ч.
В 2024 году лидером российского рынка унифицированных коммуникаций станет «Ростелеком» 12 ч.
Nyriad, разработчик СХД с GPU-ускорением, окончательно свернул бизнес, распродав активы и патенты 14 ч.
К ИИ готов: IXAfrica и Schneider Electric запустили в Кении ЦОД гиперскейл-класса 14 ч.
Профсоюз Samsung запланировал новую акцию протеста, несмотря на старт переговоров с работодателем 21-07 09:40