реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Capcom добавила в Resident Evil Requiem вид от третьего лица потому, что Resident Evil 7 оказалась «даже слишком страшной» 2 ч.
Новые меры по борьбе с киберпреступниками могут ударить по «белым хакерам» в России 2 ч.
Гендиректор Epic Games: в проблемах с оптимизацией игр на Unreal Engine 5 виноват не движок, а разработчики 2 ч.
Разработчик Dread Delusion анонсировал Entropy — олдскульную пошаговую ролевую игру про актёра театра, на мир которого напали демоны 3 ч.
«Яндекс» запустил новую ИИ-модель YandexGPT 5.1 Pro, но доступна она пока лишь бизнесу 4 ч.
«Это точно не конец»: создатель Clair Obscur: Expedition 33 намекнул на дополнение и сиквелы 4 ч.
Google заявила о своей непричастности к сбоям Google Meet в России 5 ч.
«Сократик»: создание презентаций за минуту с помощью ИИ 7 ч.
Bethesda подтвердила работу над вторым сюжетным дополнением к Starfield и геймплейными улучшениями, о которых просили игроки 7 ч.
Обнаружен первый ИИ-вирус — он запускает на локальном ПК нейросеть от OpenAI и просит её написать вредоносный код 8 ч.
Самолёт SolarStratos побил рекорд высоты полёта на солнечной тяге 2 ч.
Сотовые сети в России стали чаще сбоить после блокировки звонков в мессенджерах 2 ч.
NVIDIA жалуется на многомиллиардные потери из-за торговой войны США и Китая 2 ч.
Китайский бизнес переходит на подержанные ускорители NVIDIA A100 и H100 из-за проблем с поставками H20 3 ч.
Европейские продажи Tesla рухнули на 40 %, а у китайской BYD — утроились 4 ч.
Российский синхротрон СКИФ стал ближе к научной работе: в его бустере запустили циркулирующий пучок электронов 4 ч.
Рекордные продажи NVIDIA не впечатлили инвесторов из-за слабой выручки в сегменте ЦОД и неопределённости с поставками в Китай 4 ч.
Еще один крупный автопроизводитель отказался от грандиозных планов на электромобили 4 ч.
Луна эффектно вклинилась в кадр во время съёмки Солнца орбитальным коронографом 4 ч.
GlobalFoundries заявила, что не будет обменивать субсидии США на акции по примеру Intel 5 ч.