реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Новая статья: Nobody Wants to Die — классический нуар несколько веков спустя. Рецензия 12 ч.
Новая статья: Gamesblender № 684: слухи о GeForce RTX 50, перенос S.T.A.L.K.E.R. 2 и «разочаровывающая» GTA VI 12 ч.
Китай стремительно догоняет США в сфере ИИ с помощью технологий с открытым исходным кодом 13 ч.
X заподозрили в нарушении законов ЕС, из-за обучения ИИ на публикациях пользователей 19 ч.
Минюст США обвинил TikTok в незаконном сборе информации о взглядах американцев и цензуре контента по указаниям из Пекина 22 ч.
Анонсы от авторов Mortal Kombat 1: сюжетное дополнение Khaos Reigns, подвох с Kombat Pack 2 и возвращение анималити 24 ч.
Криптовалюты вернулись к росту, но Ethereum всё равно подешевел по итогам недели 24 ч.
Теперь в TikTok можно находить песни, просто напевая их 24 ч.
Смартфоны Google Pixel 9 смогут добавлять пользователя на фото, где его изначально не было 27-07 10:34
Дешёвые сканеры штрихкодов помогли в кратчайшие сроки восстановить пострадавшие от CrowdStrike компьютеры 27-07 00:25
Nio не вдохновляет бизнес-идея выпуска роботизированного такси 4 ч.
Китайский производитель тяговых батарей CATL смог нарастить прибыль при падении выручки 5 ч.
Не так просто и не так быстро: учёные исследовали особенности работы памяти и NVLink C2C в NVIDIA Grace Hopper 12 ч.
Nvidia готовит новую мобильную GeForce RTX 3050 на чипе Ada Lovelace с 64-битной шиной и 4 Гбайт памяти 12 ч.
Астрофизики обнаружили связь между разрушением углеводородной пыли и эволюцией галактик 15 ч.
Анонсирован смартфон Nio Phone 2 с флагманским железом и глубокой интеграцией с электромобилями Nio 16 ч.
Европейская южная обсерватория показала эпичную стройку Чрезвычайно большого телескопа 17 ч.
Samsung готовит к выпуску бюджетник Galaxy A06 19 ч.
Поставщик ИИ-услуг Gcore привлёк на развитие $60 млн от Wargaming и других инвесторов 20 ч.
Учёные впервые увидели подноготную гамма-всплеска — распознали его спектральные линии 21 ч.