реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Positive Technologies выпустила новую версию системы мониторинга безопасности промышленных инфраструктур 56 мин.
Аналитик предложил Take-Two повысить цену GTA VI до $100, чтобы помочь игровой индустрии 2 ч.
Meta выпустила ИИ, который налету переводит текст с русского и ещё ста языков 3 ч.
Дональд Трамп хочет издать указ, который «спасёт TikTok» 3 ч.
ИИ замещает российских айтишников — число вакансий в IT-компаниях заметно сократилось в 2024 году 4 ч.
Российская стратегия «Передний край» не выйдет из раннего доступа в феврале, а релиз в Steam «вообще под вопросом» 4 ч.
Роскомнадзор: более 710 млн записей с личными данными россиян утекли в сеть за 2024 год 4 ч.
Хакеры взломали AMD и похитили секретные данные 6 ч.
Не просто апгрейд графики: утечка подтвердила новые подробности ремейка Assassin’s Creed IV: Black Flag 16 ч.
Microsoft запустила бесплатный Copilot Chat для бизнеса с платными ИИ-агентами 16 ч.
LG Display представила самые яркие OLED-дисплеи для телевизоров 28 мин.
Nvidia переведёт чипы Blackwell на улучшенную упаковку CoWoS-L — это сулит трудности для компании и партнёров 35 мин.
Индия стала четвёртой страной в мире, состыковавшей два корабля в космосе без участия людей 2 ч.
SK hynix поставит первые образцы HBM4 для Nvidia уже в июне 2 ч.
Рекламные материалы Samsung с характеристиками смартфонов Galaxy S25 слили в Сеть за неделю до анонса 2 ч.
Балтийский городовой: НАТО анонсировала программу Baltic Sentry по защите подводных кабелей 2 ч.
Infortrend представила СХД EonStor GS 5090 с поддержкой 90 накопителей 3 ч.
Плата Jetway MTX-MTH1 формата Thin Mini-ITX получила чип Intel Core Ultra 5/7, три порта 2.5GbE и слот PCIe 5.0 x8 3 ч.
Наука под ударом инфляции: NASA урезало бюджет «Хаббла» и грозит тем же «Уэббу» 3 ч.
G.Skill представила комплекты памяти DDR5-6400 с низкими задержками CL30 и объёмом 96 Гбайт 3 ч.