реклама
Новости Software

Тестировщики оценивают ответы ИИ-бота Google Bard наугад, чтобы не терять деньги

Компания Google в прошлом месяце начала ограниченное бета-тестирование своего ИИ-чат-бота Bard. С тех пор сотрудники некоторых крупных подрядчиков IT-гиганта участвуют в тестировании нейросети, а также проверяют точность выдаваемых им ответов. Оказалось, что зачастую участникам тестирования не хватает времени на проверку ответов Bard, из-за чего им приходится давать оценку наугад.

 Источник изображения: Google

Источник изображения: Google

Так, сотрудники компании Appen, которые помогают Google в тестировании алгоритма Bard, на условиях анонимности сообщили представителям СМИ, что им не хватает времени на осмысленную оценку ответов, выдаваемых ИИ-ботом. В полученных ими инструкциях сказано, что в процессе тестирования необходимо подготовить запрос для чат-бота, а после получения двух ответов выбрать наиболее связный и корректный ответ. У них также есть возможность добавить комментарий, чтобы объяснить, почему выбран тот или иной вариант.

Участники тестирования отмечают, что на обработку каждого запроса даётся несколько минут, но иногда на это отводится только 60 секунд. Зачастую дать корректную оценку полученного от чат-бота ответа за такое время весьма затруднительно, особенно в случаях, когда запрос связан с малознакомой темой. Оплата за эту работу начисляется на основе времени, выделяемого для решения каждой задачи. Чтобы не терять деньги тестировщикам приходится выполнять задачи за отведённое время даже в случаях, когда они не уверены в том, какой из предложенных ИИ-алгоритмом ответов является более точным. Проще говоря, чтобы не терять деньги участники тестирования вынуждены наугад выполнять задания, поскольку им не хватает времени на качественную проверку ответов Bard.

Источник отмечает, что сотрудники подрядных организаций Google всё чаще призывают к улучшению условий труда. Ещё в феврале участники бета-тестирования системы Bard передали петицию руководству Google с призывом повысить оплату труда. Согласно имеющимся данным, сотрудники Appen, участвующие в тестировании Bard, зарабатывают от $14 до $14,50 в час.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Придётся купить ещё раз»: вдохновлённый Hollow Knight и Sekiro экшен-платформер Nine Sols доберётся до консолей и Game Pass в ноябре 7 ч.
Новая статья: Age of Mythology: Retold — мифы, поведанные заново. Рецензия 8 ч.
Новый Outlook передаёт всю вашу почту в облако Microsoft — отказаться от этого нельзя 9 ч.
Ubisoft раскрыла план по улучшению Star Wars Outlaws к релизу в Steam 9 ч.
Вдохновлённый оригами экшен-платформер Hirogami от создателей Soul Calibur 6, Ace Combat 7 и Tekken 8 отправит игроков в мир, сделанный из бумаги 11 ч.
Студия-разработчик Vampire Survivors станет издателем игр, но не обычным 12 ч.
Konami показала 11 минут геймплея Metal Gear Solid Delta: Snake Eater в джунглях Советского Союза 13 ч.
Южная Корея ввела уголовную ответственность за просмотр, хранение и  распространение сексуальных дипфейков 14 ч.
В «Яндекс Музыке» теперь можно смотреть видеоклипы без подписки 15 ч.
Meta хранила пароли европейцев в открытом виде — её оштрафовали на €91 млн 15 ч.
Регуляторы рекомендуют китайским разработчикам отказываться от ускорителей Nvidia в пользу китайских аналогов 32 мин.
NASA и «Роскосмос» не пришли к единому мнению, какой уровень утечки воздуха в модуле «Пирс» считать неприемлемым 2 ч.
В России протестировали технологию мысленного управления «Газелью» — через нейроинтерфейс и акселерометр 7 ч.
Периферия от гения: Higround выпустила спецсерию клавиатур Basecamp 65, к которым приложил руку Хидео Кодзима 9 ч.
Учёные поняли, почему котики бьются током — раскрыта тайна статического электричества 9 ч.
Минюст США начал расследование деятельности Supermicro — акции компании снова упали 10 ч.
Ampere создаст кастомные Arm-процессоры для Uber 11 ч.
Infinix представила свою первую раскладушку Zero Flip с 6,9-дюймовым экраном, тремя 50-Мп камерами и чипом Dimensity 8020 за $645 12 ч.
Lenovo готовит к выпуску портативные игровые приставки Legion Go 2 и Legion Go Lite 14 ч.
Blackstone вложит £10 млрд в строительство в Великобритании крупнейшего в Европе ИИ ЦОД 16 ч.