реклама
Теги → обработка данных

Microsoft создала ИИ, который облегчит работу с таблицами в Excel — он понимает запросы на естественном языке

Сотрудники, умеющие качественно работать с электронными таблицами Excel, ценятся достаточно высоко. Но исследователи Microsoft разработали решение, способное как минимум отчасти их заменить. Большая языковая модель SpreadsheetLLM предназначена для управления электронными таблицами при помощи команд естественным языком.

 Источник изображения: Rubaitul Azad / unsplash.com

Источник изображения: Rubaitul Azad / unsplash.com

SpreadsheetLLM анализирует и интерпретирует данные в электронных таблицах при помощи ИИ, решая большинство связанных с ними задач — для этого производится сериализация данных, то есть включение в поток адресов, значений и форматов ячеек. Инструмент содержит компонент SheetCompressor, который сжимает электронные таблицы для их передачи модели ИИ. Он состоит из трёх модулей: первый анализирует структуру таблицы и отбрасывает нетабличное содержимое; второй преобразует данные в более эффективное представление; третий агрегирует данные.

У SpreadsheetLLM есть некоторые ограничения. Она игнорирует цвета ячеек, а они могут иметь какое-то значение, и не осуществляет семантического сжатия для содержимого ячеек, выраженного естественным языком. Но и этого хватает, чтобы на 96 % сократить потребление токенов при запросе к ИИ, что означает экономию вычислительных ресурсов. В итоге пользователи без надлежащей технической подготовки могут отправлять к SpreadsheetLLM запросы естественным языком и добиваться поставленных задач. Но основная задача проекта — не заменить человека, а оказать ему помощь в финансах, бухгалтерском учёте и других областях, связанных с обработкой данных.

Модель включает фреймворк Chain of Spreadsheet (CoS) для анализа содержимого нескольких таблиц. SpreadsheetLLM может работать со структурированными и неструктурированными данными электронных таблиц — исследователи указывают, что этот аспект способен уменьшить инциденты с «галлюцинациями» в ответах ИИ. Пока проект находится на стадии исследования, и к выходу в качестве коммерческого продукта он ещё не готов.

Facebook✴ объявила, что будет обучать ИИ на фото и постах пользователей — личные переписки не тронут

Социальная сеть Facebook объявила о внесении изменений в политику конфиденциальности, касающихся использования фотографий и сообщений пользователей для обучения искусственного интеллекта. Нововведения вступят в силу 26 июня 2024 года.

 Источник изображения: rawpixel.com / freepik.com

Источник изображения: rawpixel.com / freepik.com

Как сообщает PCWorld, начиная с упомянутой даты, сообщения, изображения и другой публичный контент миллионов пользователей Facebook по умолчанию будут доступны для анализа нейросетям компании Meta (материнская структура Facebook). Это нужно для улучшения работы инструментов генеративного ИИ. При этом личные сообщения и переписка использоваться не будут — к ним доступ по-прежнему будет ограничен.

Эксперты отмечают, что подобный шаг был вполне ожидаем. Компания Марка Цукерберга (Mark Zuckerberg) уже несколько лет наращивает инвестиции в разработку технологий ИИ, для обучения которых требуются огромные массивы различных данных.

Опасения вызывает то, что теперь Facebook фактически получает доступ к информации людей без их непосредственного одобрения. Хотя сама компания утверждает, что нововведение пойдет на пользу не только ей, но и пользователям, часть аудитории социальной сети уже высказала своё недовольство.

В связи с этим Meta подчеркивает, что у каждого пользователя есть «право на возражение». Это можно сделать с помощью специальной формы, которая предлагается на странице помощи. В форме надо указать свои данные и причину возражения. Далее Meta обязана рассмотреть возражение и оценить его в соответствии с действующим законодательством о защите данных. Однако даже если возражение будет одобрено, Facebook все равно может использовать часть данных для обучения ИИ, например, когда другие люди делятся контентом пользователя или упоминают его в своих сообщениях.

Использование публикаций участников социальной сети для обучения ИИ можно было предвидеть уже к концу прошлого года. Однако новое, беспрецедентное по масштабам соглашение, вступает в силу впервые.

Роскомнадзор получил более 44 тыс. жалоб о неправомерной обработке персональных данных в 2022 году

В прошлом году Роскомнадзор получил свыше 44 тыс. жалоб о неправомерной обработке персональных данных. Об этом сказано в сообщении, которое было опубликовано в Telegram-канале ведомства и посвящено Дню защиты персональных данных.

 Источник изображения: Innova Labs / pixabay.com

Источник изображения: Innova Labs / pixabay.com

«За 2022 год в Роскомнадзор поступило 44 269 обращений граждан о неправомерной обработке персональных данных (на 0,8 % меньше, чем в 2021 году)», — говорится в сообщении ведомства. Отмечается, что в 38 188 случаев россияне жаловались на действия операторов, которые, по их мнению, осуществляли незаконную обработку персональных данных. В 2021 году обращений такого типа было на 0,3 % больше.

За отчётный период Роскомнадзор внёс в Реестр нарушителей прав субъектов персональных данных 535 записей, что на 11,5 % меньше по сравнению с 2021 годом. Чаще всего граждане жаловались на действия кредитных учреждений, организаций ЖКХ, владельцев интернет-сайтов, включая социальные сети, а также действия коллекторских агентств.

Роскомнадзор рекомендует гражданам ограничить объём публикуемой в интернете личной информации и отказаться от указания личных данных на сомнительных веб-ресурсах. Также призывается до отправки данных убедиться, что адрес сайта соответствует ресурсу, который пользователь хотел посетить. В дополнение к этому следует использовать сложные пароли, регулярно меняя их, и два почтовых ящика, один из которых использовать для регистрации на сайтах.

Минэкономики предложило закрепить в законе санитизацию данных ограниченного доступа

Стало известно, что в новой версии законопроекта, регулирующего работу Национальной системы управления данными (НСУД), Минэкономики вводит понятие санитизации данных — отделения информации ограниченного доступа, например, составляющей тайну связи, банковскую или налоговую. Об этом пишет «Коммерсантъ» со ссылкой на соответствующий законопроект.

 Источник изображения: Sigmund/unsplash.com

Источник изображения: Sigmund/unsplash.com

В соответствии с документом, санитизированными данными может считаться персональная информация, изменённая таким образом, что восстановить её принадлежность конкретному лицу невозможно, или относящаяся к банковской, налоговой тайне, тайне связи и так далее, из которой убраны все конфиденциальные детали, создающие необходимость в защите. Предполагается, что в дальнейшем по каждому виду информации ограниченного доступа будут созданы специальные технологии и алгоритмы санитизации.

В Минцифры отметили, что санитизация не противоречит политике в сфере защиты данных. Этот механизм может применяться в работе с базами данных юрлиц в рамках НСУД, считают в ведомстве. По данным источника, обработкой таких данных будет заниматься НСУД. В Ассоциации больших данных (объединяет МТС, «Мегафон», Сбербанк, «Яндекс», VK, Газпромбанк и др.) считают, что механизмы, которые путём удаления конфиденциальной информации выводят использование данных из-под регуляторных ограничений, расширят возможности по повторному использованию и должны быть введены для бизнеса.

Напомним, создание НСУД предусмотрено нацпроектом «Цифровая экономика». На платформе планируется объединить данные из сотен государственных систем, реестров и баз, чтобы ими могли обмениваться ведомства и представители бизнеса. Одним из главных изменений прежней версии законопроекта стало закрепление возможности для бизнеса на возмездной основе получать доступ к данным.

Минцифры попросили доработать регулирование обезличенных данных граждан

Представители IT-бизнеса обратились в Минцифры с просьбой доработать поправки к закону «О персональных данных», регулирующие оборот обезличенной информации. В новой версии проекта может появиться положение о необходимости заручиться согласием гражданина на обработку данных сразу для нескольких целей. Об этом пишет «Коммерсантъ» со ссылкой на протокол заседания рабочей группы «Нормативное регулирование» АНО «Цифровая экономика», которое прошло 12 августа.

 Источник изображения: Pixabay

Источник изображения: Pixabay

На заседании было принято решение, согласно которому центр компетенций «Сколково» совместно с ЦБ и бизнесом подготовит Минцифры обоснование необходимости введения упомянутых изменений. Напомним, исходная версия законопроекта была принята в феврале 2021 года. В соответствии с законопроектом гражданин мог дать одно согласие на обработку его данных для разных целей, включая обезличивание. С тех пор Минцифры три раза вносило изменения в документ. В соответствии с третьей версией законопроекта, которую одобрило правительство, бизнес должен передавать государству уже обезличенные данные, которые будут использоваться для развития ИИ-систем и других нужд.

В июле Минцифры представило новый вариант поправок, предполагающий, что бизнес должен передавать по запросу данные своих клиентов государству, которое будет их обезличивать и создавать дата-сеты для обучения ИИ. Минцифры также предлагает предоставлять бесплатный доступ к этим данным российским разработчикам и госорганам «для государственного и муниципального управления». В этой версии законопроекта необходимость получения единого согласия гражданина на обработку его данных для разных целей отсутствует.

В пресс-службе АНО «Цифровая экономика» сообщили, что на прошедшем недавно заседании было предложено вернуться к обсуждению ранее согласованных формулировок и вместе с Минцифры доработать их. Ожидается, что доработанный документ представят для обсуждения до начала осенней сессии Госдумы. В Минцифры сообщили, что совместно с отраслью ведомство прорабатывает «все возможные варианты использования обезличенных дата-сетов, которые обеспечат защиту интересов граждан и бизнеса и будут способствовать развитию ИИ».

window-new
Soft
Hard
Тренды 🔥
Blizzard показала геймплейный трейлер и раскрыла детали наследника духов из Diablo IV: Vessel of Hatred — совершенно нового класса для серии 19 мин.
Симулятор езды по бездорожью Expeditions: A MudRunner Game наконец получил кооперативный режим, но пока только в Steam 2 ч.
OpenAI представила облегченную мощную ИИ-модель GPT-4o Mini — она заменит GPT-3.5 для всех пользователей 3 ч.
Дёшево и сердито: Battlestate Games начала продавать доступ к скандальному PvE-режиму Escape from Tarkov 3 ч.
Боевая гонка про культ помешанных на скорости орков скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер Warhammer 40,000: Speed Freeks 4 ч.
«Революционный шаг вперёд»: анонсирован мультиплеерный шутер Splitgate 2 с «крышесносными» портальными перестрелками 5 ч.
Четвёртый за год: NVIDIA приобрела ещё один облачный стартап — Brev.dev 5 ч.
Бывшая Yandex выкупит свои акции по $10,5 6 ч.
Обновление Windows 11 23H2 наконец стало доступно всем пользователям 6 ч.
Microsoft создала ИИ, который облегчит работу с таблицами в Excel — он понимает запросы на естественном языке 6 ч.