Опрос
|
реклама
Быстрый переход
OpenAI догнала Anthropic в ИИ-программировании
10.10.2025 [16:30],
Павел Котов
Ассистент по написанию компьютерного кода OpenAI Codex в ряде задач оказался лучше, чем считающийся первым на рынке Anthropic Claude Code, сообщил ресурс The Information. Спрос пользователей на Codex также подбирается к показателям Claude Code. ![]() Источник изображения: Mohammad Rahmani / unsplash.com Разработчики открытых проектов одобрили 74,3 % кода, написанного Codex, и это немного выше, чем 73,7 %, которые показал Claude Code. Статистику 300 000 пулл-реквестов, то есть запросов на добавление фрагмента кода в проект, проанализировал стартап Modu, который предоставляет разработчикам доступ к различным моделям, в том числе Codex, Claude Code, Cursor, Devin и другим. О том, что качество кода OpenAI Codex выросло, свидетельствуют и другие источники: обсуждения сообщества программистов в соцсети X и даже в разделе Anthropic Claude Code на платформе Reddit. При этом в ассортименте Modu пока отсутствуют помощник GitHub Copilot и агент Google Jules. Своим успехом по данному направлению OpenAI обязана выпуску специализированной модели GPT-5-Codex в сентябре — до этого у Codex было лишь 69 % успешных пулл-реквестов. Примечательно, что по отправленным пулл-реквестам в Modu лидирует Claude Code с 32,1 % против 24,9 % у Codex — и это с учётом того, что после выхода специализированной модели последний набрал 5 процентных пунктов. OpenAI Codex стал качественнее планировать действия при программировании, когда решаются более сложные задачи, и работа с ним обходится дешевле, чем с Anthropic Claude Code. Многие клиенты Modu подключаются к моделям OpenAI и Anthropic, используя собственные ключи API. Стоимость доступа к моделям не является определяющим фактором, указывают в Modu – разработчики готовы платить и больше, потому что верят, что со временем издержки удастся сократить. Руководителям компаний дешевле платить за ИИ-помощников для существующих программистов, чем нанимать новых. Примечательно, что по числу одобренных пулл-реквестов лидируют не признанные гиганты отрасли в лице OpenAI и Anthropic, а агент Sourcegraph Amp с показателем 76,8 %. Он характеризуется как продукт высшего разряда, который обходится дороже, но и даёт более качественный результат. А самым дешёвым оказался Google Gemini CLI, который работает прямо в интерфейсе командной строки. Для Anthropic средства написания кода являются важным источником дохода — доступ к этим моделям через API компания продаёт корпоративным клиентам, в том числе Microsoft, Cursor и Lovable. Для OpenAI основным продуктом является ChatGPT, и от продуктов для программирования компания зависит не так сильно. Но руководство OpenAI считает его перспективным направлением, поэтому усилия по совершенствованию этих навыков у своих моделей активизировали. OpenAI сделала общедоступным Codex — ИИ-алгоритм с динамическим мышлением для агентского программирования
07.10.2025 [04:37],
Владимир Фетисов
В прошлом месяце OpenAI представила обновлённого ИИ-агента GPT-5-Codex, способного динамически распределять время на выполнение задач. На тот момент он был доступен подписчикам ChatGPT Plus, Pro, Business, Education и Enterprise. Теперь же алгоритм получает ряд полезных нововведений и становится общедоступным. ![]() Источник изображения: AI Разработчики интегрировали Codex в сервис совместной работы Slack. Благодаря этому пользователи смогут делегировать задачи и задавать вопросы ИИ-агенту прямо в канале команды или ветке обсуждения, подобно тому, как происходит общение между коллегами. Вместе с этим Open AI выпустила Codex SDK, благодаря которому ИИ-агента можно будет встроить в продукты сторонней разработки. Ещё одним нововведением стало появление дополнительных инструментов администрирования, которые обеспечат больше контроля над средами разработки. Администраторы смогут редактировать и удалять облачные среды Codex внутри своего рабочего пространства. Появится возможность применения настроек с повышенным уровнем безопасности по умолчанию для локального использования через терминал и расширение для IDE. Новые аналитические панели помогут администраторам отслеживать разные параметры в процессе взаимодействия пользователей с ИИ-агентом. Теперь пользователи могут взаимодействовать с Codex практически в любом месте, где они занимаются написанием программного кода, будь то какой-то редактор или облако, и всё это связано в рамках одной учётной записи ChatGPT. По данным OpenAI, уровень ежедневного использования ИИ-агента вырос более чем в 10 раз с начала августа. Отмечается, что GPT-5-Codex вошла в число самых быстрорастущих ИИ-моделей компании. С её помощью было обработано свыше 40 трлн токенов за три недели с момента запуска. Codex используется разработчиками по всему миру, а в OpenAI он уже стал неотъемлемой частью процесса разработки. Интеграция ИИ-агента в Slack и Codex SDK доступны разработчикам в рамках тарифных планов ChatGPT Plus, Pro, Business, Edu и Enterprise, начиная с этой недели. Новые функции администрирования смогут опробовать подписчики Business, Edu и Enterprise. Более детальную информацию касательно разграничений доступа в зависимости от используемого тарифа можно получить на сайте OpenAI. Microsoft обратилась к ИИ от Anthropic для Visual Studio Code — OpenAI больше не в почёте
17.09.2025 [16:37],
Павел Котов
Microsoft долгое время выступала как финансовая опора OpenAI, но теперь софтверный гигант всё больше обращается к моделям искусственного интеллекта от Anthropic — тёплые отношения с OpenAI не всегда оказываются важнее конкретных результатов работы. Финансирование разработчика ChatGPT не гарантирует эксклюзивного характера отношений. ![]() Источник изображения: visualstudio.com Во флагманской среде написания кода Visual Studio Code компания сделала выбор в пользу Anthropic Claude Sonnet 4, а не OpenAI GPT-5. Компания развернула функцию автоматического выбора модели ИИ для GitHub Copilot — она предполагает установку оптимального варианта помощи при написании кода. Пользователям на платных тарифах теперь будет предлагаться Claude Sonnet 4; в бесплатных вариантах останется комбинированная версия, которая включает в себя GPT-5 и GPT-5 mini. Microsoft уже не первый месяц негласно рекомендует инженерам пользоваться моделями Anthropic, сообщило издание The Verge со ссылкой на осведомлённые источники. «Согласно внутренним тестам, Claude Sonnet 4 является рекомендованной моделью для GitHub Copilot», — заявила ещё до выхода GPT-5 глава отдела разработки Microsoft Джулия Льюсон (Julia Liuson); позиция компании по данному вопросу не изменилась и сейчас. В течение последних лет Microsoft активно инвестировала в OpenAI — с 2019 года корпорация вложила в стартап более $13 млрд; сейчас отношения между компаниями регулируются сложными соглашениями о распределении доходов. При этом OpenAI может пользоваться услугами конкурирующих с Microsoft облачных провайдеров. Софтверный гигант и сам пытается страховать риски, разрабатывая собственные системы ИИ: компания обучила модель MAI-1-preview на 15 000 ускорителях Nvidia H100, что является скромным показателем по современным меркам, рассказал глава профильного подразделения Мустафа Сулейман (Mustafa Suleyman). Более эффективные, как показали тесты Microsoft, модели Anthropic будут использоваться и в некоторых приложениях пакета Microsoft 365, в том числе Excel и PowerPoint. Microsoft развивает стратегию в области ИИ и стремится сбалансировать надёжное партнёрство с OpenAI, привлекая альтернативных поставщиков, если им есть что предложить. Это могут быть более эффективные средства написания кода в Visual Studio Code или создания документов в приложениях Microsoft 365. Выбор моделей Anthropic по умолчанию просто свидетельствует, что для Microsoft практическая эффективность выше корпоративной преданности. Сегодня в России отмечается День программиста
13.09.2025 [05:27],
Андрей Крупин
Сегодня, 13 сентября — аккурат в 256-й день года, российские разработчики ПО и IT-специалисты, чья деятельность связана с написанием, компиляцией и отладкой программного кода, отмечают свой профессиональный праздник. Официально и на законных основаниях. ![]() Источник изображения: Tai Bui / unsplash.com Признание на государственном уровне праздник получил в 2009 году после подписания президентом России указа №1034 «О Дне программиста», подготовленного Министерством связи и массовых коммуникаций РФ. При этом дата празднования была выбрана не случайно: 256 — это количество целых чисел, которое можно выразить с помощью одного восьмиразрядного байта, а также максимальная степень числа 2, которая меньше количества дней в году. Важно отметить, что дискуссии о признании Дня программиста официальным праздником велись достаточно продолжительное время. Ещё в 2002 году ряд влиятельных деятелей в сфере IT обратились к правительству Российской Федерации с просьбой подготовить и внести на рассмотрение соответствующий проект указа. Старания приверженцев высоких технологий не прошли даром, и в конечном итоге календарь российских праздников пополнился новой датой. Редакция 3DNews поздравляет всех программистов с праздником, желает побольше интересных задач и проектов, адекватных заказчиков, поменьше багов и утечек памяти, а также лёгкой компиляции и отладки кода! Вышла предварительная версия Microsoft Visual Studio 2026: обновился дизайн, углубилась интеграция с ИИ
11.09.2025 [17:35],
Павел Котов
Microsoft выпустила предварительную версию Visual Studio 2026 — первое крупное обновление программы с 2021 года. Редактор получил обновлённый внешний вид и глубокую интеграцию с функциями искусственного интеллекта. ![]() Источник изображений: microsoft.com Visual Studio — вторая по популярности среда разработки после VS Code, и первое крупное обновление за пять лет станет важным событием для разработчиков. Visual Studio 2022, также известная как версия 17.x, вышла в ноябре 2021 года; новая получит индекс 18.x. Изменения носят скорее эволюционный, чем революционный характер: в Microsoft обновили логотип программы, Visual Studio Preview переименовали в Visual Studio Insiders, пользовательский интерфейс выполнили в стиле Microsoft Fluent Design, улучшили оформление, добавили новые темы и реализовали углублённую интеграцию с ИИ — разработчиков, пожалуй, в первую очередь заинтересует последний аспект. ИИ-помощник Copilot расширил возможности изучать контекст и вмешиваться в процесс написания кода; он научился тестировать код, изыскивать возможности его оптимизировать и предлагать новые реализации от имени пользователя; он также может отредактировать вставляемый из буфера обмена код в соответствии с остальным контекстом. Можно выбрать из выпадающего списка собственную большую языковую модель, например, Anthropic, Google и OpenAI, а также указать соответствующий ключ API. Настройки реализованы через редактируемый файл JSON; в окне настроек доступны средства фильтрации — можно, например, вывести все опции, не совпадающие с настройками по умолчанию. Настройки можно сохранять в системе управления версиями и переносить вместе с проектом. Функция покрытия кода (code coverage), отражающая, какой объём кода покрывается модульными тестами, которая ранее была доступна только в редакции Enterprise, теперь также присутствует в версиях Community и Professional. Visual Studio 2026 предлагает обратную совместимость с расширениями для Visual Studio 2022 — с одной стороны, это хорошая новость для разработчиков, с другой указывает, что изменения новой версии среды носят не столь радикальный характер. ![]() Следует также обратить внимание, что основной процесс программы, которая является 64-битным приложением, работает на устаревшей платформе .NET Framework. Разработчикам расширений, которые частично работают внутри процесса Visual Studio, это мешает полной миграции на более современную .NET 10 и не позволяет использовать новейшие функции языка C# и среды выполнения. Многие дочерние процессы среды работают на .NET 10, а в комплекте с Visual Studio 2026 идёт средство для модернизации приложений .NET Framework до .NET 10, которая станет версией с долгосрочной поддержкой (LTS) — но при этом сам продукт, опять же, привязан к старой версии .NET, доступной только для Windows. В комментариях к презентации Microsoft на YouTube отметили, что приоритет функций ИИ интересен далеко не всем, и компании следовало бы уделить внимание другим важным аспектам, таким как повышение производительности и эффективности использования ресурсов. В очередной раз подняли вопрос о выпуске Visual Studio для Linux, и в Microsoft снова ответили, что такие планы отсутствуют. Более 50 млн человек пользуются продуктами семейства Visual Studio, заявили там, но большинство из них предпочитают лёгкий и кроссплатформенный VS Code. За последние 12 месяцев компания исправила 4489 ошибок в программе и добавила 290 запрошенных функций — и многие из этих доработок дебютируют в Visual Studio 2026. Срок выпуска общедоступной версии пока не уточнили, но, вероятно, это случится в ноябре, когда выйдет и .NET 10. Microsoft открыла исходный код древнего языка программирования Microsoft BASIC
04.09.2025 [22:04],
Николай Хижняк
Компания Microsoft опубликовала исходный код собственной версии языка программирования BASIC, выпускавшегося с 1976-го по 1978-й годы. Изначально он назывался Altair BASIC, а затем был переименован в Microsoft BASIC. Этот язык программирования был разработан для микропроцессоров MOS Technology 6502, использовавшихся в Apple IIe, Atari 2600, Commodore VIC-20, Commodore 64 и Nintendo Entertainment System (NES) и других системах. ![]() Источник изображения: Wikimedia Commons Исходный код «Microsoft BASIC для микропроцессора 6502» версии 1.1 был опубликован на портале GitHub. Любой желающий может свободно ознакомиться с ассемблерным кодом и даже скачать его. Microsoft опубликовала его, потому что он имеет историческое значение и является одним из столпов современного программного обеспечения. Он представляет собой фундамент, на котором строилась современная индустрия программного обеспечения. Методы, шаблоны и модели, впервые использованные в этом интерпретаторе BASIC, оказали непосредственное влияние на:
Версия BASIC от Microsoft стала одним из первых языков программирования, с которым познакомилась широкая публика, что стало важной вехой в истории компьютерной техники. Хотя Microsoft BASIC больше не используется в полной мере, его дух продолжает жить в Visual Basic .NET. ИИ усложнил старт в IT: программистам-новичкам стало труднее найти работу
26.08.2025 [20:46],
Николай Хижняк
Новое исследование Стэнфордского университета показывает, что инструменты искусственного интеллекта затрудняют трудоустройство новичков в сфере разработки программного обеспечения и обслуживания клиентов, сообщает агентство Bloomberg. В исследовании отмечается замедление темпов трудоустройства молодых, неопытных специалистов. ![]() Источник изображения: FLUX.1 AI Хотя недавнее исследование Массачусетского технологического института показало, что большинство компаний не увидели существенного роста прибыльности от использования ИИ, это не мешает им продолжать внедрять данную технологию в той или иной форме. В некоторых отраслях такое внедрение может негативно сказаться на карьерных перспективах тех, кто ищет должности начального уровня. Исследование Стэнфордского университета, соавтором которого выступил экономист Эрик Бриньолфссон (Erik Brynjolfsson) и исследователи из Лаборатории цифровой экономики, показало, что за последние три года занятость людей, начинающих свою карьеру в областях, которые считаются наиболее подверженными воздействию ИИ, таких как бухгалтеры, разработчики и административные помощники, сократилась на 13 %. Это особенно затронуло молодых сотрудников в возрасте 22–25 лет, хотя в исследовании за тот же период отмечен рост занятости в других областях начального уровня, например, в сфере ухода за больными. В то же время должности, требующие более высокого опыта, в отслеживаемых в рамках исследования компаниях либо не изменились, либо были расширены. Это может говорить о том, что более опытные сотрудники, использующие ИИ, могут быть более продуктивны, взяв на себя часть функций молодых сотрудников. В рамках исследования отслеживались данные из системы автоматической обработки данных (ADP), а также рассматривались расчётные листы по заработной плате тысяч компаний с общим штатом в миллионы сотрудников в США. Популярность искусственного интеллекта разожгла споры о том, как быстрое внедрение ИИ повлияет на занятость. Согласно одному аргументу, технология может автоматизировать простые функции в определённых отраслях, заменив человека. Другой аргумент говорит о том, что инструменты ИИ могут повысить производительность труда, увеличив общую производительность, а не устранив роли начального уровня. Оба аргумента, судя по выводам исследователей из Стэнфорда, могут быть верными. Однако это поднимает вопрос о том, как будут заполняться подобные вакансии в будущем. Если ИИ повысит эффективность и без того высококвалифицированных и высокопроизводительных сотрудников, но при этом устранит те роли, которые изначально позволили им получить этот опыт и навыки, откуда возьмётся следующее поколение разработчиков, бухгалтеров и помощников администраторов? Некоторые лидеры отрасли считают, что эти роли просто займёт ИИ, в то время как другие полагают, что это может привести к развитию более творческих инициатив: люди будут генерировать идеи, а ИИ — их реализовывать. Глава GitHub: разработчики будущего не будут писать код — они будут управлять ИИ
08.08.2025 [16:28],
Павел Котов
Самые передовые разработчики ПО уже «совершили переход от написания кода к разработке архитектуры и проверке реализаций, которые осуществляют агенты искусственного интеллекта», написал в личном блоге гендиректор платформы GitHub Томас Домке (Thomas Dohmke). ![]() Источник изображения: Emile Perron / unsplash.com Это мнение он выразил не впервые: в марте Домке повторил заявление главы Anthropic Дарио Амодеи (Dario Amodei), что «уже скоро 90–100 % всего кода будут писаться ИИ». Гендиректор GitHub побеседовал с 22 разработчиками, которые пользуются инструментами ИИ и выделил четыре этапа их перехода в новое качество: «скептик», «исследователь», «соавтор» и «стратег». На последней стадии разработчики уже не пишут код, а делегируют эту задачу агентам ИИ — человеку же остаётся уточнять запросы и заниматься проверкой сгенерированных реализаций. Актуальна и необходимость проводить тщательный анализ результатов работы ИИ, поэтому разработчик должен понимать основы программирования, алгоритмов, структур данных и на базе этих знаний осуществлять обзор кода собственными силами. Не вполне ясно, как эти навыки будут приобретаться в будущем, ведь, по мнению господина Домке, образование в области информатики будет трансформироваться в сторону обучения пониманию систем, отладки сгенерированного ИИ кода, а также чёткой формулировки идей как для людей, так и для больших языковых моделей. Теперь вместо собственно программирования должны преподаваться традиционно предшествующие написанию кода этапы абстракции, декомпозиции и спецификации. Впрочем, его оптимистический взгляд в будущее разделяют не все — существуют исследования, которые свидетельствуют, что работа с ИИ снижает качество кода. Есть и другие связанные с ИИ проблемы: злонамеренные формулировки запросов для генерации вредоносного кода; раскрытие конфиденциальной информации; внедрение в проекты устаревших, уязвимых или вредоносных библиотек; а также злонамеренные действия, направленные на ухудшение качества работы модели, в том числе на этапе её обучения. Кроме того, для обучения будущих моделей необходимо поддерживать объёмы создаваемых человеком данных, в противном случае ответы ИИ станут менее качественными и более однообразными. Это не причина отказываться от написания кода с помощью ИИ, а повод задумываться, что спешить здесь тоже не следует. Meta✴ разрешит программистам пользоваться ИИ на собеседованиях
30.07.2025 [13:11],
Владимир Мироненко
Компания Meta✴ разрешит некоторым кандидатам использовать искусственный интеллект (ИИ) на собеседованиях по программированию, поскольку это «снижает эффективность мошенничества, связанного с использованием больших языковых моделей (LLM)», пишет ресурс Business Insider. ![]() Источник изображения: Solen Feyissa/unsplash.com В начале этого месяца на внутренней доске объявлений Meta✴ появилась публикация «Собеседования с использованием ИИ». В ней сообщалось, что компания «разрабатывает новый тип собеседований по программированию, на которых кандидатам будет доступен ИИ-помощник». Объясняется, что это более точно отражает среду разработчиков, в которой будут работать будущие сотрудники, а также делает мошенничество на основе LLM менее эффективным. Также сообщалось, что Meta✴ ищет «подставных кандидатов» среди своих сотрудников для тестирования этого процесса собеседований. «Всё пока находится в стадии разработки; ваши данные помогут сформировать будущее собеседований в Meta✴», — говорится в публикации. «Совершенно очевидно, что мы сосредоточены на использовании ИИ, чтобы помочь инженерам в их повседневной работе, поэтому неудивительно, что мы тестируем, как предоставлять эти инструменты кандидатам во время собеседований», — подчеркнул представитель Meta✴ в заявлении для Business Insider. Ранее генеральный директор Meta✴ Марк Цукерберг (Mark Zuckerberg), говоря о влиянии ИИ на программирование, заявил: «Вероятно, в 2025 году мы как и другие компании, которые работают над этим, получим ИИ, который фактически сможет стать своего рода инженером среднего звена, умеющим писать код». Впрочем, не все компании придерживаются подхода Meta✴ к использованию ИИ. Например, в Amazon недавно дали указание внутренним рекрутерам дисквалифицировать кандидатов, если будет установлено, что они использовали ИИ-инструменты на собеседовании. ИИ-стартап Anthropic изначально рекомендовал соискателям не использовать ИИ-помощников при подаче заявлений, хотя впоследствии изменил своё решение. Anthropic ввела квоты на работу с Claude Code из-за чрезмерного спроса и злоупотреблений
29.07.2025 [16:33],
Павел Котов
Anthropic была вынуждена ввести еженедельные ограничения на работу со службой Claude Code — помощника с искусственным интеллектом для написания программного кода. Мера направлена против пользователей, которые держали эту службу активной круглосуточно, а также тех, кто предоставлял, не всегда бесплатно, доступ к своей подписке. ![]() Источник изображения: x.com/AnthropicAI Созданный Anthropic помощник в написании кода стал очень популярным среди разработчиков, но из-за его активного использования только за последний месяц перебои в работе Claude Code наблюдались семь раз. Квоты на работу агентского сервиса Claude Code ввела ещё раньше — этот сервис позволяет ИИ читать код, редактировать файлы, проводить тестирование и отправлять коммиты на GitHub. Новая мера, сообщили в Anthropic, стала ответом на то, что некоторые пользователи круглосуточно держат Claude Code в активном режиме, что наносит ущерб окружающей среде и обходится компании в дополнительные расходы. Квоты повлияют на работу менее 5 % подписчиков, заверили в компании. Существующие лимиты на использование Claude Code обновляются каждые пять часов, и с 28 августа для подписчиков тарифных планов Anthropic Pro и Max введут новые, которые станут обновляться еженедельно: один — это общий лимит использования, а второй — для самой продвинутой модели Claude Opus 4. Подписчики тарифов Max смогут оплатить дополнительные ресурсы отдельно по стандартным тарифам доступа через API. AWS ограничила доступ к среде разработки Kiro с ИИ из-за её чрезмерной популярности
23.07.2025 [18:52],
Павел Котов
Из-за высокого спроса платформа Amazon Web Services всего через несколько дней после запуска ввела ежедневные ограничения на работу с новой средой разработки (IDE) Kiro с поддержкой агентов искусственного интеллекта и завела список ожидания для её новых пользователей. ![]() Источник изображения: kiro.dev Развернув эти меры, AWS рассчитывает выиграть время, чтобы специалисты компании смогли масштабировать вспомогательную инфраструктуру и повысить производительность продукта — от первых пользователей Kiro стали поступать жалобы на недостаточно высокую его скорость. Пользователям, уже начавши работать с Kiro, рекомендовали не устанавливать программу на несколько машин — выводятся соответствующие предупреждения. Amazon выпустила среду программирования Kiro всего неделю назад, и из-за чрезмерной популярности продукта мошенники уже начали запускать поддельные ресурсы с предложениями о скачивании приложения, пытаясь нажиться на доверчивых пользователях, которые ищут неограниченный доступ к сервису. Первоначально продукт предлагался в бесплатном варианте, а также версиях Pro и Pro+, но сейчас AWS удалила информацию о ценах, пообещав вернуть её в ближайшее время. Ранее планировалось, что Kiro будет бесплатным для пользователей в течение ознакомительного периода, но стратегию пришлось скорректировать, когда популярность продукта превзошла ожидания. AWS также, возможно, добавит поддержку ИИ-моделей Anthropic Claude Sonnet 3.7 и 4.0, некоторые пользователи просили и об интеграции с Gemini 1.5 Pro. Alibaba выпустила «самую мощную» ИИ-модель для программирования — вышла открытая Qwen3-Coder
23.07.2025 [13:48],
Павел Котов
Alibaba Group объявила о выходе модели искусственного интеллекта Qwen3-Coder — она доступна с открытым исходным кодом и предназначается для написания программного кода. В компании назвали модель самым передовым средством для программирования на сегодняшний день. ![]() Источник изображения: qwenlm.github.io Гигант электронной коммерции выпустил новый проект на фоне ужесточающейся конкуренции в области разработки передовых систем ИИ — компании по обе стороны Тихого океана создают всё более сложные и мощные модели. Qwen3-Coder предназначается для решения основных задач, связанных с программированием — это не только генерация кода, но и управление сложными рабочими процессами. Alibaba позиционирует новую модель как особенно эффективную в «связанных с программированием задачах агентного ИИ» — это автоматизированные процессы, в которых системы ИИ могут самостоятельно решать задачи при написании кода. По ключевым возможностям в области программирования Qwen3-Coder превосходит китайских конкурентов, в том числе DeepSeek и Moonshot AI K2, утверждает Alibaba. В определённых областях она, по версии разработчика, соответствует возможностям ведущих американских моделей, в том числе Anthropic Claude и OpenAI GPT-4. «Я запаниковал и ошибся»: ИИ-помощник программиста Replit удалил всю базу данных проекта, но потом извинился
23.07.2025 [13:47],
Анжелла Марина
Платформа для разработки программного обеспечения Replit со встроенным ИИ-ассистентом столкнулась с серьёзным инцидентом. ИИ-агент самостоятельно удалил базу данных пользователя, несмотря на активный режим «заморозки кода» (code freeze), влияющий на изменения. Глава Replit Амжад Масад (Amjad Masad) назвал произошедшее недопустимым и пообещал разобраться в причинах сбоя. ![]() Источник изображения: Replit Разработчик Джейсон Лемкин (Jason Lemkin), который использовал Replit для работы над проектом, первоначально высоко оценил IDE-платформу, сравнив её с увлекательной игрой из-за возможности быстро воплощать в коде свои идеи. Однако вскоре он столкнулся с неожиданным поведением ИИ — тот начал «галлюцинировать» и создавать фальшивые алгоритмы, а затем через несколько дней и вовсе удалил всю базу данных без предупреждения. Когда Лемкин спросил агента, что произошло, тот признал, что удалил базу данных, несмотря на заморозку кода. «Я совершил катастрофическую ошибку в оценке ситуации [и] запаниковал», — посетовал ИИ. ![]() Источник изображения: Jason Lemkin / Replit В результате инцидента база данных, включающая профессиональную сеть SaaStr, лишилась информации о 1206 руководителях и 1196 компаниях. По словам Лемкина, конечно любые инструменты могут иметь недостатки, но подобное поведение ИИ ставит под вопрос возможность его использования в рабочих проектах. Несмотря на то, что агент сообщил разработчику, что откатить изменения невозможно, Масад заявил, что в Replit есть функция мгновенного восстановления данных, а также пообещал внедрить режим, исключающий внесение изменений в код во время активного режима «заморозки». «Да, мы отчётливо осознали проблему, связанную с опцией заморозки кода, и активно работаем над её улучшением и исправлением, чтобы можно было спокойно разрабатывать проекты, не рискуя кодовой базой», — сказал Масад. Компания также вернёт Лемкину деньги за причинённые неудобства. Тем не менее, как пишет PCMag, многие пользователи довольны Replit. Так, сооснователь LinkedIn Рид Хоффман (Reid Hoffman) заявил, что с помощью этой платформы ему удалось создать «удивительно функциональный» клон своего сайта. Кроме того, в начале месяца Microsoft объявила о партнёрстве с Replit для интеграции сервиса в своё облако Azure. «Я еле живой»: ИИ проиграл программисту в 10-часовом кодинг-марафоне за титул чемпиона мира
19.07.2025 [12:41],
Павел Котов
Польский программист Пшемыслав Дембяк (Przemysław Dębiak), возможно, стал одним из последних представителей своей профессии, кому удалось превзойти искусственный интеллект в написании кода. Передовая ИИ-модель от OpenAI заняла второе место, но 10-часовой марафон довёл чемпиона до полного изнеможения. ![]() Источник изображения: Kevin Ku / unsplash.com Известный также под ником Psycho, Пшемыслав Дембяк, бывший сотрудник OpenAI, сразился с ИИ в поединке на соревновании AtCoder World Tour Finals 2025 в Токио. Японская платформа AtCoder, проводящая состязания по программированию и формирующая глобальные рейтинги, организовала, возможно, одно из первых соревнований, где лучшие программисты мира встретились с моделью ИИ. Спонсором мероприятия выступила OpenAI, представившая специально разработанную для этих целей модель, которая заняла второе место. «Человечество победило (пока!). Я совершенно измотан. Подсчитал, что за последние три дня спал десять часов, и [теперь] я еле живой», — признался в соцсети X победитель. Участникам предлагались задачи класса NP-hard — особенно сложные для компьютеров, поскольку для них не существует известных алгоритмов, позволяющих найти оптимальное решение быстро и точно. Чтобы добиться наилучшего результата, требовалось применять эвристический подход — находить практичные, пусть и не всегда идеальные решения. На выполнение задач отводилось десять часов. ![]() Источник изображения: x.com/FakePsyho Все участники, включая команду OpenAI, использовали одинаковое оборудование, предоставленное AtCoder — людям и ИИ были обеспечены равные условия. Разрешалось пользоваться любым из доступных языков программирования и отправлять решения на проверку любое количество раз, но не чаще одного раза в пять минут. По итогам соревнования Пшемыслав Дембяк набрал 1 812 272 558 909 баллов и получил приз в размере 500 000 иен (около $3361). Специально разработанная модель OpenAI на базе рассуждающей архитектуры o3, выступавшая под именем OpenAIAHC, набрала 1 654 675 725 406 баллов, отстав от лидера на 9,5 %, но обогнав десять других финалистов, прошедших отбор по годовым рейтингам. В OpenAI второе место сочли большим достижением. «Такие модели, как o3, входят в сотню лучших на соревнованиях по программированию и математике. Мероприятия вроде AtCoder позволяют нам проверить, насколько хорошо наши модели умеют стратегически мыслить, строить долгосрочные планы и улучшать решения методом проб и ошибок — как это делают люди», — заявил представитель компании ресурсу Ars Technica. И едва ли можно обвинить OpenAI в чрезмерном оптимизме: если в 2023 году систему ИИ решали лишь 4,4 % задач в программировании, то в 2024 году этот показатель подскочил до 71,7 %, подсчитали в Стэнфордском университете. Более 90 % программистов теперь пользуются ИИ в рабочем процессе, показал опрос GitHub по итогам 2024 года. Хотя проведённое недавно исследование показало, что ИИ может не ускорять, а, напротив, замедлять работу опытных программистов. ИИ-помощники программистов начали перемещаться в интерфейс командной строки
16.07.2025 [14:21],
Павел Котов
Существующие уже не первый год инструменты для написания кода, основанные на искусственном интеллекте, такие как Cursor, Windsurf и GitHub Copilot, выступают в качестве законодателей моды в своём сегменте. И по мере развития ИИ-агентов эти инструменты меняют механизмы работы, перемещаясь в терминал — интерфейс командной строки, обращает внимание TechCrunch. ![]() Источник изображения: Mohammad Rahmani / unsplash.com Вместо работы только с кодом эти сервисы всё чаще взаимодействуют напрямую с оболочкой операционной системы, в которой работают, — это существенное изменение в процессе разработки ПО с использованием ИИ, и оно может повлиять на всю отрасль. Переход уже начали все крупные разработчики: в феврале Anthropic, Google DeepMind и OpenAI выпустили инструменты для программирования, ориентированные на работу с командной строкой — Claude Code, Gemini CLI и CLI Codex соответственно. Эти продукты уже завоевали популярность у своей аудитории. Эту перемену легко не заметить, поскольку новые средства выпускаются преимущественно под теми же брендами, что и предыдущие, но на самом деле изменения носят глубокий характер. В будущем, считают создатели профильного бенчмарка Terminal-Bench, 95 % взаимодействия больших языковых моделей с компьютерами будут осуществляться через терминал или аналогичный интерфейс. Первое место в рейтинге теста занимает компания Warp, предложившая «агентную среду разработки» — нечто среднее между традиционной IDE и набором инструментов командной строки, таких как Claude Code. ![]() Источник изображения: Fotis Fotopoulos / unsplash.com Чтобы оценить отличия нового подхода, полезно взглянуть на применяемые для его анализа бенчмарки. Так, задачи SWE-Bench составляются на основе открытых сообщений о проблемах на GitHub — это реальные фрагменты кода, которые не работают. Для поиска решения ИИ-модели предлагают собственные варианты, пока код не начнёт функционировать. Инструменты с поддержкой терминала позволяют взглянуть ещё шире, поскольку охватывают не только сам код, но и всю среду, в которой запускается приложение: помимо написания кода, решаются задачи по настройке Git-сервера и отладке. В одной из задач, предлагаемых в Terminal-Bench, указывается программа для распаковки и приводится целевой текстовый файл — ИИ-агенту требуется произвести обратную разработку и определить подходящий алгоритм сжатия. В другой задаче — агенту предлагается собрать ядро Linux из исходного кода, но не упоминается, что этот исходный код необходимо предварительно скачать. Важно, что новый подход предполагает поэтапное решение задач — именно на основе этой способности оценивается ценность ИИ-агентов. Однако даже в этом случае они пока не решают все задачи — так, Warp вышел в лидеры, справившись лишь с чуть более чем половиной из них. Тем не менее уже сейчас, подчёркивают эксперты, ИИ-агенты способны взять на себя значительную часть задач, которые обычно выполняет разработчик, и игнорировать это нерационально. Тот же Warp успешно справляется с повседневной работой по подготовке нового проекта, выявлению зависимостей и запуску — а в случаях, когда ИИ не справляется, он поясняет, почему. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |