Ollama представила инновационную функцию web-search subagents в интеграции с Claude Code, что позволяет агентам автономно выполнять поиск в интернете и генерировать код без вмешательства пользователя. Это развитие произошло в контексте быстрого роста инструментов на базе больших языковых моделей для программирования: Claude Code ранее продемонстрировала выдающиеся результаты, отправив 22 pull request'а (PR) за один день и 27 — накануне, где 100% кода в каждом PR было сгенерировано моделью полностью автоматически. Новая система subagents устраняет проблему утечки сырых данных JSONL из выходов подагентов, которая ранее приводила к потере сотен тысяч токенов, и обеспечивает структурированный вывод данных. Разработчики отмечают, что это достигается за счет простых оптимизаций, таких как добавление хуков для поиска определений функций на старте (аналог "grep def"), что экономит до половины токен-бюджета на навигацию по коду.
Ключевые улучшения включают стриминг кодовых диффов в реальном времени вместо ожидания полного блока, что ускоряет итерации: пользователь может прервать и скорректировать процесс на лету, повышая точность по сравнению с традиционными инструментами вроде Claude Code или Cursor. В дискуссиях подчеркивается роль harness'ов — оберток для моделей, — где fuzzy string matching оказался эффективнее хэш-префиксов или номеров строк для выбора блоков редактирования. Альтернативы, такие как Serena (с семантическим поиском и редактированием), Codescan (zero-install CLI с embeddings из Ollama) и Peen, предлагают похожий функционал с меньшим потреблением токенов. Подписки на такие сервисы, по мнению экспертов, переподписаны и субсидированы для захвата рынка, с кооперативной оптимизацией кэша между harness'ом и бэкендом, где токены остаются основным источником прибыли.
Внедрение web-search subagents в Ollama усиливает конкуренцию в сегменте автономных кодинговых агентов, снижая барьеры для разработчиков: теперь модели вроде Claude Opus интегрируются с локальными инструментами без зависимости от конкретных ОС или редакторов, полагаясь только на Node.js для чтения/записи файлов. Для рынка это означает рост производительности на 5–14% по бенчмаркам (включая не только find-replace, но и общие задачи), с потенциалом комбинации методов для дальнейших улучшений. Пользователи получают платформо-независимые инструменты, сокращающие время на отладку и повышающие точность мелких моделей, но сталкиваются с вызовами вроде настройки GitHub Actions. Итог — переход от одиночных агентов к командам subagents, где системы вроде SOUL.md определяют роли, обеспечивая круглосуточную автономию без сложных фреймворков.
Новая функция ускоряет процесс разработки, позволяя пользователям прерывать и корректировать код на лету. Это увеличение производительности также открывает новые возможности для интеграции с локальными инструментами.
Источник: https://ollama.com/blog/web-search-subagents-claude-code

Комментарии(0)
Оставьте комментарий
Войдите, чтобы присоединиться к обсуждению