Кратко
- Вычисления = власть в эру Agent ≈ кто за единицу времени завершает больше «ходов модели + ходов инструментов + параллельных веток» — не только кто арендует больше GPU.
- Счёт Agent часто складывается из трёх временных налогов (time tax): налог модели (tokens), налог процесса (Harness/toolchain), системный налог (меж-GPU/межмашинная связь) — снизить один слой недостаточно.
- Закон Tao (τ) (Huawei ISCAS 2026): устройства→схемы→чипы→системы вокруг масштабирования времени (τ); logic folding и Lingqu / Unified Bus бьют по τ на уровне чипа и кластера.
- Ценность Lingqu — единая семантика памяти + более тонкий стек протоколов, смягчает memory wall и communication wall; важно для обучения и оркестрации Agent, но не ускорит IDE-плагин завтра.
- Когда compute дешевеет, ждите параллельных Agents, always-on аватаров, смешанных super-node обучение/инференс; сегодня: не стекать Harness + суточная аренда cloud Mac для измерения параллелизма (чеклист в конце).

1. Почему Agents в эру Claude Code так «едят compute»?
Многие списывают весь счёт на «модели дорогие». Верно — неполно. Больно другое: вы задали один вопрос, а система прогнала целый pipeline.
Coding Agents вроде Claude Code, Cursor Agent и Codex CLI нагружены куда сильнее, чем «написать сниппет»:
- Многоходовое рассуждение: каждый ход перечитывает контекст, планирует, пишет патчи; Prefill/Decode повторяются; длинный контекст → дольше до первого token;
- Усиление toolchain: чтение repo, grep, тесты, MCP, файлы — каждый tool call = «малый inference + большой I/O»; десять tool-turns легко превосходят один «большой чат»;
- Накладка Harness: напр. Hooks и Skills ECC при save/смене сессии; хорошо настроен = ускоритель, наслоен = тормоз;
- Параллель и remote: несколько worktree, sub-Agents, удалённые Runner — локальная оркестрация, выполнение в DC, плюс SSH/MCP, git sync, доставка логов.
1.1 Три «временных налога»: модель, процесс, система
Разбив счёт Agent, проще расставить приоритеты — и ясно, какой слой бьёт закон τ:
| Налог | Типичные симптомы | Кто оптимизирует | Что контролируете сегодня |
|---|---|---|---|
| Налог модели | Длинный контекст, много ходов, дорогой routing модели | Вендоры моделей, квантизация, speculative decode | Урезать prompts, делить сессии, выбрать tier |
| Налог процесса | Цепочки Hooks, повтор eval, retry инструментов | Harness типа ECC, нормы команды | Harness одним путём; PoC перед полным rollout |
| Системный налог | Multi-GPU sync, межмашинный RPC, копии KV/состояния | NVLink/RDMA, будущий interconnect класса Lingqu | Меньше лишней cross-machine оркестрации; сборки на выделенных Runner |
Закон Tao (τ) и Lingqu в основном бьют по системному налогу; ECC — по налогу процесса. Купите только дороже API tier, не тронув Harness и топологию Runner — счёт растёт; отсюда «compute подешевел, почему Agent всё ещё медленный?»
1.2 Сценарий: сколько «временных платежей» за одну feature-ветку?
Допустим, Claude Code выкатывает средний PR (только структура):
- Agent читает issue + связанные каталоги (налог модели: тяжёлый Prefill);
- 3–5 tools: поиск символов, правка четырёх файлов, unit-тесты (налог модели + процесса: Hooks на каждом шаге);
- Тесты падают → ещё 2 итерации (налог процесса: повтор контекста и eval);
- Параллельно
xcodebuildна удалённом cloud Mac для iOS (системный налог: логи и артефакты через сеть).
GPU не был загружен 8 часов подряд, но вы ждали 8 часов — инструменты, Hooks, удалённая сборка. Повествование о compute в эру Agent смещается с «пик FLOPs» на end-to-end время завершения хода.
«Вычисления = власть» в 2026: кто за единицу времени завершает больше Agent-turns и параллельных веток — быстрее поставляет. Триллион-параметровое обучение — масштаб кластера; Agent engineering — tail latency, шторм малых сообщений, воспроизводимая параллельная топология.
2. Что такое закон Tao (τ)? От геометрического к временному scaling
По публичной презентации Huawei ISCAS 2026, закон Tao (τ) переформулирует эволюцию полупроводников и электронных систем как систематическое снижение временной константы τ — сколько нужно схеме для переключения состояния. Меньший τ → больше throughput и запас эффективности при той же архитектуре.
Публичный четырёхслойный путь, сопоставленный с AI compute (сводка прессы и доклада, не бенчмарки kvmboot):
| Слой | Смысл в публичных материалах | Связь с AI |
|---|---|---|
| Устройства | Оптимизация R/C транзистора/interconnect; сжатие τ на уровне device | Эффективность, пик одного GPU, thermal limits |
| Схемы | Logic folding — укоротить проводку critical path | Эффективная плотность и частота (roadmap Kirin в talks) |
| Чипы | Co-design HW/SW; fine-grained scheduling | Inference batching, снижение bubbles |
| Системы | Lingqu / Unified Bus — единый interconnect и семантика памяти | Multi-GPU training, super-node Agent clusters, KV sharing |
Закон τ не заменяет закон Мура — когда геометрический scaling тяжелеет, KPI становится «информация приходит быстрее». Agent-разработчикам не нужно читать каждый process node, но полировка Harness не обходит bottom-layer τ; вчера ECC, сегодня τ — одна цепь сверху и снизу.
2.1 Logic folding: почему слой схем всё ещё говорит о «плотности»
Logic folding в публичных материалах: в фиксированной площади «свернуть» логику critical path в более короткие физические маршруты, срезать gate delay, поднять effective density. Нет 1:1 mapping на Agent, но влияет на edge NPU, inference accelerators, phone SoC — «tokens per watt».
Релиз Huawei также упоминает ~2031 на roadmap Kirin и narrative 381 chip (числа по официальным источникам). Вывод: следующие пять лет — конкуренция «плотнее чипы» и «быстрее системы»; оптимизация одной оси искажает закупки и архитектуру.
2.2 vs закон Мура: дополняют, не «или/или»
- Геометрический scaling продолжается, но растут marginal cost, yield и физика;
- Временной scaling делает τ KPI: быстрее switches, interconnect, тоньше SW stacks;
- Вместе возможны system-level gains вроде «+8% training, +15% inference при тех же watts» — не ещё +200 MHz на одном core.
3. Боль legacy interconnect: memory wall и communication wall
LLM training clusters опираются на NVLink, InfiniBand, RDMA — зрело. На масштабе super-node (SuperPod), multi-rack, mixed training/inference остаются две стены:
- Memory wall: логически большая память, физически sharded; cross-machine access → copy, serialize, multi-hop stacks;
- Communication wall: gradient sync, expert parallelism, Agent RPC/MCP → много малых сообщений; PCIe или classic stacks накапливают μs RTT; GPU idle — норма.
Для inference-side Agents communication wall тоже боль: bottleneck — «ждать tool results», «ждать logs remote Mac xcodebuild», «ждать git sync между worktrees». В нашей статье про parallel cloud Mac worktree: с ростом параллелизма coordination cost взрывается раньше CPU — тесно связано с system-layer τ.
3.1 Intuition interconnect: PCIe, NVLink, narrative «unified bus»
Сравнение для intuition, не benchmarks; bandwidth/latency по whitepapers вендоров.
| Подход | Сильные стороны | Слабости Agent/training |
|---|---|---|
| PCIe / classic Ethernet | Универсально, зрело, дёшево | Multi-hop stacks; высокий RTT малых сообщений; «fake shared memory» в SW |
| NVLink / IB RDMA | Высокая bandwidth collectives in/out box | Всё ещё «explicit communication»; сложная топология за пределами super-node |
| Unified bus класса Lingqu (публичное видение) | Unified addressing, native memory semantics, thinner stack | Нужен volume ecosystem; длинная интеграция с cloud stacks |
Training engineers знают «communication bubbles» (GPU ждёт AllReduce). Agent engineers должны знать «orchestration bubbles»: модель ждёт tools, Runner ждёт SSH, люди ждут, какой worktree green. Оба означают τ не упал.
4. Lingqu / Unified Bus: unified memory semantics и системы «одна машина»
Публичные talks Huawei ставят Lingqu (Unified Bus) на system layer: перестроить interconnect protocols для super-nodes с unified memory addressing и native memory semantics, резко снизив system communication latency. Некоторые материалы (вкл. preprints) связывают near-package optics (напр. Hi-ONE) и 3D folded packaging, чтобы тянуть rack-level τ от «сотен μs» к «сотням ns» — числа как order-of-magnitude narrative; проверять официальными papers.
Три engineering-предложения для AI:
- Thinner stack: меньше conversions «просто чтобы сдвинуть tensor»;
- Unified semantics: CPU, NPU, memory pools ближе к одному address space;
- Hardware-backed consistency: меньше DIY distributed locking и messaging в apps.
Если volume systems доставят:
- Training: больший effective batch, меньше comm bubbles, больше steps per kWh;
- Agent inference services: смелее multi-node sub-Agents; длиннее sessions, тяжелее toolchains, cross-node Runners — потому что «interconnect wait» tax облегчается.
Ответ на «закон τ — не только chips»: читателям важна end-to-end imperceptible latency — один клик «continue» запускает model, tools, remote build, log return; любой high-τ hop ощущается «sticky».
4.1 Если Lingqu приземлится как задумано — что станет смелее в Agent orchestration?
Engineering language, без timeline promises:
- Смелее multi-node sub-Agents: retrieval, test, security audit на разных nodes с shared KV/state pools vs копирование full context;
- Длиннее always-on sessions: memory и tool state consistent across nodes, меньше «serialize whole repo to sync»;
- Mixed training/inference: днём inference, ночью small adapter fine-tunes — realistic только если comm τ падает; иначе ops физически изолирует loads.
Наоборот: Lingqu не напишет ваш ECC PostToolUse Hook и не ускорит xcodebuild — он сокращает machine-to-machine wait. Stack Harnesses — process tax остаётся.
5. Когда compute дешевеет — как меняется стоимость Agent?
«Дешевле transistors» → «дешевле Agents» проходит фильтры:
| Статья | После падения τ/compute | Исчезает само? |
|---|---|---|
| Per-token inference | Счёт падает; длинный context affordable | Да, если вендоры передают savings |
| Multi-GPU communication | Self-hosted / private cloud clusters привлекательнее | Зависит от нового interconnect |
| Harness (ECC etc.) | Hooks всё ещё стоят времени; больше parallelism возможно | Нет — process tax остаётся |
| Engineering orchestration (cloud Mac) | Готовнее daily-lease extra machines для parallel validation | Division of labor остаётся; просто дешевле |
Итого: если закон τ держится, первыми выигрывают команды, смелые в parallelize, always-on avatars, multimodal — не auto code review. ECC важен (как пишете); Lingqu/τ (как движутся данные).
5.1 На салфетке: −30% price ≠ +30% faster delivery
Допустим API price −30%; одна feature всё ещё требует 40 Agent turns × 12 tool calls, 20% re-trigger eval via Harness:
- Model tax ≈ −30% (если passed through);
- Process tax flat or up (смелее parallelism → больше Hook fires);
- System tax зависит от remote builds — cloud Mac daily spend может вырасти, person-days упасть.
Counter-intuitive, но убедительно: cheaper compute сначала усиливает, насколько org осмеливается parallelize; без governance total cost dips then climbs. ECC и worktree guides фиксируют process tax в down-cycle.
6. Прогноз: следующая волна — не «больший chat box»
Если system τ падает 3–5 лет (logic folding, unified bus, optics), ставлю на эти формы вместо generic dialog:
| Форма | Почему | Угол kvmboot |
|---|---|---|
| Multi-Agent parallel dev | Lower marginal turn cost → N worktrees at once | Cloud Mac + ECC/Cursor |
| 7×24 personal/enterprise avatars | Always-on inference + memory sync affordable | Aligns with OpenHuman-style deploy |
| Mixed training/inference super-nodes | Lower comm τ → realistic scheduling | Large-team infra |
| Edge orchestration + cloud heavy compute | Light Harness locally, heavy build in DC | cloud Mac lease guide |
Одна строка: compute is power = у кого ниже end-to-end τ, тот делает больше Agent turns за единицу времени. Закон Tao (τ) и Lingqu отвечают на system layer; сегодня: не stack Harness, измеряйте parallelism cloud Mac daily lease до monthly Agent pile-on.
6.1 Холоднее: какие ожидания приглушить
Чтобы избежать hype, разумный скептицизм для tech leads:
- Volume и ecosystem: новые buses нуждаются в OS, drivers, clouds, frameworks; «лучший protocol» ≠ «on by default in public cloud within three years»;
- Agent bottlenecks often app-layer: bad prompts, infinite tool loops, uncached repo scans — interconnect не чинит;
- Compliance и supply chain: enterprises покупают TCO и regions, не paper nanoseconds;
- Apple ecosystem: iOS/macOS builds всё ещё нуждаются в real Macs — low system τ не заменяет dedicated cloud Mac в Agent pipelines.
Снижая hype, фиксируем story на verifiable engineering: измеряйте process tax и parallelism до погони за новыми interconnect slides.
7. Action checklist: 8 вещей сейчас без ожидания Lingqu volume
- Замерьте typical Agent task: split model wait / tools+Hooks / remote build; найдите biggest bubble;
- Harness single path: ECC или in-house — no «double Hook chains»;
- Tool allowlist: block unbounded
find /; index или submodule boundaries на big repos; - Parallelism: cloud Mac daily lease 48h test 2×16GB vs 1×24GB; turn completion time, не CPU alone;
- Split build vs inference: Claude Code на laptop,
xcodebuild/TestFlight на remote Runner; - Worktree naming и lifecycle (см. worktree guide);
- Weekly review tokens и tool-call counts, не только dollars;
- Watch Huawei/IEEE follow-ups; procurement следует τ you measured.
8. FAQ
Закон Tao (τ) — это «Moore 2.0»? Публичная формулировка: после замедления геометрического scaling временное (τ) scaling как новый принцип; оба сосуществуют — не простая замена.
Lingqu ускорит Claude Code сразу? Прямого эффекта на IDE нет. Влияет на крупные кластеры и дорожные карты чипов, косвенно через облака, цены, железо — годы, не дни.
Связь с ECC? ECC = прикладной Harness (налог процесса); τ/Lingqu = системный interconnect (системный налог). Порядок чтения: эта статья → ECC → worktree на cloud Mac.
Постоянные аватары (в духе OpenHuman) — это «compute is power»? Да. Always-on = долгий налог модели + системный налог синхронизации памяти; более низкий τ и цена единицы делают экономику 7×24 реалистичной.
Только Huawei делает unified bus? Нет. Есть CXL, UCIe, оптика стойки; Lingqu — именование Huawei на ISCAS + четырёхслойный каркас — сравнивайте модель программирования и узлы массового производства, не «лагеря брендов».
Нужно ли SMB изучать сейчас? Модель трёх налогов полезна; в закупках сначала проясните параллелизм и топологию Runner. Читайте summary статей, не каждую ревизию слайдов.
Источники? Ядро фактов: релиз Huawei ISCAS 2026; Hi-ONE, 3D-упаковка — по публичным обзорам; цифры — по официальным источникам.
9. References (external)
- Huawei official: Huawei publishes Tao (τ) Law — transistor density and system performance breakthrough (ISCAS 2026)
- kvmboot · Harness: ECC (Everything Claude Code) — worth it?
- kvmboot · parallel Agent: Remote Mac M4 parallel AI Agent worktree short-lease guide
- kvmboot · cloud Mac: Cloud Mac lease guide: Mac VPS vs dedicated Mac mini
10. Closing
ISCAS 2026 Tao (τ) Law смещает debate от «can we etch smaller nanometers» к can the whole system respond faster — isomorphic к Agent-era pain. Lingqu, if it lands as pitched, bites last slice of system tax in clusters; you still face Harness, tools, build-machine division в app layer.
Three sentences: compute is power, power sits in end-to-end τ; Agents eat compute as turns × three taxes; Lingqu and ECC each own a segment, with cloud Mac putting Apple builds in the right place. Suggested order: this article → ECC → cloud Mac worktree. After compute gets cheaper, winners parallelize boldly and govern engineering — not whoever hits «install all» first.
Пока compute не подешевел: измерьте Agent parallelism на cloud Mac
kvmboot — dedicated M4 bare-metal cloud Mac для worktree farms, remote Claude Code, release-week burst. Daily lease чтобы validate 16GB/24GB и multi-Agent peaks до weekly/monthly и Harness strategy.