Points clés
- Prouvez 18789 là où tourne le client : la boucle dans un conteneur n’est pas l’hôte ; notez l’URL exacte avant de déclarer la Gateway saine.
- Gelez Node 22 : alignez Volta, nvm ou l’image de base sur les notes de version OpenClaw pour que l’arbre des dépendances ne bouge pas au milieu du bail.
- Mesurez le RTT vers les endpoints modèle depuis le bail : choisissez APAC ou US Est avec la poignée TLS et la latence jusqu’au premier jeton, pas le ping seul.
- Faites monter les baux avec des preuves : quotas disque et rétention des journaux doivent monter en même temps que la durée — un démarrage à froid inutile si le SSD est plein à la deuxième semaine.

1. Garde-fou passerelle : le port 18789 dans la première heure
Le plan de contrôle et la surface WebSocket d’OpenClaw reposent souvent sur 18789. Dans les soixante premières minutes, séparez « le processus tourne » de « les clients joignent l’écouteur » : appelez /healthz ou /readyz sur le même chemin réseau que votre automatisation utilisera après votre déconnexion. Si la Gateway et la CLI vivent dans des conteneurs distincts, 127.0.0.1:18789 dans la CLI pointe vers l’espace de noms de la CLI — ce n’est pas du port-forward magique. Documentez le mode de liaison (loopback vs lan), la portée du pare-feu et la présence éventuelle d’un tunnel SSH pour que l’opérateur suivant ne devine pas.
Enregistrez trois horodatages dans le journal : démarrage du processus, première réponse saine, première session WebSocket authentifiée. Si l’écart entre le deuxième et le troisième est grand, vous payez encore de la taxe à froid dans TLS, le DNS ou la validation des jetons — pas en CPU. Gardez ces marqueurs à côté de la commande exacte depuis le portable opérateur versus depuis l’intérieur du runner ; les écarts y sont la première cause de « vert chez moi, rouge en CI ».
L’asymétrie régionale apparaît ici avant les builds. Si le trafic d’administration traverse un océan, validez tôt le MTU et le résolveur avec WireGuard et appairage passerelle pour le contrôle à distance transfrontalier : dépannage MTU, routage asymétrique, DNS en split et observation de la latence (région et dimensionnement Mac cloud) — les mêmes modes de défaillance reviennent lorsque le trafic LLM et SSH partagent un chemin contraint.
2. Environnement Node 22 : chaînes d’outils reproductibles
Figez Node 22 dans la balise d’image, .tool-versions ou le bloc d’environnement CI qui lance les helpers OpenClaw. Consignez node -v et l’empreinte du fichier de verrouillage dans le journal des changements ; les modules natifs compilés sur une majeure incorrecte échouent souvent au chargement. Une seule source de vérité pour les jetons d’auth Gateway, alignée avec la version Node, évite qu’un nouvel onboarding ne réactive d’anciennes variables d’environnement.
Installez les utilitaires centraux une fois et figez-les : caches du gestionnaire de paquets, versions des CLI globales, liaisons natives attendues par les plugins. Si vous comptez sur corepack, activez-le dans la même couche que l’épinglage Node pour que les images aval ne dérivent pas. L’objectif est qu’un autre Mac reprovisionné avec la même balise rejoue les mêmes hachages, pas des plages semver « à peu près ».
3. APAC, US Est et latence LLM
Choisissez la région depuis le bail, pas depuis la carte. Lancez un court script qui ouvre TLS vers votre fournisseur de modèle (ou le proxy d’entreprise) et capture le temps de connexion, le délai jusqu’au premier octet et le débit soutenu avec une taille de prompt réaliste. APAC l’emporte quand l’équipe et les données partagent le même fuseau macro ; US Est l’emporte souvent lorsque les API amont et les miroirs d’artefacts s’y concentrent — surtout si vous enchaînez des appels d’outils vers des services hébergés aux États-Unis. Journalisez médiane et queue (P95), car les charges OpenClaw picotent avec des invocations d’outils parallèles.
La latence modèle n’est qu’une partie de la facture : comptez combien d’aller-retours votre agent effectue par tâche. Une région légèrement plus lente avec moins de sauts vers votre dépôt Git et votre registre d’artefacts peut battre une région « LLM rapide » qui paie deux fois le TLS transatlantique par étape. Rejouez la mesure après activation des journaux et du tracing ; les agents verbeux chargent la carte réseau d’administration même lorsque le débit visible ne bouge pas.
Documentez pour chaque région testée le fuseau des opérateurs, l’emplacement du coffre de secrets et la latence vers le fournisseur d’identité : lors d’incidents nocturnes, ces trois lignes du tableur évitent de confondre « le modèle est lent » avec « le jeton met dix secondes à se renouveler parce que le résolveur regarde le mauvais DNS ». Une feuille par région suffit ; gardez-la à côté du runbook de démarrage à froid.
4. M4 16 Go contre 24 Go pendant le démarrage à froid
La mémoire unifiée absorbe des pics qui se chevauchent : installation des dépendances, processus Gateway et petits assistants d’embedding locaux. 16 Go restent viables lorsque la concurrence reste séquentielle et les caches bornés. Optez pour 24 Go lorsque vous gardez simulateurs, navigateurs ou plusieurs runners au chaud à côté de la Gateway, ou lorsque la pression swap transformerait la première heure en séance de secours. Traitez les compteurs de swap comme un signal go/no-go pendant la fenêtre d’essai, pas comme une stratégie de régime permanent.
Pendant l’heure une, exécutez une fois le pire chevauchement — installation plus sondes plus un appel LLM d’exemple — en surveillant la mémoire avec les outils qui vous font confiance (vm_stat, Moniteur d’activité ou stats conteneur). Si la compression ou le swap démarre avant la fin de la charge, réduisez la concurrence ou montez en RAM avant de signer un bail plus long ; les falaises mémoire se réparent rarement par simple réglage. Pour relier pression mémoire et gouvernance du swap sur Apple Silicon, voir Apple Silicon, runners Mac cloud : pics mémoire et gouvernance du swap — compilation, Docker et Xcode : indicateurs, dégradation et paliers RAM des forfaits.
| Palier | Profil première heure |
|---|---|
| M4 16 Go | Gateway sobre, une voie runner, plafonds de cache agressifs |
| M4 24 Go | Gateway plus installations qui se chevauchent, plus grande rétention Derived Data, sondes parallèles plus sûres |
5. Jour au trimestre : matrice de décision sur les baux
Les locations à la journée servent à invalider les hypothèses (joignabilité de 18789, graphe Node 22, queue de latence LLM). Passez à la semaine ou au mois lorsque les métriques restent vertes sur plusieurs jours calendaires. Choisissez le trimestre lorsque la gouvernance disque, les fenêtres de sauvegarde et les routes d’alerte sont déjà codées — sinon vous prépayez le chaos. Le disque et les inodes appartiennent à la même feuille que les euros : sans pente de libre espace maîtrisée, allonger le bail ne fait que reporter l’incendie.
La finance et l’ingénierie doivent partager une colonne « preuve jointe ». Les journées justifient des captures des sondes ; les renouvellements mensuels citent des tendances sur la latence de file et la pente d’espace libre ; les engagements trimestriels méritent un registre des risques d’une page (rotation des secrets, fin de vie des dépendances, changements d’endpoint modèle). S’il manque ces artefacts, raccourcissez le bail jusqu’à ce que l’habitude soit ancrée — des heures bon marché valent mieux qu’une intervention coûteuse.
| Étape de bail | Objectif | Critères de sortie pour monter d’un cran |
|---|---|---|
| Jour | Prouver Gateway, graphe Node 22, RTT LLM de base | Sondes vertes sur le chemin client réel ; pas de dérive des jetons au lendemain |
| Semaine / mois | Retries en charge, profondeur de file, volume de journaux | Latences P95 stables ; pente disque prévisible avec tâches de nettoyage |
| Trimestre | Amortissement du coût avec maturité opérationnelle | Runbook couvrant restaurations, rotation des secrets et astreinte |
6. Conclusion
Un démarrage à froid reproductible est un contrat : ports figés, runtimes épinglés, queues réseau mesurées, mémoire dimensionnée pour le chevauchement réel, et durée de bail liée à l’observabilité — pas à l’optimisme. Archivez ces artefacts dans un dépôt hors secrets, et la première heure reste ennuyeuse, ce qui est exactement le but d’une automatisation sur Mac distant.
Exécutez la liste sur du matériel qui colle au tableur
Le Mac mini M4 sur Apple Silicon offre la bande passante mémoire unifiée et la consommation au repos qui rendent tenables les dispositions Gateway plus runners, tandis que macOS empile Gatekeeper, SIP et un socle Unix familier — moins de surface d’attaque et de colle qu’avec des piles de télécontrôle Windows ad hoc. Lorsque votre matrice dit « passer au mensuel », des puces et des paliers de stockage prévisibles comptent davantage que quelques centaines de MHz de CPU en plus.
Si vous voulez des baux où 18789, Node 22 et les chemins LLM régionaux restent stables semaine après semaine, le Mac mini M4 cloud kvmboot constitue un endroit pragmatique pour valider l’échelle — voir les offres et tarifs et alignez les paliers 16 Go ou 24 Go sur le chevauchement mesuré pendant la première heure.