OpenClawとSymphonyで開発の一部を任せちゃう


はい、しかじろうです。

個人開発でOpenClawとSymphonyを使って、バグ修正や問題調査をAIに任せてます。あくまで個人開発の話なので、組織開発にそのまま使えるかは微妙なところ。

これはなにか

OpenClawがバグ修正とかをほぼ自動化します。

流れ

  1. Sentryにエラーが送られる
  2. OpenClawが定期的に監視する
  3. Linearにタスクを登録する
  4. Symphonyがタスクを処理してPRを作る
  5. 人間がマージして本番適用

Symphonyとはなにか

symphony はOpenAIが公開したコーディングエージェントの仕組み

Symphonyはプロジェクト作業を独立した自律的な実装実行に分割することで、チームがコーディングエージェントを監視する代わりに作業を管理することを可能にします。

Symphonyで公開されているサンプル実装は、「Linearに登録されたタスクを検知してcodexが処理してPR作る」をやってくれるelixirのサービス。起動するとlocalでcodexを使ってLinearからタスクを引っ張ってきてひたすら実装してくれる。ちょっと前に流行ったVibeKanbanに似てる。

Sentry, OpenClaw, Linearについては各自調べてください。

開発の「一部」を任せる

理想は開発の全部を任せたいけど、仕様を考えるフェーズは僕自身もわかってないことが多いので、さすがにAIに丸投げはできないのが現状の僕の理解。

でも誰がやっても同じ答えにたどり着くような問題ならAIに向いていると感じています。Sentryのエラー検知・修正とか、GitHub Actionsの異常検知とか、Google Cloudのアラート調査とかは直す内容はほぼ同じになるので、バグ修正や問題調査はめちゃくちゃ向いてます。

OpenClawとSymphonyで役割分担

最初はOpenClawに直接修正までやらせていたんだけど、プロンプトのコントロールがしづらい。急ぎじゃない修正にも勝手に着手しちゃうし、チャットでギャーギャー騒いでうるさいし、GitHubの権限も多く渡さなきゃいけないしで、意外と運用が大変だった。

そこでOpenClawは事実まとめと簡易調査結果をLinearに登録するだけにして、実際の修正はSymphonyに任せることにした。 (Codex Web + Linearの直接連携でもたぶんいけるはず。)

運用してみて

最初15分に1回くらいでOpenClawのCronでチェックさせてたらトークン消費量が半端ない。今は数時間に1回くらいチェックさせるように落ち着いている。これはプロジェクトに応じて頻度を調整すると良さそう。

当初はプルリクのマージまでOpenClawに任せてたんだけど、人間の認知を超えるスピードでプルリクがマージされてプロダクトがどんどん出来上がっちゃって、コントロール不能になった。これはやばかった。よくわからない機能がリリースされている。PAT(GitHubの大事なトークン)を利用する管理画面とか勝手に作ろうとして肝が冷えた。今のところマージだけは人間がやっている。

簡単なバグフィックスなら、気づいたときにはプルリクができているのでマージするだけ。これは素晴らしい体験だと思う。ただ、良い意味でも悪い意味でも想定を超えるプルリクが出てくるので、レビューがちょっと面倒な時もある。

なぜノウハウを公開したのか

OpenClaw自身がガチでコーディングできるようになる予定らしいので、この仕組み自体が陳腐化するかもしれないので、一旦現状公開します。

AIを使った開発の相談などはどうぞこちらへ https://x.com/shikajiro

んじゃまた。