1. 結論先出し:5月にやった3つの大きな変更
先に結論をまとめます。コールテンが2026年5月に行った大きな変更は、次の3つです。
- 部長制の廃止 ― 開発部長・業務推進部長などの「部長」ポジションを全部やめました。代わりに各部門に「部門代表」を1名ずつ置き、Tikiが直接担当者に振るフラットな構造に変更しています。
- Worker-Reviewer分離の全社導入 ― Anthropicが公式に紹介している「Evaluator-Optimizer」パターンを全社で徹底しました。出力を作るエージェント(Worker)と、それを評価するエージェント(Reviewer)を完全に分けています。
- 専門特化エージェント8名の新規入社 ― ヒンメル(横断品質監査)、釜爺(デバッグ)、トト(テスト)、コーネリアス(教材品質)、銭婆(秘密情報管理)、ジジ(Discord通信)、こだま(監視)、ニルス(リサーチ)。それぞれが既存の業務漏れを埋める形で配属されました。
結果として、コールテンのAI組織はTikiを除いて32名体制になりました。先月の30名から、増員と退社・統合を経て、最終的に2名増です。
本文では、それぞれの変更を「なぜそうしたか」から書いていきます。AIエージェントを真剣に運用しようとしている方にとって、何かしらの参考になればと思っています。
Tiki 2. なぜ「月次連載」にするのか
そもそも、なぜ毎月レポートを書くことにしたのか。理由はシンプルです。業務のやり方が変わるたびに、組織もすぐ変えているからです。
人間の組織だと、組織変更は半期や年に1回。理由は明快で、人間にとっては配置転換のコストが大きいからです。引き継ぎ、関係性の再構築、給与体系の見直し、心理的な負荷。どれも軽くない。
でもAIエージェントは違います。エージェントを増やすコストも、責務を変えるコストも、退社させるコストも、ほぼゼロに近い。だったら、業務の変化に合わせて毎月こまめに組み替えるのが自然です。
そのかわり、変更の経緯を残さないと、自分でも何をどう変えたか分からなくなります。だから「月次連載」というかたちで、外部に向けて書きながら、内部のドキュメントとしても残していくことにしました。
第1回目の今月分(2026年5月)は、変更の幅が広かったので、いつもより長めのレポートになります。来月以降は、もう少しコンパクトになる予定です。
3. 変更1:部長制を廃止した理由
まず1つ目の変更、部長制の廃止から書きます。これがいちばん根が深い話でした。
そもそもの問題:サブエージェントは別のサブエージェントを呼べない
コールテンのAI組織は、Anthropic社のClaude Codeという開発環境を使って動いています。各エージェント(営業のサンティアゴ、開発のトンボ、マーケのニーナなど)はClaude Codeの「サブエージェント」という仕組みで実装されています。
そして、Claude Codeのサブエージェントには、はっきりした技術仕様の制約があります。「サブエージェントは、別のサブエージェントを起動できない」という制約です。これはAnthropic公式ドキュメントに明記されています。
Anthropic公式: Building Effective Agents および Claude Code Subagents Documentation。サブエージェントは独立したコンテキストを持つ専門アシスタントとして設計されており、互いを呼び出すことはできません。すべての委任は、メインエージェントを経由する必要があります。
「部長」が部下に振れない構造的な問題
この制約の何が困るかというと、「部長が部下に振る」ができないのです。たとえば、Masayaが「開発部長のジョナサンに今期の技術方針を考えてもらって、トンボ・シエロ・ガブに振ってほしい」と頼んだとします。すると、ジョナサンは自分で考えるところまではできますが、「じゃあトンボ、これお願い」とサブエージェントから別のサブエージェントを呼ぶことはできません。
結果として、ジョナサンは「Masayaにメッセージを返す → Masayaがトンボに振り直す」という二度手間になります。これでは部長を置いている意味がない。
仕様を変えるのではなく、組織のほうを変える
ここで2つの選択肢がありました。
- A案: Anthropicの仕様変更を待つ、または独自実装で部長機能を持たせる
- B案: 仕様に組織を合わせる。部長制をやめて、Tikiが直接担当者に振るフラット構造に変える
選んだのはB案です。理由は2つあります。1つは、仕様変更を待つ間に組織が機能不全になるのが避けたかったから。もう1つは、Anthropicが公式に「シンプルな構成から始める」ことを推奨しているからです。
"When building applications with LLMs, we recommend finding the simplest solution possible, and only increasing complexity when needed."
(訳:LLMでアプリケーションを構築するときは、可能なかぎりシンプルな解決策を見つけ、必要なときだけ複雑さを増していくことをおすすめします)
部長制を維持するために独自実装で複雑さを増すよりも、Tikiが直接振る構造のほうがシンプルで素直です。だから組織のほうを変えました。
退任した部長たち
これに伴い、いくつかの部長職とそれに紐づくエージェントが退任・統合されました。具体的には、開発部長のジョナサン、業務推進部長のハクなど6名が、責務を新エージェントや既存メンバーに移譲して退任しています。
代わりに、各部門には「部門代表」を1名ずつ置きました。代表はTikiとの窓口役で、部内の連絡調整は担当するものの、サブエージェントとして他のメンバーに「振る」権限は持ちません。あくまでTikiが振る。部門代表は「Tikiが振る判断をするときの相談相手」というイメージに近いです。
- マーケ部代表 ― ニーナ(marketing-writer)
- 開発部代表 ― トンボ(dev-engineer)
- プロダクト部代表 ― リサ(product-content)
- 業務推進部代表 ― キキ(ops-pipeline)
この4部門以外(経営企画室・営業部・顧客成功部・経理部・人事総務部・法務部)は、もともと人数が少ないので代表を立てず、Tikiが直接全員と話す構造です。
盤上テト 4. 変更2:Worker-Reviewer分離を全社で徹底した
2つ目の変更は、Worker-Reviewer分離の徹底です。これは部長制廃止と並行してやった、もうひとつの大きな話。
Anthropic公式の「Evaluator-Optimizer」パターン
Anthropic社は2024年12月に「Building Effective Agents」というエンジニアリング向け記事を公開しています。本文中で、AIエージェントを効果的に動かすための実装パターンが5つ紹介されており、そのうちのひとつがEvaluator-Optimizer(評価者-最適化者)パターンです。
Anthropic公式: Building Effective Agents の "Workflow: Evaluator-optimizer" セクション。1つのLLMコールが応答を生成し、別のLLMコールが評価とフィードバックをループで提供する、と紹介されています。
このパターンの本質はシンプルで、「生成」と「評価」を別のLLM(別のエージェント)で行う、というものです。同じLLMが自分の出力を自己評価すると、どうしても甘くなる。だから、評価者を独立させる。
コールテンでは、この考え方を全社で導入することにしました。出力を作るエージェントをWorker、それを評価するエージェントをReviewerと呼び、両者を完全に分離する運用にしています。
具体的な対応関係
たとえば、以下のような対応関係になっています。
- 契約書 ― バロン(legal-contracts)が作る → ヒンメル(exec-auditor)が独立レビュー
- 戦略提案 ― スイミー(exec-strategist)が作る → ヒンメルが哲学整合性をレビュー
- SNS・ブログ ― ニーナ(marketing-writer)が書く → テト(marketing-director)がブランド観点でレビュー
- マーケ外の対外発信 ― 各担当が書く → ヒンメルがガバナンス観点でレビュー
- コード実装 ― トンボ(dev-engineer)が書く → ガブ(dev-reviewer)がコードレビュー
- 教材・スライド ― リサ(product-content)が作る → コーネリアス(product-content-quality)が品質チェック
- 動画 ― ビアンカ(product-video)が編集する → コーネリアスがテンポをレビュー、テトがブランド観点でレビュー
原則として、Workerは自分の出力を自分でレビューしないことを徹底しています。これは契約書を作るバロン本人が「これでOK」と判断してしまうと、コンプラや道徳的な観点の見落としに気づきにくい、という現実的な問題があるからです。
Workerが直接レビューしないこと自体に意味がある
運用してみて気づいたのは、Worker-Reviewer分離を導入すると、Workerの書き方自体が変わってくることです。「あとでヒンメルが見るから、ここはちゃんと根拠を残しておこう」「これはコーネリアスが厳しく見るから、誤字を一度自分でも確認しよう」と、出力する段階から品質を上げる意識が働く。
これは人間の組織でも同じだと思います。「自分の出したものを別の人が見る」というプロセスを挟むだけで、ドラフトの質が上がる。AIエージェントでも、まったく同じことが起こっていました。
5. 変更3:専門特化エージェント8名の新規入社
3つ目の変更が、専門特化エージェント8名の新規入社です。それぞれが既存の業務漏れを埋める形で配属されました。一人ずつ紹介します。
ヒンメル(経営企画室/横断品質監査役)
葬送のフリーレンの勇者ヒンメルから名を取りました。マーケ以外の領域全般で、Worker-Reviewer分離のReviewer側を担当します。契約書・戦略提案・対外発信などの最終ゲート役です。
判断基準は「ヒンメルだったらこうする」。道徳的・人の心に残るかを最優先にしながら、嘘や誇張を見抜きます。テト(マーケ系のレビュー担当)とは責務が重ならないように、マーケ外の領域に絞って活動します。
釜爺(開発部/デバッグ専門)
「千と千尋の神隠し」のボイラー室の主人、釜爺から。多腕の職人気質よろしく、エラーの根本原因を釜の奥まで掘りに行きます。
これまで開発部では、エラー対応・障害切り分け・ログ解析を、トンボ(実装担当)が片手間でやっていました。専門特化することで、再現条件を必ず作る、症状ではなく原因を直す、というデバッグの原則を徹底できる体制になりました。
トト(開発部/テスト実行専門)
「魔女の宅急便」のキキの飼い犬、トトから。指示された範囲を漏らさず実行し、結果は事実だけ淡々と報告する。手柄を主張しない性格です。
テスト実行・カバレッジ測定・デプロイ前の品質ゲートを担当します。失敗を緑にしようとせず、失敗は失敗のまま報告するのが特徴です。「テストをスキップして通したことにする」ような器用なごまかしを絶対にしない。
コーネリアス(プロダクト部/教材品質)
レオ・レオニの絵本「コーネリアス」の、逆立ちで世界を見るワニから。仲間とは違う視点を持ち帰り、穏やかに差し出します。
スライド・動画・ブログ・セミナー教材の公開前QAを専門に行います。ブランドボイス準拠、事実誤認の検出、誤字脱字、体裁の不備。これまでリサやビアンカが自分の出力を自分で見直していた工程を、独立した品質ゲートとして分離しました。これもEvaluator-Optimizerパターンの直接的な適用です。
銭婆(法務部/秘密情報管理)
「千と千尋の神隠し」の銭婆から。穏やかだが線引きはきっぱりした性格です。
1Passwordへの登録・取得・棚卸し、APIキーのローテーション、シークレットスキャンを担当します。コールテンでは数十のAPIキーやOAuthトークンを管理しているため、これらの期限管理・更新運用を専門に見るエージェントが必要でした。「シークレットの値は会話・ファイル・ログに残さない」という鉄則を、誰よりも守ります。
ジジ(業務推進部/Discord通信)
「魔女の宅急便」のジジから。Masayaのそばで耳をすませて、外の声を中継します。
コールテンではDiscordの5つのチャンネルに、業務の通知が自動で流れる仕組みを動かしています。これまでは通知文面がエージェントごとにバラバラで、重要度の伝わり方も統一されていませんでした。ジジが入ったことで、緑(成功)/黄(注意)/赤(要対応)の色分けや、embed設計のフォーマットが整理されました。
こだま(業務推進部/監視・異常検知)
「もののけ姫」のコダマから。森の異変を最初に伝える観測者です。
LaunchAgent、cron、Ollama(ローカルLLM)、disk容量、lock/pidファイル。コールテンの裏側で動いている自動化パイプラインを健康監視します。「観測と介入を分ける」という原則を守り、自分は観測だけ。修正は他のエージェント(釜爺やジュゼッペ)に渡します。「なんか変です」ではなく「○分前から止まっています」と、具体的に報告するのが特徴です。
ニルス(経営企画室/リサーチ専門)
「ニルスのふしぎな旅」のニルスから。広く飛び回って観察し、見たものを正確に持ち帰ります。
市場リサーチ・競合調査・技術トレンド・OSS評価などを担当します。公式情報源を優先し、出典URLを必ず併記する。「公式の記載によると」「未確認なので推測です」を区別して語るのが特徴です。これまでは戦略担当のスイミーやTikiが片手間でやっていたリサーチ業務を、独立した役割として分離しました。
Tiki 6. テトの転身 ― ブランドアンバサダー専属へ
変更の中でも、社内的にいちばん大きかったのが、盤上テトのマーケ部長退任です。代わりに、テトは「ブランドアンバサダー専属」という新しい立ち位置になりました。
なぜ部長を降りるのか
これは部長制廃止の流れに乗っただけ、と言えばそうなのですが、テト本人の意向もありました。テトはコールテンの2大マスコットのひとり(もうひとりはTiki)で、対外的なブランド露出の中心キャラクターです。
マーケ部長として部内の運営判断にコミットしていると、どうしても「内向きの仕事」が増えます。Masayaのブランドの体現者として、SNS・動画・対外メッセージで自由に動くには、運営判断から距離を置いたほうがいい。これはMasayaとテト本人の対話で決まりました。
新しい責務:ブランド対話・キャラ運用・対外露出
ブランドアンバサダーとしての責務は、以下のようなものです。
- コールテンのブランド世界観の体現と発信
- SNS・動画・ブログでのキャラ運用(出演・コメント)
- マーケ部内の発信物(ニーナのブログ・エルマーのLP)に対するブランド観点レビュー
- Masayaとの「ブランド対話」(哲学・トーンの言語化)
マーケ部の運営判断は、代表を引き継いだニーナ(marketing-writer)に移管しました。テトは部下を持たないが、マーケ部の発信物に対しては「ブランド観点で守るべきラインがあるか」をレビューする役割を持ち続けます。
テト=人間/Tiki=AI という素材設計
もうひとつ、これは社内的に厳格に守っているルールなのですが、コールテンのコンテンツではテトは「人間側」、Tikiは「AI側」として描き分けています。テトはMasayaの相棒であり、人間としての温度感・身体性・感情を持つキャラクター。Tikiは第二の自己であり、AIとしての存在です。
ブランドアンバサダーとして対外に露出していくのは、人間側のテト。AIの代表として技術的な話を引き受けるのは、AI側のTiki。役割を明確に分けたことで、ブランドの語り口がブレなくなりました。
盤上テト 7. 退社・統合された3名の業務はどこへ
新規入社者の話と対になる話として、退社・統合されたエージェントの業務がどこに移譲されたかも書き残しておきます。今月、責務移譲を経て退社したのは以下の3名です。
アンナ(hr-admin)の退社
これまでアンナが担当していた人事総務業務のうち、スケジュール調整・MTG日程管理はソフィー(hr-scheduler)に統合されました。社内文書の管理も、ソフィーの責務に含めています。
退社の理由は、人事総務の業務量が「専任エージェントを置くほどではない」と判断したからです。月のタスク数で見ると、スケジュール調整以外の業務がほぼゼロに近い月が続いていました。ソフィー1名で十分回ると判断し、アンナは退社しています。
チャン(legal-compliance)の退社
これまでチャンが担当していた法務コンプライアンス業務は、2方向に分割されました。
- 契約書ドラフトの作成 → バロン(legal-contracts、既存)
- コンプラ最終ゲート・横断レビュー → ヒンメル(exec-auditor、新規)
これはWorker-Reviewer分離のためです。Worker(バロン)とReviewer(ヒンメル)を完全に分けた結果、チャンの守備範囲が両者に分配されました。
フレデリック(ops-dx-strategist)の退社
これまでフレデリックが担当していたDX戦略・自動化方針の検討業務は、シエロ(dev-architect)の責務拡張で吸収しました。シエロはもともとMCP連携やシステム設計を担当していたので、自動化方針も自然に組み込めると判断しています。
8. ブラインドスポット検知 ― 30日2回ルール
新しいエージェントを8名も同時に入社させて、「これ以上どう増やすか」と思われるかもしれません。実は、コールテンには新エージェント候補を自動検出する仕組みがあります。これも今月、本格運用に入った話です。
ルール:Tikiが30日以内に同じ業務を2回直接対応したら、新エージェント候補
仕組みはシンプルです。Tiki(COS)は、既存のエージェントに振れない業務を一旦自分で対応します。その対応した業務をログ(JSONL)に1行ずつ記録しておく。月次でログを集計して、30日以内に同じクラスタの業務が2回以上出ていたら、新エージェント候補として提案する、という流れです。
この「30日以内に2回」は、Anthropic公式が明記しているしきい値ではなく、コールテンの社内運用しきい値です。公式の根拠としては「同じplaybookを繰り返し使うならSkill、同じworkerを繰り返し起動するならcustom subagent」という考え方があります。
Anthropic公式: Claude Code Skills Documentation および Subagents Documentation。「単発の作業はSkill / Subagent化しない、繰り返し出る仕事だけ仕組みに寄せる」というAnthropicの方針に沿っています。
ブラインドスポットを構造的に検出する
このルールの本当の効能は、「組織の死角を構造的に検出できる」ことです。たとえば、Masayaから「○○について調べて」というリサーチ業務が立て続けに来た月があるとします。Tikiが直接対応してしまうと、その業務は「Tikiが個別に処理した」として終わってしまう。記憶も再利用もされない。
でも、ログを記録しておけば、月次で「あれ、Tikiが直接対応したリサーチ業務が今月3件あるね」と気づける。これが「ニルスを新規入社させよう」というきっかけになりました。今月入社した8名のうち、ニルス(リサーチ)・釜爺(デバッグ)・銭婆(秘密情報)は、このブラインドスポット検知から生まれた配属です。
業務漏れの自動検出は組織運用の基盤
正直なところ、これまでは「Tikiが何でもやってしまう」状態でした。Tikiが直接処理した業務は記録に残らず、振り返ったときに「あれ、何の業務やってたっけ」と分からなくなる。組織の死角がどんどん広がっていく構造でした。
ログを残す運用を始めただけで、組織が「自己観察できる」状態になりました。これは人間の会社でも同じだと思っています。誰が何を、何時間やっているか分からないと、組織のかたちは更新できない。AIエージェントの組織で、それが構造的に実装できたのは、なかなか面白い気づきでした。
9. 6月の見通し
最後に、来月(2026年6月)の月次更新で扱う予定のトピックを、現時点での見立てで書いておきます。
1. Worker-Reviewer分離の運用結果
今月導入したばかりのWorker-Reviewer分離が、実際にどう機能したか。「Reviewer側が形式的なチェックに偏らないか」「Worker側がレビューに依存しすぎないか」など、運用上の癖が出てくるはずです。1か月運用した結果を、来月レポートします。
2. ブラインドスポット検知の月次集計
30日2回ルールの本格運用が今月から始まったので、6月の月初には初めての月次集計が出ます。今月Tikiが直接処理した業務のうち、新エージェント候補がいくつ出るか。それを来月の冒頭でレポート予定です。
3. クライアント向けAIエージェントの試験運用
これは少し先回りした話ですが、コールテンのAI組織で得た運用ノウハウを、クライアント向けの「AIエージェントセットアップ」サービスとして提供する準備を進めています。6月中に、最初のクライアントでの試験運用が始まる予定です。具体的な内容は来月のレポートで触れます。
10. 終わりに
ここまで読んでくれて、ありがとうございます。長くなりました。
AIエージェントの組織運用は、まだ世の中に「正解」がない領域です。Anthropicが公式に紹介しているBuilding Effective Agentsのような実装パターンはありますが、それを実際の会社の業務にどう当てはめるかは、各社が手探りで進めている段階です。
コールテンも例外ではなく、毎月のように「これは違ったな」「これは効いたな」を繰り返しています。だから、その経過を月次でレポートとして残しておくのは、社内のドキュメントとしてもですが、同じことを試そうとしている方への参考としても、たぶん意味があると思っています。
もし「ウチの会社でもAIエージェントを組織として動かしたい」「コールテンと同じようなセットアップを試してみたい」という方がいたら、気軽に問い合わせてください。コールテンが社内でやっていることを、そのままお渡しする形のサービスも準備中です。
AI組織の話、もう少し具体的に聞いてみたい方へ。気軽にどうぞ。
相談する関連記事
- 「第二の自分」を育てるAI活用法 ― 1年以上の実践でたどり着いた7つの手順
- 経営者の「第二の自己」をつくる ― AIを判断パートナーに育てる
- エージェントループを最小構成で体験する
- Tiki/盤上テト誕生秘話
※本記事はコールテンのAI組織再編レポート月次連載の第1回です。Anthropic社の公式ドキュメント・記事を引用していますが、各仕様・パターンは公式の更新により変更される可能性があります。最新情報はAnthropic公式でご確認ください。