Skip to content

Latest commit

 

History

History
264 lines (191 loc) · 16.9 KB

File metadata and controls

264 lines (191 loc) · 16.9 KB

Helm 開発プロゞェクト

人ずAIでできた組織を賢くする - Helmの開発リポゞトリ

抂芁

Helmは、人の責任・刀断・意思決定に焊点を圓おたAI゚ヌゞェントです。既存のAI゚ヌゞェントがタスクや成果物を最適化するのに察し、Helmは「誰が・い぀・どう刀断するか」が曖昧で、意思決定が遅れたり歪んだりする問題を怜知し、改善したす。

䌚議やチャットから「誰が・い぀・どう刀断すべきか」の問題を怜知し、適切な人に刀断を促すシステムです。埓来の「人がAIを呌び出す」から**「AIが人を呌び出す」**ぞ転換するこずで、刀断の遅れや責任の曖昧さなどを自動怜知し、適切なタむミングで適切な人に刀断を求める仕組みを実珟したす。

「AIを賢くするのではない。"人ずAIでできた組織"を賢くする。」

䞻な機胜

① 倚角的な評䟡・刀断システムハむブリッド評䟡

Helmは、ルヌルベヌスずマルチ芖点LLMを組み合わせたハむブリッド評䟡により、芋萜ずしのない統合刀断を実珟したす。

ルヌルベヌス分析では、KPI䞋方修正回数、撀退議論の有無、刀断集䞭率などの定量的指暙に基づいお、安党偎のベヌスラむン評䟡を行いたす。

マルチ芖点LLM分析では、同じ䌚議ログずチャットログを、4぀の異なる芖点から評䟡したす

  • 経営者芖点: 党瀟の業瞟・リスク・ステヌクホルダヌ責任の芳点から評䟡
  • 経営䌁画芖点: KPI・事業ポヌトフォリオ・撀退/投資刀断の芳点から評䟡
  • 珟堎芖点: 実行可胜性ず珟堎負荷の芳点から評䟡
  • ガバナンス芖点: 報告遅延・隠れたリスク・コンプラむアンスの芳点から評䟡

これらの評䟡結果をアンサンブルスコアリング0.6×ルヌル + 0.4×LLMで統合するこずで、単䞀の評䟡軞では芋萜ずしがちな問題も、耇数の芖点から怜知できるようになりたす。怜知された問題は事前定矩されたパタヌンB1_正圓化フェヌズ、ES1_報告遅延、A2_撀退刀断の遅れなどに割り圓おられ、アラヌトが䜜成されたす。

② AIが人を呌び出し、刀断を䟝頌

刀断の遅れや責任の曖昧さなどを怜知するず、Helmは自動で圹員 / 郚長 / スタッフを特定し、刀断・承認を䟝頌したす。人がAIを監芖するのではなく、AIが䌚議やチャットの状況を監芖し、必芁なずきに人に刀断を求めるずいう逆転の発想を実珟しおいたす。責任モデルRACI・組織グラフ・承認フロヌに基づいお適切なロヌルを決定し、「なぜこの人に刀断を求めるべきか」を説明できる圢で生成したす。

③ 孊習・改善PDCAの自動化

Helmは、芳枬䌚議・チャットの取埗→ 評䟡問題怜知・スコアリング→ 介入経営局ぞ゚スカレヌション→ 実行AI自埋タスク実行→ 結果取埗再芳枬で怜蚌のルヌプを自動で回したす。どんなずきに刀断が遅れやすいか、責任が曖昧になりやすいかを孊習し、時間ずずもに刀断の仕組みそのものが改善されおいく仕組みを実珟したす。

AI自埋実行ADKベヌスのマルチ゚ヌゞェントシステム

経営局の承認埌、HelmはADK (Agent Development Kit) を䜿甚したマルチ゚ヌゞェントシステムで自埋的にタスクを実行したす

  • 調査゚ヌゞェント (ResearchAgent): 垂堎デヌタの怜玢・分析将来: Vertex AI Search
  • 分析゚ヌゞェント (AnalysisAgent): 瀟内デヌタの取埗・財務シミュレヌション将来: Google Drive API
  • 資料゚ヌゞェント: 3案比范資料の自動生成・保存
  • 通知゚ヌゞェント (NotificationAgent): メッセヌゞ生成・送信Phase1: ドラフトのみ、将来: Chat/Gmail API
  • 䌚議調敎 (CalendarAgent): 䌚議アゞェンダの曎新蚭蚈段階

Phase1実装完了: モック実装ずADK統合、フォヌルバック察応 Phase2実装予定: 実API統合Vertex AI Search、Google Drive、Chat/Gmail API

ガバナンス・運甚たわり実装枈み

Helmは「監芖ツヌル」ではなく、意思決定ガバナンスの最適化を目的ずした蚭蚈です。取埗範囲は特定プロゞェクト・ワヌクスペヌスに限定し、同意・告知を明瀺。匿名化・保持期間・監査・誀怜知時の責任境界を蚭蚈枈みです。

  • 認蚌: API Key  ロヌルX-API-Key ヘッダ。環境倉数 API_KEYS で有効化。オヌナヌキヌ1本の䟋は backend README を参照。
  • 誀怜知フィヌドバック・粟床指暙: POST /api/feedback/false-positive、GET /api/metrics/accuracy で粟床改善のためのフィヌドバックず指暙取埗。
  • 監査ログ: アクション蚘録ず GET /api/audit/logs での取埗。各゚ントリにハッシュチェヌン付䞎、GET /api/audit/verify で改ざん怜蚌可胜。
  • 取埗範囲・サプレッション: 取埗察象のホワむトリスト䌚議/チャットID、怜知のサプレッション条件パタヌンリ゜ヌスを蚭定可胜。
  • デヌタ保存期間: 原文meetings/chats/materialsはデフォルト7日で砎棄二局保持モデル。POST /api/admin/retention/cleanup による定期削陀。蚭蚈は data-retention.md。
  • 冪等性: 同䞀 approval_id に察する execute の二重実行を防ぐ蚭蚈は idempotency-execute.md。
  • 定矩ドキュメント駆動: 組織グラフ・RACI・承認フロヌを JSON で管理backend/config/definitions/。EscalationEngine が RACI に基づきタヌゲットロヌルず承認フロヌを決定し、倚段階承認をサポヌト。

将来拡匵の蚭蚈オヌナヌシップ、マルチテナント、ゞョブキュヌ、通知ポリシヌは docs/future/ を参照。

珟状の開発状況ずネクストステップ

  • 珟状: コア機胜デヌタ取り蟌み / 怜知・評䟡 / アラヌト・承認 / AI自埋実行、ガバナンス・運甚認蚌・監査・誀怜知・サプレッション・保存期間・冪等性、定矩ドキュメント組織グラフ・RACI・承認フロヌたで実装枈み。Cloud Run / Vercel デプロむ枈み。
  • ネクストステップ:
    • 短期・䞭期: ADK本実装実API統合、デモから汎甚機胜化、氞続化Firestore、䌚議調敎・䜜成
    • 長期: マルチテナント・ゞョブキュヌ・通知ポリシヌ・オヌナヌシップ蚭蚈は docs/future/

詳现は 開発状況サマリヌ ず 次のステップ を参照。

📚 ドキュメント

初めおの方はこちらから:

プロゞェクト構成

Dev/
├── app/
│   └── v0-helm-demo/          # フロント゚ンドNext.js
│       ├── app/
│       │   └── demo/
│       │       ├── case1/      # Case1デモペヌゞ
│       │       ├── case2/      # Case2デモペヌゞ
│       │       └── case3/      # Case3デモペヌゞ
│       └── lib/
│           └── api.ts         # APIクラむアント
├── backend/                    # バック゚ンドPython FastAPI
│   ├── main.py                # メむンAPI
│   ├── config/
│   │   ├── definitions/       # 組織グラフ・RACI・承認フロヌJSON
│   │   └── prompts/           # LLMプロンプトヒトが線集可胜、組織グラフず同様
│   ├── services/              # サヌビス局
│   │   ├── google_meet.py     # Google Meet統合
│   │   ├── google_chat.py     # Google Chat統合
│   │   ├── analyzer.py        # 意思決定の詰たりの怜知ルヌルベヌス
│   │   ├── multi_view_analyzer.py  # マルチ芖点LLM分析
│   │   ├── ensemble_scoring.py     # アンサンブルスコアリング
│   │   ├── llm_service.py     # LLM統合サヌビス
│   │   ├── scoring.py          # スコアリングサヌビス
│   │   ├── escalation_engine.py    # ゚スカレヌション刀断
│   │   ├── definition_loader.py    # 定矩ドキュメント読み蟌み
│   │   ├── responsibility_resolver.py  # RACI/承認フロヌ解決
│   │   ├── approval_flow_engine.py # 倚段階承認フロヌ
│   │   ├── audit_log.py       # 監査ログ
│   │   ├── evaluation_metrics.py   # 粟床指暙・誀怜知フィヌドバック
│   │   ├── retention_cleanup.py    # デヌタ保存期間に基づく削陀
│   │   ├── google_workspace.py # Google Workspace統合
│   │   ├── google_drive.py     # Google Drive統合
│   │   ├── adk_setup.py        # ADKセットアップ
│   │   └── agents/             # ADK゚ヌゞェント
│   │       ├── research_agent.py      # 垂堎デヌタ分析゚ヌゞェント
│   │       ├── analysis_agent.py     # 瀟内デヌタ統合゚ヌゞェント
│   │       ├── notification_agent.py # 通知゚ヌゞェント
│   │       ├── workflow_agent.py     # ワヌクフロヌ゚ヌゞェント
│   │       └── shared_context.py    # 共有コンテキスト
│   ├── schemas/               # デヌタスキヌマ
│   │   └── firestore.py
│   └── requirements.txt
└── Architectures/             # アヌキテクチャ蚭蚈資料

クむックスタヌト

バック゚ンドの起動

cd Dev/backend
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install -r requirements.txt
uvicorn main:app --reload --host 0.0.0.0 --port 8000

フロント゚ンドの起動

cd Dev/app/v0-helm-demo
pnpm install
pnpm dev

フロント゚ンドは http://localhost:3000 で起動したす。

システムフロヌ

デヌタ取り蟌みMeet/Chat → 怜知・評䟡ルヌルベヌス + 4ロヌルLLM → 
アンサンブルスコアリング0.6×ルヌル + 0.4×LLM → アラヌト・承認 → 
AI自埋実行4゚ヌゞェント䞊列 → 結果保存 → 再芳枬で怜蚌

評䟡システムの仕組みルヌル×LLMによるハむブリッド評䟡

1. ルヌルベヌス分析

定量的指暙KPI䞋方修正回数、撀退議論の有無、刀断集䞭率、反察意芋無芖などに基づいお、刀断の遅れや責任の曖昧さに繋がる問題を怜知したす。これは芋逃しれロの安党網ずしお機胜したす。

2. マルチ芖点LLM分析

同じ䌚議ログずチャットログを、4぀のロヌル芖点経営者、経営䌁画、珟堎、ガバナンスからLLMGeminiで評䟡したす。文脈理解により過剰反応を抑制し぀぀、数倀は正垞だが「空気が異垞」ずいったケヌスも怜知したす。

3. アンサンブルスコアリング

ルヌルベヌス結果ずLLM結果を統合しお、より保守的で信頌性の高い評䟡を実珟したす

  • スコア蚈算: 0.6 × ルヌルベヌススコア + 0.4 × LLM平均スコア
  • 重芁床・緊急床: ルヌルベヌスず各ロヌルの結果のうち、**最も安党偎最も匷い**を採甚
  • 説明文: ルヌルベヌスの説明ず䞻芁ロヌルのコメントを統合

粟床指暙のモニタリングGET /api/metrics/accuracyや誀怜知フィヌドバックPOST /api/feedback/false-positiveにより、運甚しながら重みや閟倀を校正しおいく蚭蚈です。

🚀 デプロむ枈みサヌビス

本番環境

デプロむ日

  • バック゚ンド: 2025幎2月1日
  • フロント゚ンド: 2025幎1月31日

技術スタック

バック゚ンド

  • フレヌムワヌク: FastAPI
  • 蚀語: Python 3.11
  • LLM: Google GeminiGen AI SDK。分析・タスク生成は Gemini 3 Flash、ADK゚ヌゞェントは Gemini 2.0 FlashLLM_MODEL / ADK_MODEL で倉曎可
  • ADK: Google Agent Development Kit (google-adk) - マルチ゚ヌゞェントシステム
  • Google API: google-api-python-client, google-auth-oauthlib
  • テスト: pytest
  • デプロむ: Google Cloud Run

フロント゚ンド

  • フレヌムワヌク: Next.js 16.0.10 (Turbopack)
  • 蚀語: TypeScript
  • UI: React, Tailwind CSS
  • 状態管理: React Hooks

セキュリティ

簡易脅嚁モデルず察策状況

脅嚁 察策状況 備考
認蚌 bypass 実装枈み API Key + ロヌルX-API-Key。未蚭定時は認蚌無効。
暩限逞脱 実装枈み ロヌルベヌスアクセス制埡。䌚議・チャットぞのアクセスをロヌルで分離。
デヌタ挏掩 実装枈み マスキング個人名→圹職、機埮情報、保持期間による自動削陀、原文はデフォルト7日で砎棄。
DoS / 過負荷 実装枈み レヌト制限1分あたりNリク゚スト、環境倉数 RATE_LIMIT_REQUESTS_PER_MINUTE。
コスト暎隰LLM 実装枈み 日次トヌクン䞊限環境倉数 LLM_DAILY_TOKEN_LIMIT。超えた堎合はモックフォヌルバック。
プロンプトむンゞェクション 蚭蚈枈み LLM入力は構造化デヌタに限定、ナヌザヌ自由入力は経由しない蚭蚈。
監査ログ改ざん 実装枈み 各゚ントリにハッシュチェヌン付䞎。GET /api/audit/verify で怜蚌可胜。

セキュリティ蚭蚈TODO優先床付き

  • 高: OIDC/IAP たたは Workspace 連携による認蚌匷化プロダクション向け— 未実装
  • äž­: 脅嚁モデルの詳现化ず定期レビュヌ — 本READMEに簡易版を蚘茉枈み
  • 䜎: WORM 盞圓の監査ログ保存クラりドストレヌゞ連携— 蚭蚈怜蚎䞭

関連ドキュメント


ドキュメント

提出物芁件

  • GitHubリポゞトリ公開
  • デプロむURL動䜜確認可胜
  • Zenn蚘事抂芁、アヌキテクチャ図、デモ動画・YouTube動画 — 完了・投皿枈み