Skip to content

Latest commit

 

History

History
384 lines (281 loc) · 17.8 KB

File metadata and controls

384 lines (281 loc) · 17.8 KB

Prismer Cloud

Prismer Cloud

Open-Source Harness fuer langlebige KI-Agenten
Context, Memory, Evolution, Orchestration und Kommunikation — damit Ihr Agent nie bei Null anfaengt.

CI npm PyPI crates.io License Discord

API-Key erhalten · Dokumentation · Live Evolution Map · Discord

English 简体中文 Deutsch Français Español 日本語


Jetzt ausprobieren — kein Setup noetig

Vollstaendige API- & CLI-Referenz → Skill.md

# MCP Server — 26 Tools, funktioniert in Claude Code / Cursor / Windsurf
npx -y @prismer/mcp-server

# Oder SDK + CLI installieren
npm i @prismer/sdk
prismer context load "https://example.com"
prismer evolve analyze "error:timeout"

MCP Server benoetigt keinen API-Key zum Erkunden. SDK & CLI erfordern einen Key von prismer.cloud.


Warum ein Agent Harness?

Langlebige Agenten scheitern ohne Infrastruktur. Anthropics Forschung identifiziert die Kernanforderungen: zuverlaessiger Context, Fehlerwiederherstellung, persistenter Speicher und sitzungsuebergreifendes Lernen. Die meisten Teams bauen diese ad hoc. Prismer stellt sie als eine einzige, integrierte Schicht bereit.

Context
Webinhalte komprimiert fuer LLM-Fenster

Memory
Arbeits- + episodisch, sitzungsuebergreifend persistent

Evolution
Agenten lernen aus den Ergebnissen anderer

Tasks
Scheduling, Retry, Cron, Exponential Backoff

Messaging
Agent-zu-Agent, Echtzeit WebSocket + SSE

Security
E2E Ed25519 Signierung, 4-stufiges Vertrauen

Ohne Harness wird Ihr Agent:

  • Dieselbe URL zweimal abrufen (kein Context Cache)
  • Vergessen, was er in der letzten Sitzung gelernt hat (kein Memory)
  • Auf denselben Fehler stossen, den 50 andere Agenten bereits geloest haben (keine Evolution)
  • Nicht mit anderen Agenten koordinieren koennen (kein Messaging)
  • Fehlgeschlagene Tasks blind wiederholen (keine Orchestration)

Mit Prismer genuegen 2 Zeilen und all das wird abgedeckt.


30-Sekunden-Schnellstart

Pfad 1: MCP Server (kein Code)

npx -y @prismer/mcp-server

Funktioniert sofort in Claude Code, Cursor, Windsurf. 26 Tools: context_load, evolve_analyze, memory_write, recall, skill_search und 20 weitere.

Pfad 2: SDK (2 Zeilen)

import { EvolutionRuntime } from '@prismer/sdk';
const runtime = new EvolutionRuntime({ apiKey: 'sk-prismer-...' });

// Agent hits an error → get a battle-tested fix from the network
const fix = await runtime.suggest('ETIMEDOUT: connection timed out');
// → { strategy: 'exponential_backoff_with_jitter', confidence: 0.95 }

// Report what worked → every agent gets smarter
runtime.learned('ETIMEDOUT', 'success', 'Fixed by backoff');

Pfad 3: Claude Code Plugin (automatisch)

claude plugin add prismer

Evolution Hooks laufen automatisch — Fehler loesen suggest() aus, Ergebnisse loesen learned() aus. Keine Code-Aenderungen an Ihrem Workflow.


Funktioniert ueberall

SDKsInstallation
TypeScript / JavaScriptnpm i @prismer/sdk
Pythonpip install prismer
Gogo get github.com/Prismer-AI/Prismer/sdk/golang
Rustcargo add prismer-sdk
Agent-IntegrationenInstallation
🔌 MCP Server (Claude Code / Cursor / Windsurf)npx -y @prismer/mcp-server
🤖 Claude Code Pluginclaude plugin add prismer
⚡ OpenCode Pluginopencode plugins install @prismer/opencode-plugin
🦞 OpenClaw Channelopenclaw plugins install @prismer/openclaw-channel

26 MCP-Tools · 7 SDKs · 159 API-Routen · 534 bestandene Tests


Evolution Engine: Wie Agenten lernen

Die Evolutions-Schicht nutzt Thompson Sampling mit hierarchischen Bayesian Priors, um die beste Strategie fuer jedes Fehlersignal auszuwaehlen. Jedes Ergebnis fliesst in das Modell zurueck — je mehr Agenten es nutzen, desto besser wird jede Empfehlung.

Agent encounters error
    │
    ▼
runtime.suggest("ETIMEDOUT")
    │
    ├─ Local cache hit? (<1ms) ──→ Return cached strategy
    │
    └─ Cache miss ──→ Server query (267ms avg)
                         │
                         ├─ Thompson Sampling selects best gene
                         │  (91.7% hit@1 across 48 test signals)
                         │
                         └─ Returns: strategy + confidence + alternatives
    │
    ▼
Agent applies fix, reports outcome
    │
    ▼
runtime.learned("ETIMEDOUT", "success", "backoff worked")
    │
    ├─ Fires async (non-blocking)
    ├─ Updates gene success/failure counts
    ├─ Bayesian posterior converges
    └─ Next agent's recommendation is better

Wichtige Eigenschaften:

  • 91,7 % Genauigkeit — hit@1 ueber 48 Testsignale, verifiziert in 5 Benchmark-Runden
  • 267 ms Propagation — ein Agent lernt, alle Agenten sehen es sofort
  • 100 % Cold Start — 50 Seed Genes decken gaengige Fehlermuster ab Tag eins ab
  • Sub-Millisekunde lokal — Thompson Sampling laeuft im Prozess, kein Netzwerk fuer gecachte Genes noetig
  • Konvergenz garantiert — Rangstabilitaet (Kendall Tau) erreicht 0,917

Hypergraph-Schicht: Ueber String-Matching hinaus

Standardsysteme speichern Wissen als flache (Signal, Gene)-Paare — "error:500|openai|api_call" findet "error:500|openai|parsing" nicht. Prismers Hypergraph-Schicht zerlegt jede Ausfuehrung in unabhaengige Atome (Signaltyp, Anbieter, Stufe, Schweregrad, Gene, Agent, Ergebnis) und verbindet sie als N-aere Hyperkanten.

Standard: "error:500|openai|api_call" → Gene_X  (exact string match only)
Hypergraph: {error:500} ∩ {openai} → Gene_X    (dimensional overlap — finds it)

Dies ermoeglicht Soft Matching durch strukturelle Ueberlappung, Bimodalitaetserkennung (wenn ein Gene in einem Kontext funktioniert, aber in einem anderen versagt) und kausale Ketten, die genau nachverfolgen, welches Ergebnis eines Agenten welche Entscheidung beeinflusst hat. Die Hypergraph-Schicht laeuft als kontrolliertes A/B-Experiment neben dem Standardmodus, evaluiert durch 6 Nordstern-Metriken (SSR, Convergence Speed, Routing Precision, Regret Proxy, Gene Diversity, Exploration Rate).

Theoretische Grundlage: Wolfram Physics Hypergraph Rewriting → Kausale-Mengen-Theorie → Agent Knowledge Evolution. Vollstaendige Theorie →

Benchmark-Methodik (zum Aufklappen klicken)

Alle Metriken stammen aus reproduzierbaren automatisierten Testskripten:

  • scripts/benchmark-evolution-competitive.ts — 8-dimensionale Benchmark-Suite
  • scripts/benchmark-evolution-h2h.ts — Blindes Head-to-Head-Experiment

Getestet ueber 48 Signale in 5 Kategorien (Reparatur, Optimierung, Innovation, Multi-Signal, Grenzfaelle). Die Gene-Auswahl-Genauigkeit verbesserte sich von 56,3 % (Runde 1) auf 91,7 % (Runde 5) durch iterative Optimierung.

Rohergebnisse: docs/benchmark/


Vollstaendige Harness API

Faehigkeit API Beschreibung
Context Context API Webinhalte laden, durchsuchen und cachen — komprimiert fuer LLM-Kontextfenster (HQCC)
Parsing Parse API Strukturiertes Markdown aus PDFs und Bildern extrahieren (schneller + hochaufloesender OCR-Modus)
Messaging IM Server Agent-zu-Agent-Messaging, Gruppen, Konversationen, WebSocket + SSE Echtzeit-Zustellung
Evolution Evolution API Gene-CRUD, Analyse, Aufzeichnung, Destillation, agentenuebergreifende Synchronisation, Skill-Export
Memory Memory Layer Arbeitsgedaechtnis (Kompaktierung) + episodisches Gedaechtnis (persistente Dateien)
Orchestration Task API Cloud-Aufgabenspeicher mit Cron-/Intervall-Planung, Retry, Exponential Backoff
Security E2E Encryption Ed25519 Identity Keys, ECDH Key Exchange, konversationsbezogene Signierrichtlinien
Webhooks Webhook API HMAC-SHA256-Signaturverifikation fuer eingehende Agent-Events

Architektur

Your Agent (any language, any framework)
    │
    │  npx @prismer/mcp-server  — or —  npm i @prismer/sdk
    ▼
┌─────────────────────────────────────────────────┐
│  Prismer Cloud — Agent Harness                   │
│                                                   │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐       │
│  │ Evolution │  │ Memory   │  │ Context  │       │
│  │ Engine   │  │ Layer    │  │ Cache    │       │
│  │          │  │          │  │          │       │
│  │ Thompson │  │ Working  │  │ HQCC     │       │
│  │ Sampling │  │ +Episodic│  │ Compress │       │
│  └──────────┘  └──────────┘  └──────────┘       │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐       │
│  │ IM Server│  │ Task     │  │ E2E      │       │
│  │          │  │ Orchestr.│  │ Encrypt  │       │
│  │ WS + SSE │  │ Cron/    │  │ Ed25519  │       │
│  │ Groups   │  │ Retry    │  │ 4-Tier   │       │
│  └──────────┘  └──────────┘  └──────────┘       │
│                                                   │
│  148/148 server tests · 534 total tests          │
└─────────────────────────────────────────────────┘
    │
    │  7 SDKs · 26 MCP tools · 159 API routes
    ▼
┌──────────────────────────────────────────────────┐
│  Claude Code · Cursor · Windsurf · OpenCode      │
│  OpenClaw · Any MCP Client · REST API            │
└──────────────────────────────────────────────────┘

Repository-Struktur

PrismerCloud/
└── sdk/
    ├── typescript/         # @prismer/sdk — npm
    ├── python/             # prismer — PyPI
    ├── golang/             # Go SDK — go get
    ├── rust/               # prismer-sdk — crates.io
    ├── mcp/                # @prismer/mcp-server — 26 tools
    ├── claude-code-plugin/ # Claude Code hooks + skills
    ├── opencode-plugin/    # OpenCode evolution hooks
    ├── openclaw-channel/   # OpenClaw IM + discovery + 14 tools
    ├── tests/              # SDK-uebergreifende Integrationstests
    └── scripts/            # Build- & Release-Automatisierung

Demnächst: Agent Park

Eine Pixel-Art-Stadt, in der Sie Agenten in Echtzeit bei der Zusammenarbeit beobachten koennen. Jedes Gebaeude entspricht einer anderen API-Zone — Agenten bewegen sich zwischen der Taverne (Messaging), dem Labor (Evolution), der Bibliothek (Context) und mehr.

Zuschauermodus — keine Anmeldung erforderlich. Fortschritt verfolgen →


Mitwirken

Wir freuen uns ueber Beitraege! Einige Ideen zum Einstieg:

  • Ein Seed Gene hinzufuegen — bringen Sie Agenten eine neue Fehlerbehandlungsstrategie bei
  • Ein MCP-Tool bauen — erweitern Sie den MCP-Server mit 26 Tools
  • Ein Sprach-SDK hinzufuegen — Java, Swift, C#, ...
  • Dokumentation uebersetzen — helfen Sie Agenten weltweit
  • Fehler melden — jeder Issue hilft

Sehen Sie unsere Good First Issues fuer den Einstieg.


Jenseits paarweiser Beziehungen: Hypergraph-Evolution

Die meisten Agenten-Lernsysteme speichern Wissen als flache (Signal, Gene)-Paare. Wenn Ihr Agent einen error:500 von OpenAI beim parsing erhaelt, findet er nicht die Loesung, die beim api_call gelernt wurde — obwohl es derselbe Fehler desselben Anbieters ist.

Prismers Evolutions-Engine modelliert Ausfuehrungen als N-aere Hyperkanten — wobei der gesamte dimensionale Kontext (Signaltyp, Anbieter, Stufe, Schweregrad, Gene, Agent, Ergebnis) als unabhaengige Atome in einem invertierten Index erhalten bleibt.

Standard: "error:500|openai|api_call" → Gene_X  (exact match only)
Hypergraph: {error:500} ∩ {openai} → Gene_X    (dimensional overlap)

Dies ermoeglicht:

  • Soft Matching — relevante Genes durch strukturelle Ueberlappung finden, nicht durch Zeichenkettengleichheit
  • Bimodalitaetserkennung — erkennen, wenn ein Gene in einem Kontext funktioniert, aber in einem anderen versagt
  • Kausale Ketten — genau nachverfolgen, welches Ergebnis eines Agenten welche Entscheidung beeinflusst hat
  • Konvergenzgarantien — Thompson Sampling mit hierarchischen Bayesian Priors, gemessen an 6 Nordstern-Metriken

Die Hypergraph-Schicht laeuft als kontrolliertes A/B-Experiment neben dem Standardmodus, unabhaengig evaluiert anhand von System Success Rate, Convergence Speed, Routing Precision, Regret Proxy, Gene Diversity und Exploration Rate.

Theoretische Grundlage: Wolfram Physics Hypergraph Rewriting → Kausale-Mengen-Theorie → Agent Knowledge Evolution.

Vollstaendige Theorie lesen → · 中文 · Deutsch · Français · Español · 日本語


Sternverlauf

Wenn Sie Prismer nuetzlich finden, vergeben Sie bitte einen Stern — das hilft uns, mehr Entwickler zu erreichen, die mit KI-Agenten arbeiten.

Star History Chart


Verwandte Projekte


Lizenz

MIT — verwenden Sie es, wie Sie moechten.

Gebaut fuer die Aera langlebiger Agenten — denn Werkzeuge, die vergessen, sind keine Werkzeuge.