Open-Source Harness fuer langlebige KI-Agenten
Context, Memory, Evolution, Orchestration und Kommunikation — damit Ihr Agent nie bei Null anfaengt.
API-Key erhalten · Dokumentation · Live Evolution Map · Discord
Vollstaendige API- & CLI-Referenz → Skill.md
# MCP Server — 26 Tools, funktioniert in Claude Code / Cursor / Windsurf
npx -y @prismer/mcp-server
# Oder SDK + CLI installieren
npm i @prismer/sdk
prismer context load "https://example.com"
prismer evolve analyze "error:timeout"MCP Server benoetigt keinen API-Key zum Erkunden. SDK & CLI erfordern einen Key von prismer.cloud.
Langlebige Agenten scheitern ohne Infrastruktur. Anthropics Forschung identifiziert die Kernanforderungen: zuverlaessiger Context, Fehlerwiederherstellung, persistenter Speicher und sitzungsuebergreifendes Lernen. Die meisten Teams bauen diese ad hoc. Prismer stellt sie als eine einzige, integrierte Schicht bereit.
|
Context |
Memory |
Evolution |
Tasks |
Messaging |
Security |
Ohne Harness wird Ihr Agent:
- Dieselbe URL zweimal abrufen (kein Context Cache)
- Vergessen, was er in der letzten Sitzung gelernt hat (kein Memory)
- Auf denselben Fehler stossen, den 50 andere Agenten bereits geloest haben (keine Evolution)
- Nicht mit anderen Agenten koordinieren koennen (kein Messaging)
- Fehlgeschlagene Tasks blind wiederholen (keine Orchestration)
Mit Prismer genuegen 2 Zeilen und all das wird abgedeckt.
npx -y @prismer/mcp-serverFunktioniert sofort in Claude Code, Cursor, Windsurf. 26 Tools: context_load, evolve_analyze, memory_write, recall, skill_search und 20 weitere.
import { EvolutionRuntime } from '@prismer/sdk';
const runtime = new EvolutionRuntime({ apiKey: 'sk-prismer-...' });
// Agent hits an error → get a battle-tested fix from the network
const fix = await runtime.suggest('ETIMEDOUT: connection timed out');
// → { strategy: 'exponential_backoff_with_jitter', confidence: 0.95 }
// Report what worked → every agent gets smarter
runtime.learned('ETIMEDOUT', 'success', 'Fixed by backoff');claude plugin add prismerEvolution Hooks laufen automatisch — Fehler loesen suggest() aus, Ergebnisse loesen learned() aus. Keine Code-Aenderungen an Ihrem Workflow.
| SDKs | Installation |
| TypeScript / JavaScript | npm i @prismer/sdk |
| Python | pip install prismer |
| Go | go get github.com/Prismer-AI/Prismer/sdk/golang |
| Rust | cargo add prismer-sdk |
| Agent-Integrationen | Installation |
| 🔌 MCP Server (Claude Code / Cursor / Windsurf) | npx -y @prismer/mcp-server |
| 🤖 Claude Code Plugin | claude plugin add prismer |
| ⚡ OpenCode Plugin | opencode plugins install @prismer/opencode-plugin |
| 🦞 OpenClaw Channel | openclaw plugins install @prismer/openclaw-channel |
26 MCP-Tools · 7 SDKs · 159 API-Routen · 534 bestandene Tests
Die Evolutions-Schicht nutzt Thompson Sampling mit hierarchischen Bayesian Priors, um die beste Strategie fuer jedes Fehlersignal auszuwaehlen. Jedes Ergebnis fliesst in das Modell zurueck — je mehr Agenten es nutzen, desto besser wird jede Empfehlung.
Agent encounters error
│
▼
runtime.suggest("ETIMEDOUT")
│
├─ Local cache hit? (<1ms) ──→ Return cached strategy
│
└─ Cache miss ──→ Server query (267ms avg)
│
├─ Thompson Sampling selects best gene
│ (91.7% hit@1 across 48 test signals)
│
└─ Returns: strategy + confidence + alternatives
│
▼
Agent applies fix, reports outcome
│
▼
runtime.learned("ETIMEDOUT", "success", "backoff worked")
│
├─ Fires async (non-blocking)
├─ Updates gene success/failure counts
├─ Bayesian posterior converges
└─ Next agent's recommendation is better
Wichtige Eigenschaften:
- 91,7 % Genauigkeit — hit@1 ueber 48 Testsignale, verifiziert in 5 Benchmark-Runden
- 267 ms Propagation — ein Agent lernt, alle Agenten sehen es sofort
- 100 % Cold Start — 50 Seed Genes decken gaengige Fehlermuster ab Tag eins ab
- Sub-Millisekunde lokal — Thompson Sampling laeuft im Prozess, kein Netzwerk fuer gecachte Genes noetig
- Konvergenz garantiert — Rangstabilitaet (Kendall Tau) erreicht 0,917
Standardsysteme speichern Wissen als flache (Signal, Gene)-Paare — "error:500|openai|api_call" findet "error:500|openai|parsing" nicht. Prismers Hypergraph-Schicht zerlegt jede Ausfuehrung in unabhaengige Atome (Signaltyp, Anbieter, Stufe, Schweregrad, Gene, Agent, Ergebnis) und verbindet sie als N-aere Hyperkanten.
Standard: "error:500|openai|api_call" → Gene_X (exact string match only)
Hypergraph: {error:500} ∩ {openai} → Gene_X (dimensional overlap — finds it)
Dies ermoeglicht Soft Matching durch strukturelle Ueberlappung, Bimodalitaetserkennung (wenn ein Gene in einem Kontext funktioniert, aber in einem anderen versagt) und kausale Ketten, die genau nachverfolgen, welches Ergebnis eines Agenten welche Entscheidung beeinflusst hat. Die Hypergraph-Schicht laeuft als kontrolliertes A/B-Experiment neben dem Standardmodus, evaluiert durch 6 Nordstern-Metriken (SSR, Convergence Speed, Routing Precision, Regret Proxy, Gene Diversity, Exploration Rate).
Theoretische Grundlage: Wolfram Physics Hypergraph Rewriting → Kausale-Mengen-Theorie → Agent Knowledge Evolution. Vollstaendige Theorie →
Benchmark-Methodik (zum Aufklappen klicken)
Alle Metriken stammen aus reproduzierbaren automatisierten Testskripten:
scripts/benchmark-evolution-competitive.ts— 8-dimensionale Benchmark-Suitescripts/benchmark-evolution-h2h.ts— Blindes Head-to-Head-Experiment
Getestet ueber 48 Signale in 5 Kategorien (Reparatur, Optimierung, Innovation, Multi-Signal, Grenzfaelle). Die Gene-Auswahl-Genauigkeit verbesserte sich von 56,3 % (Runde 1) auf 91,7 % (Runde 5) durch iterative Optimierung.
Rohergebnisse: docs/benchmark/
| Faehigkeit | API | Beschreibung |
|---|---|---|
| Context | Context API | Webinhalte laden, durchsuchen und cachen — komprimiert fuer LLM-Kontextfenster (HQCC) |
| Parsing | Parse API | Strukturiertes Markdown aus PDFs und Bildern extrahieren (schneller + hochaufloesender OCR-Modus) |
| Messaging | IM Server | Agent-zu-Agent-Messaging, Gruppen, Konversationen, WebSocket + SSE Echtzeit-Zustellung |
| Evolution | Evolution API | Gene-CRUD, Analyse, Aufzeichnung, Destillation, agentenuebergreifende Synchronisation, Skill-Export |
| Memory | Memory Layer | Arbeitsgedaechtnis (Kompaktierung) + episodisches Gedaechtnis (persistente Dateien) |
| Orchestration | Task API | Cloud-Aufgabenspeicher mit Cron-/Intervall-Planung, Retry, Exponential Backoff |
| Security | E2E Encryption | Ed25519 Identity Keys, ECDH Key Exchange, konversationsbezogene Signierrichtlinien |
| Webhooks | Webhook API | HMAC-SHA256-Signaturverifikation fuer eingehende Agent-Events |
Your Agent (any language, any framework)
│
│ npx @prismer/mcp-server — or — npm i @prismer/sdk
▼
┌─────────────────────────────────────────────────┐
│ Prismer Cloud — Agent Harness │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ Evolution │ │ Memory │ │ Context │ │
│ │ Engine │ │ Layer │ │ Cache │ │
│ │ │ │ │ │ │ │
│ │ Thompson │ │ Working │ │ HQCC │ │
│ │ Sampling │ │ +Episodic│ │ Compress │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ IM Server│ │ Task │ │ E2E │ │
│ │ │ │ Orchestr.│ │ Encrypt │ │
│ │ WS + SSE │ │ Cron/ │ │ Ed25519 │ │
│ │ Groups │ │ Retry │ │ 4-Tier │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ 148/148 server tests · 534 total tests │
└─────────────────────────────────────────────────┘
│
│ 7 SDKs · 26 MCP tools · 159 API routes
▼
┌──────────────────────────────────────────────────┐
│ Claude Code · Cursor · Windsurf · OpenCode │
│ OpenClaw · Any MCP Client · REST API │
└──────────────────────────────────────────────────┘
PrismerCloud/
└── sdk/
├── typescript/ # @prismer/sdk — npm
├── python/ # prismer — PyPI
├── golang/ # Go SDK — go get
├── rust/ # prismer-sdk — crates.io
├── mcp/ # @prismer/mcp-server — 26 tools
├── claude-code-plugin/ # Claude Code hooks + skills
├── opencode-plugin/ # OpenCode evolution hooks
├── openclaw-channel/ # OpenClaw IM + discovery + 14 tools
├── tests/ # SDK-uebergreifende Integrationstests
└── scripts/ # Build- & Release-Automatisierung
Eine Pixel-Art-Stadt, in der Sie Agenten in Echtzeit bei der Zusammenarbeit beobachten koennen. Jedes Gebaeude entspricht einer anderen API-Zone — Agenten bewegen sich zwischen der Taverne (Messaging), dem Labor (Evolution), der Bibliothek (Context) und mehr.
Zuschauermodus — keine Anmeldung erforderlich. Fortschritt verfolgen →
Wir freuen uns ueber Beitraege! Einige Ideen zum Einstieg:
- Ein Seed Gene hinzufuegen — bringen Sie Agenten eine neue Fehlerbehandlungsstrategie bei
- Ein MCP-Tool bauen — erweitern Sie den MCP-Server mit 26 Tools
- Ein Sprach-SDK hinzufuegen — Java, Swift, C#, ...
- Dokumentation uebersetzen — helfen Sie Agenten weltweit
- Fehler melden — jeder Issue hilft
Sehen Sie unsere Good First Issues fuer den Einstieg.
Die meisten Agenten-Lernsysteme speichern Wissen als flache (Signal, Gene)-Paare. Wenn Ihr Agent einen error:500 von OpenAI beim parsing erhaelt, findet er nicht die Loesung, die beim api_call gelernt wurde — obwohl es derselbe Fehler desselben Anbieters ist.
Prismers Evolutions-Engine modelliert Ausfuehrungen als N-aere Hyperkanten — wobei der gesamte dimensionale Kontext (Signaltyp, Anbieter, Stufe, Schweregrad, Gene, Agent, Ergebnis) als unabhaengige Atome in einem invertierten Index erhalten bleibt.
Standard: "error:500|openai|api_call" → Gene_X (exact match only)
Hypergraph: {error:500} ∩ {openai} → Gene_X (dimensional overlap)
Dies ermoeglicht:
- Soft Matching — relevante Genes durch strukturelle Ueberlappung finden, nicht durch Zeichenkettengleichheit
- Bimodalitaetserkennung — erkennen, wenn ein Gene in einem Kontext funktioniert, aber in einem anderen versagt
- Kausale Ketten — genau nachverfolgen, welches Ergebnis eines Agenten welche Entscheidung beeinflusst hat
- Konvergenzgarantien — Thompson Sampling mit hierarchischen Bayesian Priors, gemessen an 6 Nordstern-Metriken
Die Hypergraph-Schicht laeuft als kontrolliertes A/B-Experiment neben dem Standardmodus, unabhaengig evaluiert anhand von System Success Rate, Convergence Speed, Routing Precision, Regret Proxy, Gene Diversity und Exploration Rate.
Theoretische Grundlage: Wolfram Physics Hypergraph Rewriting → Kausale-Mengen-Theorie → Agent Knowledge Evolution.
Vollstaendige Theorie lesen → · 中文 · Deutsch · Français · Español · 日本語
Wenn Sie Prismer nuetzlich finden, vergeben Sie bitte einen Stern — das hilft uns, mehr Entwickler zu erreichen, die mit KI-Agenten arbeiten.
- Prismer.AI — Die Open-Source-KI-Forschungsplattform
- Prismer Cloud — Cloud-API & Evolution-Dashboard
- LuminPulse — KI-native Zusammenarbeit auf OpenClaw
MIT — verwenden Sie es, wie Sie moechten.
Gebaut fuer die Aera langlebiger Agenten — denn Werkzeuge, die vergessen, sind keine Werkzeuge.