redpanda-data · birdayz · May 11, 2026 · May 11, 2026 · May 11, 2026 · May 11, 2026
diff --git a/adapter/vercelaisdk/uimessagestream/handler.go b/adapter/vercelaisdk/uimessagestream/handler.go
@@ -14,6 +14,12 @@
 // packages/ai/src/generate-text/stream-text.ts and the SSE framing from
 // packages/ai/src/ui-message-stream/json-to-sse-transform-stream.ts.
 //
+// Known limitations:
+//   - Inbound tool call history from multi-turn conversations is not yet
+//     reconstructed; only text parts are forwarded to the model.
+//   - The handler calls model.GenerateEvents directly; interceptor plugins
+//     (retry, OTel) must be wired at the model level.
+//
 // Reference: https://github.com/vercel/ai
 package uimessagestream
 
@@ -36,7 +42,11 @@ import (
 // protocol. It accepts POST requests with a JSON body containing messages
 // and streams back SSE events compatible with useChat.
 func Handler(model llm.Model, opts ...Option) http.Handler {
-	cfg := &config{logger: slog.Default()}
+	cfg := &config{
+		logger:       slog.Default(),
+		maxBodyBytes: 1 << 20, // 1MB
+		maxTurns:     10,
+	}
 	for _, o := range opts {
 		o(cfg)
 	}
@@ -52,10 +62,12 @@ type Option func(*config)
 type ToolExecutor func(ctx context.Context, name string, args json.RawMessage) (json.RawMessage, error)
 
 type config struct {
-	system   string
-	logger   *slog.Logger
-	tools    []llm.ToolDefinition
-	executor ToolExecutor
+	system       string
+	logger       *slog.Logger
+	tools        []llm.ToolDefinition
+	executor     ToolExecutor
+	maxBodyBytes int64
+	maxTurns     int
 }
 
 // WithSystem sets the system prompt prepended to every request.
@@ -79,6 +91,16 @@ func WithTools(tools []llm.ToolDefinition, executor ToolExecutor) Option {
 	}
 }
 
+// WithMaxBodyBytes sets the maximum request body size in bytes. Default is 1MB.
+func WithMaxBodyBytes(n int64) Option {
+	return func(c *config) { c.maxBodyBytes = n }
+}
+
+// WithMaxTurns sets the maximum number of agentic tool-calling turns. Default is 10.
+func WithMaxTurns(n int) Option {
+	return func(c *config) { c.maxTurns = n }
+}
+
 type handler struct {
 	model llm.Model
 	cfg   *config
@@ -88,7 +110,6 @@ type handler struct {
 type chatRequest struct {
 	ID       string        `json:"id"`
 	Messages []chatMessage `json:"messages"`
-	Trigger  string        `json:"trigger"`
 }
 
 type chatMessage struct {
@@ -127,8 +148,8 @@ func (h *handler) ServeHTTP(w http.ResponseWriter, r *http.Request) {
 		return
 	}
 
-	// Limit request body to 1MB to prevent abuse.
-	r.Body = http.MaxBytesReader(w, r.Body, 1<<20)
+	// Limit request body size to prevent abuse.
+	r.Body = http.MaxBytesReader(w, r.Body, h.cfg.maxBodyBytes)
 
 	var body chatRequest
 	if err := json.NewDecoder(r.Body).Decode(&body); err != nil {
@@ -158,14 +179,14 @@ func (h *handler) ServeHTTP(w http.ResponseWriter, r *http.Request) {
 	setSSEHeaders(w)
 
 	ew := &EventWriter{w: w, f: flusher}
-	StreamModelWithTools(r.Context(), h.model, req, ew, h.cfg.logger, h.cfg.executor)
+	StreamModelWithTools(r.Context(), h.model, req, ew, h.cfg.logger, h.cfg.executor, h.cfg.maxTurns)
 }
 
 // generateMessageID creates a random 16-character hex ID for use as a messageId.
 func generateMessageID() string {
 	b := make([]byte, 8)
 	if _, err := rand.Read(b); err != nil {
-		return "msg-0000000000000000"
+		return "0000000000000000"
 	}
 
 	return hex.EncodeToString(b)
@@ -182,16 +203,19 @@ const (
 // complexity of StreamModel and StreamModelWithTools.
 type streamWriter struct {
 	ew               *EventWriter
+	logger           *slog.Logger
 	textID           string
 	reasoningID      string
 	textStarted      bool
 	reasoningStarted bool
 	textCounter      int
+	reasoningCounter int
 }
 
-func newStreamWriter(ew *EventWriter) *streamWriter {
+func newStreamWriter(ew *EventWriter, logger *slog.Logger) *streamWriter {
 	return &streamWriter{
 		ew:          ew,
+		logger:      logger,
 		textID:      "text-0",
 		reasoningID: "reasoning-0",
 	}
@@ -207,20 +231,8 @@ func (sw *streamWriter) endReasoning() error {
 	}
 
 	sw.reasoningStarted = false
-
-	return nil
-}
-
-func (sw *streamWriter) endText() error {
-	if !sw.textStarted {
-		return nil
-	}
-
-	if err := sw.ew.WriteChunk(Chunk{"type": "text-end", "id": sw.textID}); err != nil {
-		return err
-	}
-
-	sw.textStarted = false
+	sw.reasoningCounter++
+	sw.reasoningID = fmt.Sprintf("reasoning-%d", sw.reasoningCounter)
 
 	return nil
 }
@@ -258,6 +270,10 @@ func (sw *streamWriter) writeTextDelta(text string) error {
 }
 
 func (sw *streamWriter) writeReasoningDelta(trace *llm.ReasoningTrace) error {
+	if err := sw.endTextAndAdvance(); err != nil {
+		return err
+	}
+
 	if !sw.reasoningStarted {
 		if err := sw.ew.WriteChunk(Chunk{"type": "reasoning-start", "id": sw.reasoningID}); err != nil {
 			return err
@@ -286,7 +302,9 @@ func (sw *streamWriter) writeToolRequest(tr *llm.ToolRequest) error {
 
 	var input any
 	if len(tr.Arguments) > 0 {
-		_ = json.Unmarshal(tr.Arguments, &input)
+		if err := json.Unmarshal(tr.Arguments, &input); err != nil {
+			sw.logger.Warn("failed to unmarshal tool input", "toolCallId", tr.ID, "error", err)
+		}
 	}
 
 	return sw.ew.WriteChunk(Chunk{
@@ -307,7 +325,9 @@ func (sw *streamWriter) writeToolResponse(tr *llm.ToolResponse) error {
 
 	var output any
 	if len(tr.Result) > 0 {
-		_ = json.Unmarshal(tr.Result, &output)
+		if err := json.Unmarshal(tr.Result, &output); err != nil {
+			sw.logger.Warn("failed to unmarshal tool output", "toolCallId", tr.ID, "error", err)
+		}
 	}
 
 	return sw.ew.WriteChunk(Chunk{
@@ -321,7 +341,11 @@ func (sw *streamWriter) handleContentPart(part *llm.Part) error {
 	case llm.PartText:
 		return sw.writeTextDelta(part.Text)
 	case llm.PartToolRequest:
-		if err := sw.endText(); err != nil {
+		if err := sw.endReasoning(); err != nil {
+			return err
+		}
+
+		if err := sw.endTextAndAdvance(); err != nil {
 			return err
 		}
 
@@ -340,12 +364,15 @@ func (sw *streamWriter) closeSpans() {
 	if sw.reasoningStarted {
 		_ = sw.ew.WriteChunk(Chunk{"type": "reasoning-end", "id": sw.reasoningID})
 		sw.reasoningStarted = false
+		sw.reasoningCounter++
+		sw.reasoningID = fmt.Sprintf("reasoning-%d", sw.reasoningCounter)
 	}
 
 	if sw.textStarted {
 		_ = sw.ew.WriteChunk(Chunk{"type": "text-end", "id": sw.textID})
 		sw.textStarted = false
 		sw.textCounter++
+		sw.textID = fmt.Sprintf("text-%d", sw.textCounter)
 	}
 }
 
@@ -388,7 +415,7 @@ func StreamModel(ctx context.Context, model llm.Model, req *llm.Request, ew *Eve
 		return
 	}
 
-	sw := newStreamWriter(ew)
+	sw := newStreamWriter(ew, logger)
 
 	for event, err := range model.GenerateEvents(ctx, req) {
 		if err != nil {
@@ -398,6 +425,8 @@ func StreamModel(ctx context.Context, model llm.Model, req *llm.Request, ew *Eve
 
 			logger.Error("stream error", "error", err)
 
+			sw.closeSpans()
+
 			_ = ew.WriteChunk(Chunk{"type": "error", "errorText": "An error occurred"})
 			_ = ew.WriteChunk(Chunk{"type": "finish-step"})
 			_ = ew.WriteChunk(Chunk{"type": "finish", "finishReason": finishReasonError})
@@ -419,7 +448,7 @@ func StreamModel(ctx context.Context, model llm.Model, req *llm.Request, ew *Eve
 			}
 
 		case llm.StreamResetEvent:
-			if err := sw.endText(); err != nil {
+			if err := sw.endTextAndAdvance(); err != nil {
 				return
 			}
 
@@ -438,8 +467,9 @@ func StreamModel(ctx context.Context, model llm.Model, req *llm.Request, ew *Eve
 // StreamModelWithTools is like StreamModel but supports agentic tool calling.
 // When the model returns tool calls, the executor is invoked for each, results
 // are streamed to the client, and the model is called again with the results
-// appended to the conversation. This loops until the model stops calling tools.
-func StreamModelWithTools(ctx context.Context, model llm.Model, req *llm.Request, ew *EventWriter, logger *slog.Logger, executor ToolExecutor) {
+// appended to the conversation. This loops until the model stops calling tools
+// or maxTurns is reached. If maxTurns is 0, it defaults to 10.
+func StreamModelWithTools(ctx context.Context, model llm.Model, req *llm.Request, ew *EventWriter, logger *slog.Logger, executor ToolExecutor, maxTurns int) {
 	if executor == nil {
 		StreamModel(ctx, model, req, ew, logger)
 		return
@@ -449,19 +479,27 @@ func StreamModelWithTools(ctx context.Context, model llm.Model, req *llm.Request
 		logger = slog.Default()
 	}
 
+	if maxTurns <= 0 {
+		maxTurns = 10
+	}
+
 	messageID := generateMessageID()
 	if err := ew.WriteChunk(Chunk{"type": "start", "messageId": messageID}); err != nil {
 		return
 	}
 
 	messages := slices.Clone(req.Messages)
-	sw := newStreamWriter(ew)
-
-	const maxTurns = 10
+	sw := newStreamWriter(ew, logger)
 
 	for range maxTurns {
 		finishReason, toolRequests := streamToolTurn(ctx, model, req, messages, sw, ew, logger)
 
+		// finishReasonError: terminal chunks already written by streamToolTurn.
+		// "": stream aborted (ctx cancel or write failure), nothing to write.
+		if finishReason == finishReasonError || finishReason == "" {
+			return
+		}
+
 		if len(toolRequests) == 0 || finishReason != "tool-calls" {
 			_ = ew.WriteChunk(Chunk{"type": "finish", "finishReason": finishReason})
 			_ = ew.WriteDone()
@@ -476,7 +514,7 @@ func StreamModelWithTools(ctx context.Context, model llm.Model, req *llm.Request
 
 		messages = append(messages, llm.Message{Role: llm.RoleAssistant, Content: assistantParts})
 
-		if err := executeTools(ctx, toolRequests, &messages, ew, executor); err != nil {
+		if err := executeTools(ctx, toolRequests, &messages, ew, logger, executor); err != nil {
 			return
 		}
 	}
@@ -499,10 +537,6 @@ func streamToolTurn(
 		return "", nil
 	}
 
-	sw.textID = fmt.Sprintf("text-%d", sw.textCounter)
-	sw.textStarted = false
-	sw.reasoningStarted = false
-
 	var toolRequests []*llm.ToolRequest
 
 	iterReq := &llm.Request{
@@ -521,6 +555,8 @@ func streamToolTurn(
 
 			logger.Error("stream error", "error", err)
 
+			sw.closeSpans()
+
 			_ = ew.WriteChunk(Chunk{"type": "error", "errorText": "An error occurred"})
 			_ = ew.WriteChunk(Chunk{"type": "finish-step"})
 			_ = ew.WriteChunk(Chunk{"type": "finish", "finishReason": finishReasonError})
@@ -601,7 +637,7 @@ func writeToolTurnEnd(e llm.StreamEndEvent, sw *streamWriter, ew *EventWriter, l
 	return reason
 }
 
-func executeTools(ctx context.Context, toolRequests []*llm.ToolRequest, messages *[]llm.Message, ew *EventWriter, executor ToolExecutor) error {
+func executeTools(ctx context.Context, toolRequests []*llm.ToolRequest, messages *[]llm.Message, ew *EventWriter, logger *slog.Logger, executor ToolExecutor) error {
 	toolResponseParts := make([]*llm.Part, 0, len(toolRequests))
 
 	for _, tr := range toolRequests {
@@ -620,7 +656,9 @@ func executeTools(ctx context.Context, toolRequests []*llm.ToolRequest, messages
 
 		var output any
 		if len(result) > 0 {
-			_ = json.Unmarshal(result, &output)
+			if err := json.Unmarshal(result, &output); err != nil {
+				logger.Warn("failed to unmarshal tool result", "toolCallId", tr.ID, "error", err)
+			}
 		}
 
 		if err := ew.WriteChunk(Chunk{