[Questions] Segments files of quorum are not clean #13586

YvesZelros · 2025-03-21T10:58:51Z

YvesZelros
Mar 21, 2025

Community Support Policy

I have read RabbitMQ's Community Support Policy
I run RabbitMQ 4.x, the only series currently covered by community support
I promise to provide all relevant information (versions, logs from all nodes, rabbitmq-diagnostics output, detailed reproduction steps)

RabbitMQ version used

4.0.7

Erlang version used

27.2.x

Operating system (distribution) used

rabbitmq:4.0.7-management

How is RabbitMQ deployed?

Community Docker image

rabbitmq-diagnostics status output

rabbitmq-diagnostics status

Status of node rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh ...
[]
Runtime

OS PID: 11
OS: Linux
Uptime (seconds): 7521
Is under maintenance?: false
RabbitMQ version: 4.0.7
RabbitMQ release series support status: see https://www.rabbitmq.com/release-information
Node name: rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh
Erlang configuration: Erlang/OTP 27 [erts-15.2.3] [source] [64-bit] [smp:8:1] [ds:8:1:10] [async-threads:1] [jit:ns]
Crypto library: OpenSSL 3.3.3 11 Feb 2025
Erlang processes: 470 used, 1048576 limit
Scheduler run queue: 1
Cluster heartbeat timeout (net_ticktime): 60

Plugins

Enabled plugin file: /operator/enabled_plugins
Enabled plugins:

 * rabbitmq_prometheus
 * rabbitmq_peer_discovery_k8s
 * accept
 * rabbitmq_peer_discovery_common
 * prometheus
 * rabbitmq_management
 * rabbitmq_management_agent
 * rabbitmq_web_dispatch
 * amqp_client
 * cowboy
 * cowlib
 * oauth2_client
 * jose

Data directory

Node data directory: /var/lib/rabbitmq/mnesia/rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh
Raft data directory: /var/lib/rabbitmq/mnesia/rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh/quorum/rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh

Config files

 * /etc/rabbitmq/conf.d/10-defaults.conf
 * /etc/rabbitmq/conf.d/10-operatorDefaults.conf
 * /etc/rabbitmq/conf.d/11-default_user.conf
 * /etc/rabbitmq/conf.d/90-userDefinedConfiguration.conf

Log file(s)

 * <stdout>

Alarms

(none)

Tags

(none)

Memory

Total memory used: 0.5718 gb
Calculation strategy: rss
Memory high watermark setting: 0.8 of available memory, computed to: 1.3744 gb

binary: 0.4321 gb (75.58 %)
reserved_unallocated: 0.0598 gb (10.46 %)
code: 0.0244 gb (4.27 %)
other_system: 0.0205 gb (3.58 %)
other_proc: 0.0185 gb (3.23 %)
allocated_unused: 0.0043 gb (0.75 %)
quorum_ets: 0.0029 gb (0.51 %)
quorum_queue_procs: 0.0024 gb (0.41 %)
other_ets: 0.0019 gb (0.33 %)
plugins: 0.0016 gb (0.27 %)
metrics: 0.0012 gb (0.22 %)
atom: 0.0012 gb (0.21 %)
msg_index: 0.0005 gb (0.08 %)
mgmt_db: 0.0003 gb (0.05 %)
metadata_store: 0.0002 gb (0.03 %)
mnesia: 0.0001 gb (0.02 %)
connection_other: 0.0 gb (0.0 %)
metadata_store_ets: 0.0 gb (0.0 %)
quorum_queue_dlx_procs: 0.0 gb (0.0 %)
stream_queue_procs: 0.0 gb (0.0 %)
stream_queue_replica_reader_procs: 0.0 gb (0.0 %)
connection_readers: 0.0 gb (0.0 %)
connection_writers: 0.0 gb (0.0 %)
connection_channels: 0.0 gb (0.0 %)
queue_procs: 0.0 gb (0.0 %)
stream_queue_coordinator_procs: 0.0 gb (0.0 %)

File Descriptors

Total: 0, limit: 1048479

Free Disk Space

Low free disk space watermark: 0.128 gb
Free disk space: 6.3082 gb

Totals

Connection count: 0
Queue count: 10
Virtual host count: 2

Listeners

Interface: [::], port: 15672, protocol: http, purpose: HTTP API
Interface: [::], port: 15692, protocol: http/prometheus, purpose: Prometheus exporter API over HTTP
Interface: [::], port: 25672, protocol: clustering, purpose: inter-node and CLI tool communication
Interface: [::], port: 5672, protocol: amqp, purpose: AMQP 0-9-1 and AMQP 1.0

rabbitmq-diagnostics quorum_status --vhost xxxxxx segmentator-waiting-queue

Status of quorum queue segmentator-waiting-queue on node rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh ...

┌───────────────────────────────────────────────────────────────────┬────────────┬────────────┬────────────────┬──────────────┬──────────────┬──────────────┬────────────────┬──────┬─────────────────┐
│ Node Name                                                         │ Raft State │ Membership │ Last Log Index │ Last Written │ Last Applied │ Commit Index │ Snapshot Index │ Term │ Machine Version │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxx-rabbitmq-server-0.xxxxx-rabbitmq-nodes.xxxxx-5ufiakh │ follower   │ voter      │ 5100           │ 5100         │ 5100         │ 5100         │ -1             │ 3    │ 5               │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxx-rabbitmq-server-1.xxxxx-rabbitmq-nodes.xxxxx-5ufiakh │ follower   │ voter      │ 5100           │ 5100         │ 5100         │ 5100         │ -1             │ 3    │ 5               │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ [email protected] │ leader     │ voter      │ 5100           │ 5100         │ 5100         │ 5100         │ -1             │ 3    │ 5               │
└───────────────────────────────────────────────────────────────────┴────────────┴────────────┴────────────────┴──────────────┴──────────────┴──────────────┴────────────────┴──────┴─────────────────┘

rabbitmq.conf

See https://www.rabbitmq.com/docs/configure#config-location to learn how to find rabbitmq.conf file location

## DEFAULT SETTINGS ARE NOT MEANT TO BE TAKEN STRAIGHT INTO PRODUCTION
## see https://www.rabbitmq.com/configure.html for further information
## on configuring RabbitMQ

## allow access to the guest user from anywhere on the network
## https://www.rabbitmq.com/access-control.html#loopback-users
## https://www.rabbitmq.com/production-checklist.html#users
loopback_users.guest = false

## Send all logs to stdout/TTY. Necessary to see logs when running via
## a container
log.console = true
queue_master_locator                       = min-masters
disk_free_limit.absolute                   = 2GB
cluster_partition_handling                 = pause_minority
cluster_formation.peer_discovery_backend   = rabbit_peer_discovery_k8s
cluster_formation.k8s.host                 = kubernetes.default
cluster_formation.k8s.address_type         = hostname
cluster_formation.target_cluster_size_hint = 3
cluster_name                               = xxxxxx-rabbitmq
auth_mechanisms.1                          = PLAIN
auth_mechanisms.2                          = AMQPLAIN
default_user =
default_pass =

# 90-userDefinedConfiguration.conf
total_memory_available_override_value    = 1717986919
cluster_partition_handling               = pause_minority
vm_memory_high_watermark.relative        = 0.8
vm_memory_high_watermark_paging_ratio    = 0.75
disk_free_limit.absolute                 = 128MB
max_message_size                         = 33554432
raft.segment_max_entries                 = 64
collect_statistics_interval              = 10000
log.file                                 = false
log.console                              = true
log.console.level                        = info
log.console.formatter                    = json
log.console.formatter.single_line        = on
log.console.formatter.json.field_map     = verbosity:v time msg domain file line pid level:-
log.console.formatter.json.verbosity_map = debug:7 info:6 notice:5 warning:4 error:3 critical:2 alert:1 emergency:0
log.console.formatter.time_format        = epoch_usecs

Steps to deploy RabbitMQ cluster

RabbitQm cluster operator.

Steps to reproduce the behavior in question

Send 200 messages of 3 mb to a quorum queue on a vhost different of the default.

advanced.config

No response

Application code

No response

Kubernetes deployment file

Cluster

apiVersion: v1
items:
- apiVersion: rabbitmq.com/v1beta1
  kind: RabbitmqCluster
  metadata:
    annotations:
    creationTimestamp: "2023-12-15T16:30:30Z"
    finalizers:
    - deletion.finalizers.rabbitmqclusters.rabbitmq.com
    generation: 33
    labels:
      app.kubernetes.io/instance: xxxxxx
      app.kubernetes.io/managed-by: Helm
      app.kubernetes.io/name: d2i-rabbitmq
      app.kubernetes.io/version: 1.0.0
      helm.sh/chart: d2i-rabbitmq-1.0.0
    name: xxxxxx-rabbitmq
    namespace: xxx-5ufiakh
    resourceVersion: "1340608427"
    uid: 6058dd08-432f-4061-87f5-50cb3a8cc1cc
  spec:
    affinity:
      nodeAffinity:
        preferredDuringSchedulingIgnoredDuringExecution:
        - preference:
            matchExpressions:
            - key: dedicated
              operator: In
              values:
              - longruncpu
          weight: 1
      podAntiAffinity:
        preferredDuringSchedulingIgnoredDuringExecution:
        - podAffinityTerm:
            labelSelector:
              matchExpressions:
              - key: app.kubernetes.io/instance
                operator: In
                values:
                - xxx-5ufiakh
              - key: app.kubernetes.io/name
                operator: In
                values:
                - xxxxxx-rabbitmq
            topologyKey: kubernetes.io/hostname
          weight: 100
    delayStartSeconds: 30
    image: rabbitmq:4.0.7-management
    override:
      service:
        metadata:
          labels:
            rabbitmq-monitoring: prometheus
        spec:
          ports:
          - appProtocol: http
            name: prometheus
            port: 15692
            protocol: TCP
            targetPort: 15692
      statefulSet:
        spec:
          template:
            metadata:
              labels:
                sidecar.istio.io/inject: "false"
            spec:
              containers:
              - name: rabbitmq
                resources: {}
                securityContext:
                  allowPrivilegeEscalation: false
                  capabilities:
                    drop:
                    - ALL
                  readOnlyRootFilesystem: true
                volumeMounts:
                - mountPath: /var/log/rabbitmq
                  name: logs
              initContainers:
              - name: setup-container
                resources: {}
                securityContext:
                  allowPrivilegeEscalation: false
                  capabilities:
                    drop:
                    - ALL
                  readOnlyRootFilesystem: true
              securityContext:
                fsGroup: 999
                runAsGroup: 999
                runAsNonRoot: true
                runAsUser: 999
                seccompProfile:
                  type: RuntimeDefault
              volumes:
              - emptyDir:
                  sizeLimit: 1Gi
                name: logs
    persistence:
      storage: 8Gi
      storageClassName: xxx-5ufiakh-azure-managed-disk-retain-zrs
    rabbitmq:
      additionalConfig: |
        cluster_partition_handling = pause_minority
        vm_memory_high_watermark.relative = 0.8
        vm_memory_high_watermark_paging_ratio = 0.75
        disk_free_limit.absolute = 128MB
        max_message_size = 33554432
        raft.segment_max_entries = 64
        collect_statistics_interval = 10000
        log.file = false
        log.console = true
        log.console.level = info
        log.console.formatter = json
        log.console.formatter.single_line = on
        log.console.formatter.json.field_map = verbosity:v time msg domain file line pid level:-
        log.console.formatter.json.verbosity_map = debug:7 info:6 notice:5 warning:4 error:3 critical:2 alert:1 emergency:0
        log.console.formatter.time_format = epoch_usecs
      envConfig: |
        RABBITMQ_LOGS=""
    replicas: 3
    resources:
      limits:
        cpu: 500m
        memory: 2Gi
      requests:
        cpu: 100m
        memory: 1Gi
    secretBackend:
      externalSecret:
        name: ""
    service:
      type: ClusterIP
    terminationGracePeriodSeconds: 604800
    tls: {}
    tolerations:
    - effect: NoSchedule
      key: kubernetes.azure.com/scalesetpriority
      operator: Equal
      value: spot

Queue

apiVersion: rabbitmq.com/v1beta1
kind: Queue
metadata:
  creationTimestamp: "2025-03-19T15:34:34Z"
  finalizers:
  - deletion.finalizers.queues.rabbitmq.com
  generation: 3
  name: xxxxxx-d2i-core-api-other
  namespace: xxx-5ufiakh
  resourceVersion: "1335628343"
  uid: 1a4986b1-4824-4000-852c-5bd62a212aff
spec:
  autoDelete: false
  durable: true
  name: other
  rabbitmqClusterReference:
    name: xxxxxx-rabbitmq
  type: quorum
  vhost: xxxxxx

Policy

apiVersion: rabbitmq.com/v1beta1
kind: Policy
metadata:
  creationTimestamp: "2025-03-19T15:30:50Z"
  finalizers:
  - deletion.finalizers.policies.rabbitmq.com
  generation: 5
  name: xxxxxx-d2i-core-api-other
  namespace: xxx-5ufiakh
  resourceVersion: "1340596836"
  uid: 16e745c9-a4b8-4243-95e4-abcd9139eb0c
spec:
  applyTo: queues
  definition:
    consumer-timeout: 600000
    message-ttl: 900000
    overflow: reject-publish
  name: xxxxxx-d2i-core-api-other
  pattern: ^other$
  priority: 1
  rabbitmqClusterReference:
    name: xxxxxx-rabbitmq
  vhost: xxxxxx

What problem are you trying to solve?

Segment of quorum are not cleaned, disk size grows up to 8 Gb.

Checkpoints & snapshots directory are empty

Message size are between 2-4Mb and raft.segment_max_entries is set to 64.

Queue status

rabbitmqctl list_queues -p xxxxx  name messages messages_unacknowledged
Timeout: 60.0 seconds ...
Listing queues for vhost xxxxx ...
other   0       0

All segments still present including when we purge the queue and send one new message.

rabbitmqctl purge_queue  other   --vhost xxxxx
Purging queue 'other' in vhost 'xxxxx' ...

Question:

When segments are clean ? Directly when all messages included in the segments are ack ?
What mean queue parameters : min_checkpoint_interval => 8192 and snapshot_interval => 8192

Content of ~/mnesia/rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh/quorum/rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh/XXXXXZ4YGMB40JV80

-rw-rw-r-- 1 rabbitmq rabbitmq 10841226 Mar 21 05:04 00000001.segment
-rw-rw-r-- 1 rabbitmq rabbitmq 10093038 Mar 21 08:05 00000002.segment
-rw-r--r-- 1 rabbitmq rabbitmq 12717413 Mar 21 08:05 00000003.segment
-rw-r--r-- 1 rabbitmq rabbitmq 10118191 Mar 21 08:05 00000004.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7797316 Mar 21 08:17 00000005.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5442114 Mar 21 08:17 00000006.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6120692 Mar 21 08:17 00000007.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5109191 Mar 21 08:17 00000008.segment
-rw-r--r-- 1 rabbitmq rabbitmq  2997238 Mar 21 08:17 00000009.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5040250 Mar 21 08:17 00000010.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5098258 Mar 21 08:17 00000011.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4254892 Mar 21 08:17 00000012.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5870945 Mar 21 08:17 00000013.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5886403 Mar 21 08:17 00000014.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5127242 Mar 21 08:17 00000015.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7070859 Mar 21 08:17 00000016.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5501007 Mar 21 08:17 00000017.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4449298 Mar 21 08:17 00000018.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4478050 Mar 21 08:17 00000019.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4830036 Mar 21 08:17 00000020.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6650682 Mar 21 08:17 00000021.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5561483 Mar 21 08:17 00000022.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5476513 Mar 21 08:17 00000023.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5332244 Mar 21 08:17 00000024.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6190261 Mar 21 08:17 00000025.segment
-rw-r--r-- 1 rabbitmq rabbitmq  2270031 Mar 21 08:17 00000026.segment
-rw-r--r-- 1 rabbitmq rabbitmq 13996907 Mar 21 08:24 00000027.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5667412 Mar 21 08:24 00000028.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5667764 Mar 21 08:24 00000029.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5703005 Mar 21 08:24 00000030.segment
-rw-r--r-- 1 rabbitmq rabbitmq  2166212 Mar 21 08:24 00000031.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5797333 Mar 21 08:24 00000032.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5431850 Mar 21 08:24 00000033.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6816864 Mar 21 08:24 00000034.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6428927 Mar 21 08:24 00000035.segment
-rw-r--r-- 1 rabbitmq rabbitmq  3598403 Mar 21 08:24 00000036.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6426683 Mar 21 08:24 00000037.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5846243 Mar 21 08:24 00000038.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4482289 Mar 21 08:24 00000039.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5739754 Mar 21 08:24 00000040.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7023823 Mar 21 08:24 00000041.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7223978 Mar 21 08:24 00000042.segment
-rw-r--r-- 1 rabbitmq rabbitmq  2752771 Mar 21 08:24 00000043.segment
-rw-r--r-- 1 rabbitmq rabbitmq  8693775 Mar 21 08:24 00000044.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4935208 Mar 21 08:24 00000045.segment
-rw-r--r-- 1 rabbitmq rabbitmq  3874243 Mar 21 08:24 00000046.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5218089 Mar 21 08:24 00000047.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6431886 Mar 21 08:24 00000048.segment
-rw-r--r-- 1 rabbitmq rabbitmq  3313521 Mar 21 08:24 00000049.segment
-rw-r--r-- 1 rabbitmq rabbitmq 15011303 Mar 21 08:24 00000050.segment
-rw-r--r-- 1 rabbitmq rabbitmq 13449030 Mar 21 08:24 00000051.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5357545 Mar 21 08:24 00000052.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4758516 Mar 21 08:24 00000053.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4977604 Mar 21 08:24 00000054.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7590881 Mar 21 08:24 00000055.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7466659 Mar 21 08:24 00000056.segment
-rw-r--r-- 1 rabbitmq rabbitmq  7143571 Mar 21 08:24 00000057.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4171624 Mar 21 08:24 00000058.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6214655 Mar 21 08:24 00000059.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4704588 Mar 21 08:24 00000060.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4617428 Mar 21 08:24 00000061.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5096074 Mar 21 08:24 00000062.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6120455 Mar 21 08:24 00000063.segment
-rw-r--r-- 1 rabbitmq rabbitmq  3094317 Mar 21 08:24 00000064.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6016172 Mar 21 08:24 00000065.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6347590 Mar 21 08:24 00000066.segment
-rw-r--r-- 1 rabbitmq rabbitmq  6426554 Mar 21 08:24 00000067.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5521265 Mar 21 08:24 00000068.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5679028 Mar 21 08:37 00000069.segment
-rw-r--r-- 1 rabbitmq rabbitmq  2939394 Mar 21 08:37 00000070.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5556303 Mar 21 08:37 00000071.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5556408 Mar 21 08:37 00000072.segment
-rw-r--r-- 1 rabbitmq rabbitmq  5779178 Mar 21 08:37 00000073.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4682370 Mar 21 08:37 00000074.segment
-rw-r--r-- 1 rabbitmq rabbitmq  4082094 Mar 21 08:37 00000075.segment
-rw-r--r-- 1 rabbitmq rabbitmq 29337331 Mar 21 08:37 00000076.segment
-rw-r--r-- 1 rabbitmq rabbitmq 31439787 Mar 21 08:37 00000077.segment
drwxrwsr-x 2 rabbitmq rabbitmq     4096 Mar 20 23:07 checkpoints
-rw-rw-r-- 1 rabbitmq rabbitmq     1636 Mar 20 23:07 config
drwxrwsr-x 2 rabbitmq rabbitmq     4096 Mar 20 23:07 snapshots

Content of queue config

```

{id =>
{xxxxx_other,
'rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh'},
machine =>
{module,rabbit_fifo,
#{name => xxxxx_other,max_length => undefined,
max_bytes => undefined,
queue_resource => {resource,<<"xxxxxx">>,queue,<<"other">>},
created => 1742512049028,dead_letter_handler => undefined,
become_leader_handler =>
{rabbit_quorum_queue,become_leader,
[{resource,<<"xxxxxx">>,queue,<<"other">>}]},
overflow_strategy => reject_publish,delivery_limit => 20,
expires => undefined,msg_ttl => undefined,
single_active_consumer_on => false}},
membership => voter,friendly_name => "queue 'other' in vhost 'xxxxxx'",
cluster_name => xxxxx_other,uid => <<"XXXXXZ4YGMB40JV80">>,
initial_members =>
[{xxxxx_other,
'rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh'},
{xxxxx_other,
'rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.xxx-5ufiakh'},
{xxxxx_other,
'rabbit@xxxxxx-rabbitmq-server-1.xxxxxx-rabbitmq-nodes.xxx-5ufiakh'}],
log_init_args =>
#{max_checkpoints => 3,min_checkpoint_interval => 8192,
snapshot_interval => 8192,uid => <<"XXXXXZ4YGMB40JV80">>},
metrics_key => {resource,<<"xxxxxx">>,queue,<<"other">>},
ra_event_formatter =>
{rabbit_quorum_queue,format_ra_event,
[{resource,<<"xxxxxx">>,queue,<<"other">>}]},
tick_timeout => 5000,broadcast_time => 100,
install_snap_rpc_timeout => 120000,await_condition_timeout => 30000}

```

kjnilsson · 2025-03-21T11:48:20Z

kjnilsson
Mar 21, 2025
Maintainer

We may need to make some adjustments to the 4.0 snapshotting strategy for low throughput queues with very large messages.

2 replies

kjnilsson Mar 21, 2025
Maintainer

Your report doesn't make much sense however. The queue you show the quorum_status for only has 159 raft indexes so you can't have sent 200 messages to the queue as you mentioned. 3MB * 200 is 600MB which is very far off the 8GB you claim the disk is using. The segment listing has 77 segments 77 * 64 is 4928 raft indexes, very far off the 159 you show in the quorum_status output.

That said I think there are improvements we can make and I will take a look at them.

YvesZelros Mar 21, 2025
Author

Sorry quorum_status output comme from the wrong queue, I fix it. Last index is 5100 and have now 80 segments

┌───────────────────────────────────────────────────────────────────┬────────────┬────────────┬────────────────┬──────────────┬──────────────┬──────────────┬────────────────┬──────┬─────────────────┐
│ Node Name                                                         │ Raft State │ Membership │ Last Log Index │ Last Written │ Last Applied │ Commit Index │ Snapshot Index │ Term │ Machine Version │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxx-rabbitmq-server-0.xxxxx-rabbitmq-nodes.xxxxx-5ufiakh │ follower   │ voter      │ 5100           │ 5100         │ 5100         │ 5100         │ -1             │ 3    │ 5               │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxx-rabbitmq-server-1.xxxxx-rabbitmq-nodes.xxxxx-5ufiakh │ follower   │ voter      │ 5100           │ 5100         │ 5100         │ 5100         │ -1             │ 3    │ 5               │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxx-rabbitmq-server-2.xxxxx-rabbitmq-nodes.xxxxx-5ufiakh │ leader     │ voter      │ 5100           │ 5100         │ 5100         │ 5100         │ -1             │ 3    │ 5               │
└───────────────────────────────────────────────────────────────────┴────────────┴────────────┴────────────────┴──────────────┴──────────────┴──────────────┴────────────────┴──────┴─────────────────┘

YvesZelros · 2025-03-21T12:29:14Z

YvesZelros
Mar 21, 2025
Author

Thanks for your replay. I do many test can be that last one I send less number of message but result it's all time the same.

To be more precise, full use case is a workflow between 5 queues and similar message passe by all queues, 3MB * 300 * 5 + WAL size, the disk become full .

That said I think there are improvements we can make and I will take a look at them.

Phelps documentation can be improve to explain when snapshot start to be clean, especially if it's only after a number of messages. Nothings mentioned on the performance-tuning-large-messages

I will try to increase disk size from 8 to 16Gb x 3 node and see if segment will be cleanup

6 replies

kjnilsson Mar 21, 2025
Maintainer

I'm implementing some tweaks to try to improve this in #13587

It isn't going to be perfect as we may need to make changes to the internals of the queue to better track the amount of data (rather than number of messages) that flow through the queue and use this to make better, more reliable checkpointing decisions.

YvesZelros Mar 24, 2025
Author

@kjnilsson Where I can set quorum_min_checkpoint_interval ? What is the unit of this interval value ?

kjnilsson Mar 24, 2025
Maintainer

you need to use the advanced config for this atm. the unit is raft indexes.

kjnilsson Mar 24, 2025
Maintainer

#13587

this PR contains some changes that should help with oversized messages. Are you able to test it?

kjnilsson Mar 25, 2025
Maintainer

https://hub.docker.com/layers/pivotalrabbitmq/rabbitmq/qq-checkpointing-tweaks-2-otp27/images/sha256-a1b509aec0afe5b4dbea33a2a19afc8a50528f69edffd9d99c9f58efeb1629ec

@YvesZelros here is a container with the changes. If you could test it that would help us speed up shipping of this improvement.

michaelklishin · 2025-03-21T16:11:15Z

michaelklishin
Mar 21, 2025
Maintainer

@YvesZelros there is a quorum queue guide section that explains what settings should be used to make QQs truncate segment files quicker. It is primarily relevant for workloads with large messages.

Beyond that, making sure your consumers do not hold on to deliveries for minutes or hours is the change that helps the most. Segment files that have at least one message in Ready state will be retained. Segment files with fewer entries have a lower probability of containing just one or a few such messages.

4 replies

YvesZelros Mar 24, 2025
Author

@michaelklishin Thanks for your replay
I have read this section and set segment_max_entries to 64 but it's not help to clean segment.
The document mention allow nodes truncate them at a higher rate but seen not be the case.

Having significantly fewer entries per segment file will keep the size of each segment reasonable and allow nodes truncate them at a higher rate because each segment file will have a lower probability to have a very small number of live messages that keep the entire file around.

Listing queues for vhost xxxxx ...
name        messages        messages_unacknowledged
segmentator     1                       1

-rw-rw-r-- 1 rabbitmq rabbitmq  11M Mar 21 05:02 00000001.segment
-rw-rw-r-- 1 rabbitmq rabbitmq 7.9M Mar 21 08:02 00000002.segment
-rw-rw-r-- 1 rabbitmq rabbitmq 8.7M Mar 21 08:02 00000003.segment
-rw-rw-r-- 1 rabbitmq rabbitmq  13M Mar 21 08:02 00000004.segment
-rw-rw-r-- 1 rabbitmq rabbitmq 8.8M Mar 21 08:02 00000005.segment
...
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 09:56 00000109.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 09:56 00000110.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 09:56 00000111.segment
-rw-r--r-- 1 rabbitmq rabbitmq  25M Mar 24 09:56 00000112.segment
-rw-r--r-- 1 rabbitmq rabbitmq 6.8M Mar 24 09:56 00000113.segment

michaelklishin Mar 24, 2025
Maintainer

@YvesZelros if that single message is the oldest one in the queue, something must consume and acknowledge it. Quorum queues assume that consumers make progress regularly enough.

Where this cannot be guaranteed, use a classic queue (that support compaction of segment files) or message TTL. Quorum queues will be able to compact segment files in a future version, the earliest version being 4.2.0 (this is not a delivery promise of any kind).

YvesZelros Mar 24, 2025
Author

@michaelklishin
All message are consumed according the command 'list_queues'

rabbitmqctl list_queues --vhost xxxxxx name,messages,messages_unacknowledged
Timeout: 60.0 seconds ...
Listing queues for vhost xxxxxx ...
name    messages        messages_unacknowledged
classifier      0       0

@kjnilsson
Additionally to "raft.segment_max_entries = 64" I setup advanced configuration as you propose and re-create queues.
But seem not help to clean segment files :-(

advancedConfig: |
      [
          {rabbit, [
              {quorum_min_checkpoint_interval, 64}
          ]}
      ].

Queue configuration =>

#{id =>
{xxxxxx_classifier,
'rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.zel-5ufiakh'},
machine =>
{module,rabbit_fifo,
#{name => xxxxxx_classifier,max_length => undefined,
max_bytes => undefined,
queue_resource => {resource,<<"xxxxxx">>,queue,<<"classifier">>},
created => 1742814668840,dead_letter_handler => undefined,
become_leader_handler =>
{rabbit_quorum_queue,become_leader,
[{resource,<<"xxxxxx">>,queue,<<"classifier">>}]},
overflow_strategy => reject_publish,delivery_limit => 20,
expires => undefined,msg_ttl => 900000,
single_active_consumer_on => false}},
membership => voter,friendly_name => "queue 'classifier' in vhost 'xxxxxx'",
cluster_name => xxxxxx_classifier,uid => <<"XXXXXPZ4QGA7J4583">>,
initial_members =>
[{xxxxxx_classifier,
'rabbit@xxxxxx-rabbitmq-server-1.xxxxxx-rabbitmq-nodes.zel-5ufiakh'},
{xxxxxx_classifier,
'rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.zel-5ufiakh'},
{xxxxxx_classifier,
'rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.zel-5ufiakh'}],
log_init_args =>
#{max_checkpoints => 3,min_checkpoint_interval => 64,
snapshot_interval => 8192,uid => <<"XXXXXPZ4QGA7J4583">>},
metrics_key => {resource,<<"xxxxxx">>,queue,<<"classifier">>},
ra_event_formatter =>
{rabbit_quorum_queue,format_ra_event,
[{resource,<<"xxxxxx">>,queue,<<"classifier">>}]},
tick_timeout => 5000,broadcast_time => 100,
install_snap_rpc_timeout => 120000,await_condition_timeout => 30000}.rabbitmq@xxxxxx-rabbitmq-server-2:~/mnesia/rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.zel-5ufiakh/quorum/rabbit@xxxxxx-ra

quorum_status

rabbitmq-queues    quorum_status         --vhost xxxxxx classifier
Status of quorum queue classifier on node rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.xxx-5ufiakh ...
┌───────────────────────────────────────────────────────────────────┬────────────┬────────────┬────────────────┬──────────────┬──────────────┬──────────────┬────────────────┬──────┬─────────────────┐
│ Node Name                                                         │ Raft State │ Membership │ Last Log Index │ Last Written │ Last Applied │ Commit Index │ Snapshot Index │ Term │ Machine Version │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxxx-rabbitmq-server-0.xxxxxx-rabbitmq-nodes.xxx-5ufiakh │ follower   │ voter      │ 2308           │ 2308         │ 2308         │ 2308         │ -1             │ 1    │ 5               │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxxx-rabbitmq-server-1.xxxxxx-rabbitmq-nodes.xxx-5ufiakh │ leader     │ voter      │ 2308           │ 2308         │ 2308         │ 2308         │ -1             │ 1    │ 5               │
├───────────────────────────────────────────────────────────────────┼────────────┼────────────┼────────────────┼──────────────┼──────────────┼──────────────┼────────────────┼──────┼─────────────────┤
│ rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.xxx-5ufiakh │ follower   │ voter      │ 2308           │ 2308         │ 2308         │ 2308         │ -1             │ 1    │ 5               │
└───────────────────────────────────────────────────────────────────┴────────────┴────────────┴────────────────┴──────────────┴──────────────┴──────────────┴────────────────┴──────┴─────────────────┘

segment files


ls -l /rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.zel-5ufiakh/quorum/rabbit@xxxxxx-rabbitmq-server-2.xxxxxx-rabbitmq-nodes.zel-5ufiakh/XXXXXXPZ4QGA7J4583$

-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 11:29 00000001.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 11:29 00000002.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 11:29 00000003.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 11:50 00000004.segment
-rw-r--r-- 1 rabbitmq rabbitmq  26M Mar 24 11:50 00000005.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 11:50 00000006.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 11:50 00000007.segment
-rw-r--r-- 1 rabbitmq rabbitmq  26M Mar 24 11:50 00000008.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 11:50 00000009.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 11:50 00000010.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 11:50 00000011.segment
-rw-r--r-- 1 rabbitmq rabbitmq  21M Mar 24 12:39 00000012.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 12:39 00000013.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 12:39 00000014.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 12:39 00000015.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 12:39 00000016.segment
-rw-r--r-- 1 rabbitmq rabbitmq  22M Mar 24 12:39 00000017.segment
-rw-r--r-- 1 rabbitmq rabbitmq  25M Mar 24 12:59 00000018.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 12:59 00000019.segment
-rw-r--r-- 1 rabbitmq rabbitmq  21M Mar 24 12:59 00000020.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 12:59 00000021.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 12:59 00000022.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 12:59 00000023.segment
-rw-r--r-- 1 rabbitmq rabbitmq  24M Mar 24 12:59 00000024.segment
-rw-r--r-- 1 rabbitmq rabbitmq  21M Mar 24 13:19 00000025.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 13:19 00000026.segment
-rw-r--r-- 1 rabbitmq rabbitmq  22M Mar 24 13:19 00000027.segment
-rw-r--r-- 1 rabbitmq rabbitmq  26M Mar 24 13:19 00000028.segment
-rw-r--r-- 1 rabbitmq rabbitmq  25M Mar 24 13:19 00000029.segment
-rw-r--r-- 1 rabbitmq rabbitmq  23M Mar 24 13:19 00000030.segment
-rw-r--r-- 1 rabbitmq rabbitmq  21M Mar 24 13:20 00000031.segment
-rw-r--r-- 1 rabbitmq rabbitmq  22M Mar 24 13:20 00000032.segment
-rw-r--r-- 1 rabbitmq rabbitmq  18M Mar 24 13:20 00000033.segment
drwxr-sr-x 2 rabbitmq rabbitmq 4.0K Mar 24 11:11 checkpoints
-rw-r--r-- 1 rabbitmq rabbitmq 1.7K Mar 24 11:11 config
drwxr-sr-x 2 rabbitmq rabbitmq 4.0K Mar 24 11:11 snapshots

kjnilsson Mar 24, 2025
Maintainer

try a purge

kjnilsson · 2025-03-25T09:39:01Z

kjnilsson
Mar 25, 2025
Maintainer

#13587

This PR should make checkpointing more frequent for large message workloads. This PR will work best with a lower raft.segment_max_entries - for example 64. This setting will not be necessary in a future version when rabbitmq/ra#526 is shipped with RabbitMQ as this will put an upper bytes limit on segments.

3 replies

YvesZelros Mar 25, 2025
Author

Hi @kjnilsson,
Thanks I will test it,
I just was facing to this issue https://github.com/rabbitmq/rabbitmq-server/issues/13614

kjnilsson Mar 26, 2025
Maintainer

just a thought @YvesZelros - is there any way you could use streams for these very large messages instead of a quorum queue?

michaelklishin Mar 26, 2025
Maintainer

#13614 was moved to #13616, and I have already submitted a PR for amqplib that was merged by the maintainer.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Questions] Segments files of quorum are not clean #13586

{{title}}

{{editor}}'s edit

{{editor}}'s edit

Replies: 4 comments 15 replies

{{title}}

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

[Questions] Segments files of quorum are not clean #13586

YvesZelros Mar 21, 2025

Community Support Policy

RabbitMQ version used

Erlang version used

Operating system (distribution) used

How is RabbitMQ deployed?

rabbitmq-diagnostics status output

rabbitmq.conf

Steps to deploy RabbitMQ cluster

Steps to reproduce the behavior in question

advanced.config

Application code

Kubernetes deployment file

What problem are you trying to solve?

Replies: 4 comments · 15 replies

kjnilsson Mar 21, 2025 Maintainer

kjnilsson Mar 21, 2025 Maintainer

YvesZelros Mar 21, 2025 Author

YvesZelros Mar 21, 2025 Author

kjnilsson Mar 21, 2025 Maintainer

YvesZelros Mar 24, 2025 Author

kjnilsson Mar 24, 2025 Maintainer

kjnilsson Mar 24, 2025 Maintainer

kjnilsson Mar 25, 2025 Maintainer

michaelklishin Mar 21, 2025 Maintainer

YvesZelros Mar 24, 2025 Author

michaelklishin Mar 24, 2025 Maintainer

YvesZelros Mar 24, 2025 Author

kjnilsson Mar 24, 2025 Maintainer

kjnilsson Mar 25, 2025 Maintainer

YvesZelros Mar 25, 2025 Author

kjnilsson Mar 26, 2025 Maintainer

michaelklishin Mar 26, 2025 Maintainer

YvesZelros
Mar 21, 2025

Replies: 4 comments 15 replies

kjnilsson
Mar 21, 2025
Maintainer

kjnilsson Mar 21, 2025
Maintainer

YvesZelros Mar 21, 2025
Author

YvesZelros
Mar 21, 2025
Author

kjnilsson Mar 21, 2025
Maintainer

YvesZelros Mar 24, 2025
Author

kjnilsson Mar 24, 2025
Maintainer

kjnilsson Mar 24, 2025
Maintainer

kjnilsson Mar 25, 2025
Maintainer

michaelklishin
Mar 21, 2025
Maintainer

YvesZelros Mar 24, 2025
Author

michaelklishin Mar 24, 2025
Maintainer

YvesZelros Mar 24, 2025
Author

kjnilsson Mar 24, 2025
Maintainer

kjnilsson
Mar 25, 2025
Maintainer

YvesZelros Mar 25, 2025
Author

kjnilsson Mar 26, 2025
Maintainer

michaelklishin Mar 26, 2025
Maintainer