3-bit K-quantized block structure More...

Collaboration diagram for block_q3_K:

Detailed Description

3-bit K-quantized block structure

Stores weights quantized to 3 bits with block-wise scaling. Balances compression and precision between Q2_K and Q4_K.

Definition at line 99 of file quantization.h.

Member Data Documentation

uint16_t block_q3_K::d

Block scale

Definition at line 103 of file quantization.h.

uint16_t block_q3_K::dmin

Block minimum value

Definition at line 104 of file quantization.h.

uint8_t block_q3_K::hmask[GGML_QK_K/8]

High bit masks

Definition at line 100 of file quantization.h.

uint8_t block_q3_K::qs[GGML_QK_K/4]

Quantized values

Definition at line 101 of file quantization.h.

uint8_t block_q3_K::scales[12]

Sub-block scales

Definition at line 102 of file quantization.h.

The documentation for this struct was generated from the following file: