2-bit K-quantized block structure More...

Collaboration diagram for block_q2_K:

Detailed Description

2-bit K-quantized block structure

Stores weights quantized to 2 bits with block-wise scaling. Provides maximum compression at the cost of precision.

Definition at line 85 of file quantization.h.

Member Data Documentation

uint16_t block_q2_K::d

Block scale

Definition at line 86 of file quantization.h.

uint16_t block_q2_K::dmin

Block minimum value

Definition at line 87 of file quantization.h.

uint8_t block_q2_K::qs[GGML_QK_K/4]

Quantized values

Definition at line 89 of file quantization.h.

uint8_t block_q2_K::scales[GGML_QK_K/16]

Sub-block scales

Definition at line 88 of file quantization.h.

The documentation for this struct was generated from the following file: