tinyllama.cpp/model__constants_8h_source.html

#pragma once


#include <cstdint>


namespace bfloat16 {

    constexpr uint16_t EXPONENT_MASK = 0x7F80;

    constexpr uint16_t MANTISSA_MASK = 0x007F;

    constexpr uint16_t SIGN_BIT = 0x8000;

    constexpr uint16_t ZERO = 0x0000;

    constexpr uint16_t NEG_ZERO = 0x8000;

    constexpr int SHIFT_BITS = 16;

}


namespace attention {

    constexpr float ATTENTION_SCALE_DEFAULT = 0.125f; // 1/sqrt(64) for typical head_dim=64

    constexpr float ATTENTION_SCALE_BASE = 1.0f;  // MUST BE 1.0f for correct scaling when combined with config's attention_softmax_scale


    constexpr float MIN_SCALE = 1e-4f;

    constexpr float MAX_SCALE = 1e4f;

    // For GQA/MQA, if num_kv_heads < num_q_heads, kv_repetition_factor > 1

    constexpr int KV_REPETITION_FACTOR_DEFAULT = 1;

}


namespace rope {

    constexpr float ROPE_THETA = 10000.0f;

    constexpr int MAX_SEQUENCE_LENGTH = 2048;

}


namespace numeric {

    constexpr float MIN_NORM_EPS = 1e-5f;

    constexpr float DEFAULT_EPS = 1e-6f;

    constexpr float MAX_LOGIT_THRESHOLD = 100.0f;

}

attention
Constants for attention mechanism calculations.

attention::KV_REPETITION_FACTOR_DEFAULT
constexpr int KV_REPETITION_FACTOR_DEFAULT
Definition model_constants.h:45

attention::MIN_SCALE
constexpr float MIN_SCALE
Definition model_constants.h:41

attention::ATTENTION_SCALE_BASE
constexpr float ATTENTION_SCALE_BASE
Definition model_constants.h:39

attention::MAX_SCALE
constexpr float MAX_SCALE
Definition model_constants.h:42

attention::ATTENTION_SCALE_DEFAULT
constexpr float ATTENTION_SCALE_DEFAULT
Definition model_constants.h:38

bfloat16
Constants for BFloat16 number format handling.

bfloat16::ZERO
constexpr uint16_t ZERO
Definition model_constants.h:25

bfloat16::SIGN_BIT
constexpr uint16_t SIGN_BIT
Definition model_constants.h:24

bfloat16::NEG_ZERO
constexpr uint16_t NEG_ZERO
Definition model_constants.h:26

bfloat16::EXPONENT_MASK
constexpr uint16_t EXPONENT_MASK
Definition model_constants.h:22

bfloat16::MANTISSA_MASK
constexpr uint16_t MANTISSA_MASK
Definition model_constants.h:23

bfloat16::SHIFT_BITS
constexpr int SHIFT_BITS
Definition model_constants.h:27

numeric
Constants for ensuring numeric stability.

numeric::DEFAULT_EPS
constexpr float DEFAULT_EPS
Definition model_constants.h:69

numeric::MIN_NORM_EPS
constexpr float MIN_NORM_EPS
Definition model_constants.h:68

numeric::MAX_LOGIT_THRESHOLD
constexpr float MAX_LOGIT_THRESHOLD
Definition model_constants.h:70

rope
Constants for Rotary Position Embedding (RoPE)

rope::ROPE_THETA
constexpr float ROPE_THETA
Definition model_constants.h:56

rope::MAX_SEQUENCE_LENGTH
constexpr int MAX_SEQUENCE_LENGTH
Definition model_constants.h:57