0.0.16/Doxygen/micro-kernels_2gemv_8hpp_source.html

#pragma once


#include <batmat/linalg/structure.hpp>

#include <batmat/linalg/uview.hpp>

#include <batmat/lut.hpp>

#include <batmat/platform/platform.hpp>

#include <optional>


namespace batmat::linalg::micro_kernels::gemv {


struct KernelConfig {

    bool negate  = false;

    int shift_A  = 0;

    int rotate_B = 0;

    int rotate_C = 0;

    int rotate_D = rotate_C;

    int mask_D   = rotate_D;

};


template <class T, class Abi, KernelConfig Conf, index_t RowsReg, StorageOrder OA>

void gemv_copy_microkernel(uview<const T, Abi, OA> A, uview<const T, Abi, StorageOrder::ColMajor> B,

                           std::optional<uview<const T, Abi, StorageOrder::ColMajor>> C,

                           uview<T, Abi, StorageOrder::ColMajor> D, index_t k) noexcept;


template <class T, class Abi, KernelConfig Conf, StorageOrder OA>

void gemv_copy_register(view<const T, Abi, OA> A, view<const T, Abi> B,

                        std::optional<view<const T, Abi>> C, view<T, Abi> D) noexcept;


template <class T, class Abi>

constexpr index_t RowsReg = 2 * gemm::RowsReg<T, Abi>;


template <class T, class Abi, KernelConfig Conf, StorageOrder OA>

inline const constinit auto gemv_copy_lut =

    make_1d_lut<RowsReg<T, Abi>>([]<index_t Row>(index_constant<Row>) {

        return gemv_copy_microkernel<T, Abi, Conf, Row + 1, OA>;

    });


} // namespace batmat::linalg::micro_kernels::gemv


batmat::make_1d_lut
consteval auto make_1d_lut(F f)
Returns an array of the form:
Definition lut.hpp:39

lut.hpp

batmat::linalg::micro_kernels::gemm::RowsReg
constexpr index_t RowsReg
Register block size of the matrix-matrix multiplication micro-kernels.
Definition avx-512.hpp:13

batmat::linalg::micro_kernels::gemv
Definition gemv.hpp:9

batmat::linalg::micro_kernels::gemv::gemv_copy_lut
const constinit auto gemv_copy_lut
Definition gemv.hpp:33

batmat::linalg::micro_kernels::gemv::KernelConfig::mask_D
int mask_D
Definition gemv.hpp:17

batmat::linalg::micro_kernels::gemv::KernelConfig::rotate_D
int rotate_D
Definition gemv.hpp:16

batmat::linalg::micro_kernels::gemv::KernelConfig::negate
bool negate
Definition gemv.hpp:12

batmat::linalg::micro_kernels::gemv::KernelConfig::rotate_B
int rotate_B
Definition gemv.hpp:14

batmat::linalg::micro_kernels::gemv::KernelConfig::rotate_C
int rotate_C
Definition gemv.hpp:15

batmat::linalg::micro_kernels::gemv::KernelConfig::shift_A
int shift_A
Definition gemv.hpp:13

batmat::linalg::micro_kernels::gemv::gemv_copy_register
void gemv_copy_register(view< const T, Abi, OA > A, view< const T, Abi > B, std::optional< view< const T, Abi > > C, view< T, Abi > D) noexcept
Generalized matrix multiplication d = c ± A⁽ᵀ⁾ b. Using register blocking.
Definition gemv.tpp:79

batmat::linalg::micro_kernels::gemv::RowsReg
constexpr index_t RowsReg
Definition gemv.hpp:30

batmat::linalg::micro_kernels::gemv::gemv_copy_microkernel
void gemv_copy_microkernel(uview< const T, Abi, OA > A, uview< const T, Abi, StorageOrder::ColMajor > B, std::optional< uview< const T, Abi, StorageOrder::ColMajor > > C, uview< T, Abi, StorageOrder::ColMajor > D, index_t k) noexcept
Generalized matrix-vector multiplication d = c ± A⁽ᵀ⁾ b. Single register block.
Definition gemv.tpp:16

batmat::linalg::micro_kernels::gemv::KernelConfig
Definition gemv.hpp:11

batmat::linalg::view
simd_view_types< std::remove_const_t< T >, Abi >::template view< T, Order > view
Definition uview.hpp:70

batmat::index_constant
std::integral_constant< index_t, I > index_constant
Definition lut.hpp:10

platform.hpp

batmat::linalg::uview
Definition uview.hpp:80

structure.hpp

uview.hpp