0.0.13/Doxygen/micro-kernels_2syomv_8hpp_source.html

#pragma once


#include <batmat/linalg/structure.hpp>

#include <batmat/linalg/uview.hpp>

#include <batmat/lut.hpp>

#include <batmat/platform/platform.hpp>


namespace batmat::linalg::micro_kernels::syomv {


struct KernelConfig {

    bool negate             = false;

    MatrixStructure struc_A = MatrixStructure::LowerTriangular;

};


template <class T, class Abi, KernelConfig Conf, index_t RowsReg, StorageOrder OA, StorageOrder OB,

          StorageOrder OD>

void syomv_microkernel(uview<const T, Abi, OA> A, uview<const T, Abi, OB> B, uview<T, Abi, OD> D,

                       index_t l0, index_t k) noexcept;


template <class T, class Abi, KernelConfig Conf, StorageOrder OA, StorageOrder OB, StorageOrder OD>

void syomv_register(view<const T, Abi, OA> A, view<const T, Abi, OB> B,

                    view<T, Abi, OD> D) noexcept;


// Square block sizes greatly simplify handling of triangular matrices.

using gemm::RowsReg;


template <class T, class Abi, KernelConfig Conf, StorageOrder OA, StorageOrder OB, StorageOrder OD>

inline const constinit auto syomv_lut =

    make_1d_lut<RowsReg<T, Abi>>([]<index_t Row>(index_constant<Row>) {

        return syomv_microkernel<T, Abi, Conf, Row + 1, OA, OB, OD>;

    });


} // namespace batmat::linalg::micro_kernels::syomv


guanaqo::StorageOrder
StorageOrder

batmat::linalg::MatrixStructure
MatrixStructure
Definition structure.hpp:8

batmat::linalg::MatrixStructure::LowerTriangular
@ LowerTriangular
Definition structure.hpp:8

batmat::make_1d_lut
consteval auto make_1d_lut(F f)
Returns an array of the form:
Definition lut.hpp:39

lut.hpp

batmat::linalg::micro_kernels::gemm::RowsReg
constexpr index_t RowsReg
Register block size of the matrix-matrix multiplication micro-kernels.
Definition avx-512.hpp:13

batmat::linalg::micro_kernels::syomv
Definition syomv.hpp:8

batmat::linalg::micro_kernels::syomv::syomv_lut
const constinit auto syomv_lut
Definition syomv.hpp:28

batmat::linalg::micro_kernels::syomv::KernelConfig::struc_A
MatrixStructure struc_A
Definition syomv.hpp:12

batmat::linalg::micro_kernels::syomv::RowsReg
constexpr index_t RowsReg
Register block size of the matrix-matrix multiplication micro-kernels.
Definition avx-512.hpp:13

batmat::linalg::micro_kernels::syomv::KernelConfig::negate
bool negate
Definition syomv.hpp:11

batmat::linalg::micro_kernels::syomv::syomv_microkernel
void syomv_microkernel(uview< const T, Abi, OA > A, uview< const T, Abi, OB > B, uview< T, Abi, OD > D, index_t l0, index_t k) noexcept
Symmetric off-diagonal block multiply. Single register block.
Definition syomv.tpp:17

batmat::linalg::micro_kernels::syomv::syomv_register
void syomv_register(view< const T, Abi, OA > A, view< const T, Abi, OB > B, view< T, Abi, OD > D) noexcept
Generalized matrix multiplication D = C ± A⁽ᵀ⁾ B⁽ᵀ⁾. Using register blocking.
Definition syomv.tpp:56

batmat::linalg::micro_kernels::syomv::KernelConfig
Definition syomv.hpp:10

batmat::linalg::view
simd_view_types< std::remove_const_t< T >, Abi >::template view< T, Order > view
Definition uview.hpp:70

batmat::index_constant
std::integral_constant< index_t, I > index_constant
Definition lut.hpp:10

platform.hpp

batmat::linalg::uview
Definition uview.hpp:80

structure.hpp

uview.hpp