0.0.19/Doxygen/syomv_8hpp_source.html

#pragma once


#include <batmat/linalg/micro-kernels/syomv.hpp>

#include <batmat/linalg/simdify.hpp>

#include <batmat/linalg/triangular.hpp>

#include <batmat/linalg/uview.hpp>

#include <batmat/loop.hpp>

#include <batmat/matrix/storage.hpp>

#include <guanaqo/trace.hpp>


namespace batmat::linalg {


namespace detail::syomv {

template <class T, class Abi, micro_kernels::syomv::KernelConfig Conf = {}, StorageOrder OA,

          StorageOrder OB, StorageOrder OD>


void syomv(view<const T, Abi, OA> A, view<const T, Abi, OB> B, view<T, Abi, OD> D) {

    // In practice: n² for matrix-vector products, n² for transposed matrix-vector products,

    //              n for subtracting the dot products for the transposed products at the end.

    GUANAQO_TRACE_LINALG("syomv", (A.depth() - 1) * 2 * A.rows() * A.rows());

    // Check dimensions

    BATMAT_ASSERT(A.rows() == A.cols());

    BATMAT_ASSERT(A.rows() == D.rows());

    BATMAT_ASSERT(A.cols() == B.rows());

    BATMAT_ASSERT(B.cols() == D.cols());

    const index_t M = D.rows(), N = D.cols(), K = A.cols();


    // Degenerate case

    if (M == 0 || N == 0) [[unlikely]]

        return;

    if (K == 0) [[unlikely]]

        return;


    return micro_kernels::syomv::syomv_register<T, Abi, Conf>(A, B, D);

}


} // namespace detail::syomv


/// @addtogroup topic-linalg

/// @{


/// @name Symmetric matrix-vector multiplication of a block tridiagonal matrix

/// @{


/// @todo   Describe the operation in detail.

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VD>

    requires simdify_compatible<VA, VB, VD>


void syomv(Structured<VA, SA> A, VB &&B, VD &&D) {

    constexpr micro_kernels::syomv::KernelConfig conf{.negate = false, .struc_A = SA};

    detail::syomv::syomv<simdified_value_t<VA>, simdified_abi_t<VA>, conf>(

        simdify(A.value).as_const(), simdify(B).as_const(), simdify(D));

}


/// @todo   Describe the operation in detail.

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VD>

    requires simdify_compatible<VA, VB, VD>


void syomv_neg(Structured<VA, SA> A, VB &&B, VD &&D) {

    constexpr micro_kernels::syomv::KernelConfig conf{.negate = true, .struc_A = SA};

    detail::syomv::syomv<simdified_value_t<VA>, simdified_abi_t<VA>, conf>(

        simdify(A.value).as_const(), simdify(B).as_const(), simdify(D));

}


/// @}


/// @}


} // namespace batmat::linalg

BATMAT_ASSERT
#define BATMAT_ASSERT(x)
Definition assume.hpp:14

guanaqo::StorageOrder
StorageOrder

batmat::linalg::syomv
void syomv(Structured< VA, SA > A, VB &&B, VD &&D)
Definition syomv.hpp:46

batmat::linalg::syomv_neg
void syomv_neg(Structured< VA, SA > A, VB &&B, VD &&D)
Definition syomv.hpp:55

GUANAQO_TRACE_LINALG
#define GUANAQO_TRACE_LINALG(name, gflops)

loop.hpp

syomv.hpp

batmat::linalg::detail::syomv
Definition syomv.hpp:13

batmat::linalg::detail::syomv::syomv
void syomv(view< const T, Abi, OA > A, view< const T, Abi, OB > B, view< T, Abi, OD > D)
Definition syomv.hpp:16

batmat::linalg::micro_kernels::syomv::syomv_register
void syomv_register(view< const T, Abi, OA > A, view< const T, Abi, OB > B, view< T, Abi, OD > D) noexcept
Generalized matrix multiplication D = C ± A⁽ᵀ⁾ B⁽ᵀ⁾. Using register blocking.
Definition syomv.tpp:63

batmat::linalg::micro_kernels::syomv::KernelConfig
Definition syomv.hpp:10

batmat::linalg
Definition compress.hpp:11

batmat::linalg::simdified_abi_t
typename detail::simdified_abi< V >::type simdified_abi_t
Definition simdify.hpp:204

batmat::linalg::simdify_compatible
constexpr bool simdify_compatible
Definition simdify.hpp:207

batmat::linalg::simdify
constexpr auto simdify(simdifiable auto &&a) -> simdified_view_t< decltype(a)>
Definition simdify.hpp:214

batmat::linalg::view
simd_view_types< std::remove_const_t< T >, Abi >::template view< T, Order > view
Definition uview.hpp:70

simdify.hpp

storage.hpp
Aligned allocation for matrix storage.

batmat::linalg::Structured
Light-weight wrapper class used for overload resolution of triangular and symmetric matrices.
Definition triangular.hpp:13

batmat::linalg::Structured::value
M value
Definition triangular.hpp:18

triangular.hpp

uview.hpp