develop/Doxygen/symv_8hpp_source.html

#pragma once


#include <batmat/linalg/micro-kernels/symv.hpp>

#include <batmat/linalg/simdify.hpp>

#include <batmat/linalg/triangular.hpp>

#include <batmat/linalg/uview.hpp>

#include <batmat/loop.hpp>

#include <batmat/matrix/storage.hpp>

#include <guanaqo/trace.hpp>


namespace batmat::linalg {


namespace detail {

template <class T, class Abi, micro_kernels::symv::KernelConfig Conf = {}, StorageOrder OA>

    requires(Conf.struc_A == MatrixStructure::LowerTriangular ||

             Conf.struc_A == MatrixStructure::UpperTriangular)


void symv(view<const T, Abi, OA> A, view<const T, Abi> B, std::optional<view<const T, Abi>> C,

          view<T, Abi> D) {

    static_assert(Conf.struc_A == MatrixStructure::LowerTriangular); // TODO

    GUANAQO_TRACE_LINALG("symv", A.rows() * A.cols() * B.cols() * A.depth());

    // Check dimensions

    const index_t M = D.rows();

    BATMAT_ASSERT(!C || C->rows() == D.rows());

    BATMAT_ASSERT(!C || C->cols() == D.cols());

    BATMAT_ASSERT(A.rows() == M);

    BATMAT_ASSERT(A.cols() == M);

    BATMAT_ASSERT(B.cols() == D.cols());

    BATMAT_ASSERT(B.cols() == 1);


    // Degenerate case

    if (M == 0) [[unlikely]]

        return;

    micro_kernels::symv::symv_copy_register<T, Abi, Conf, OA>(A, B, C, D);

}


} // namespace detail


/// @addtogroup topic-linalg

/// @{


/// @name Symmetric matrix-vector multiplication of batches of matrices

/// @{


/// d = A b where A is symmetric

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VD>

    requires simdify_compatible<VA, VB, VD>


void symv(Structured<VA, SA> A, VB &&B, VD &&D) {

    static constexpr micro_kernels::symv::KernelConfig conf{.negate = false, .struc_A = SA};

    std::optional<decltype(simdify(D).as_const())> null;

    detail::symv<simdified_value_t<VA>, simdified_abi_t<VA>, conf>(

        simdify(A.value).as_const(), simdify(B).as_const(), null, simdify(D));

}


/// d = -A b where A is symmetric

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VD>

    requires simdify_compatible<VA, VB, VD>


void symv_neg(Structured<VA, SA> A, VB &&B, VD &&D) {

    static constexpr micro_kernels::symv::KernelConfig conf{.negate = true, .struc_A = SA};

    std::optional<decltype(simdify(D).as_const())> null;

    detail::symv<simdified_value_t<VA>, simdified_abi_t<VA>, conf>(

        simdify(A.value).as_const(), simdify(B).as_const(), null, simdify(D));

}


/// d = c + A b where A is symmetric

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VC, simdifiable VD>

    requires simdify_compatible<VA, VB, VC, VD>


void symv_add(Structured<VA, SA> A, VB &&B, VC &&C, VD &&D) {

    static constexpr micro_kernels::symv::KernelConfig conf{.negate = false, .struc_A = SA};

    detail::symv<simdified_value_t<VA>, simdified_abi_t<VA>, conf>(

        simdify(A.value).as_const(), simdify(B).as_const(), simdify(C).as_const(), simdify(D));

}


/// d = d + A b where A is symmetric

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VD>

    requires simdify_compatible<VA, VB, VD>


void symv_add(Structured<VA, SA> A, VB &&B, VD &&D) {

    symv_add(A.ref(), B, D, D);

}


/// d = c - A b where A is symmetric

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VC, simdifiable VD>

    requires simdify_compatible<VA, VB, VC, VD>


void symv_sub(Structured<VA, SA> A, VB &&B, VC &&C, VD &&D) {

    static constexpr micro_kernels::symv::KernelConfig conf{.negate = true, .struc_A = SA};

    detail::symv<simdified_value_t<VA>, simdified_abi_t<VA>, conf>(

        simdify(A.value).as_const(), simdify(B).as_const(), simdify(C).as_const(), simdify(D));

}


/// d = d - A b where A is symmetric

template <MatrixStructure SA, simdifiable VA, simdifiable VB, simdifiable VD>

    requires simdify_compatible<VA, VB, VD>


void symv_sub(Structured<VA, SA> A, VB &&B, VD &&D) {

    symv_sub(A.ref(), B, D, D);

}


/// @}


/// @}


} // namespace batmat::linalg

BATMAT_ASSERT
#define BATMAT_ASSERT(x)
Definition assume.hpp:14

guanaqo::StorageOrder
StorageOrder

batmat::linalg::symv_sub
void symv_sub(Structured< VA, SA > A, VB &&B, VC &&C, VD &&D)
d = c - A b where A is symmetric
Definition symv.hpp:82

batmat::linalg::symv_add
void symv_add(Structured< VA, SA > A, VB &&B, VC &&C, VD &&D)
d = c + A b where A is symmetric
Definition symv.hpp:67

batmat::linalg::symv_neg
void symv_neg(Structured< VA, SA > A, VB &&B, VD &&D)
d = -A b where A is symmetric
Definition symv.hpp:57

batmat::linalg::symv
void symv(Structured< VA, SA > A, VB &&B, VD &&D)
d = A b where A is symmetric
Definition symv.hpp:47

batmat::linalg::MatrixStructure::LowerTriangular
@ LowerTriangular
Definition structure.hpp:8

batmat::linalg::MatrixStructure::UpperTriangular
@ UpperTriangular
Definition structure.hpp:8

GUANAQO_TRACE_LINALG
#define GUANAQO_TRACE_LINALG(name, gflops)

loop.hpp

symv.hpp

batmat::linalg::detail
Definition compress.hpp:14

batmat::linalg::detail::symv
void symv(view< const T, Abi, OA > A, view< const T, Abi > B, std::optional< view< const T, Abi > > C, view< T, Abi > D)
Definition symv.hpp:17

batmat::linalg::micro_kernels::symv::symv_copy_register
void symv_copy_register(view< const T, Abi, OA > A, view< const T, Abi > B, std::optional< view< const T, Abi > > C, view< T, Abi > D) noexcept
Generalized matrix multiplication d = c ± A⁽ᵀ⁾ b. Using register blocking.
Definition symv.tpp:72

batmat::linalg::micro_kernels::symv::KernelConfig
Definition symv.hpp:11

batmat::linalg
Definition compress.hpp:12

batmat::linalg::simdified_abi_t
typename detail::simdified_abi< V >::type simdified_abi_t
Definition simdify.hpp:216

batmat::linalg::simdify_compatible
constexpr bool simdify_compatible
Definition simdify.hpp:221

batmat::linalg::simdify
constexpr auto simdify(simdifiable auto &&a) -> simdified_view_t< decltype(a)>
Definition simdify.hpp:228

batmat::linalg::view
simd_view_types< std::remove_const_t< T >, Abi >::template view< T, Order > view
Definition uview.hpp:70

batmat::index_t
int index_t
Definition config.hpp:13

simdify.hpp

storage.hpp
Aligned allocation for matrix storage.

batmat::linalg::Structured
Light-weight wrapper class used for overload resolution of triangular and symmetric matrices.
Definition triangular.hpp:13

batmat::linalg::Structured::value
M value
Definition triangular.hpp:18

batmat::linalg::Structured::ref
constexpr auto ref()
Definition triangular.hpp:30

triangular.hpp

uview.hpp