develop/Doxygen/linalg_8tpp_source.html

#pragma once


#include <cyqlone/linalg.hpp>

#include <cyqlone/qpalm/backends/ocp-backend-cyqlone.tpp>


#include <array>

#include <span>


namespace CYQLONE_NS(cyqlone::qpalm) {


template <index_t VL, StorageOrder DefaultOrder>

template <class T, class U>


void CyQPALMBackend<VL, DefaultOrder>::xaxpy(Context &ctx, real_t a, const T &x, U &y) {

    const auto xaxpy = [a](auto, auto, auto xi, auto yi) { linalg::axpy(a, xi, yi); };

    ocp.foreach_stage(ctx, xaxpy, x, y);

}


template <index_t VL, StorageOrder DefaultOrder>

template <class T, class U>


void CyQPALMBackend<VL, DefaultOrder>::xcopy(Context &ctx, const T &x, U &y) const {

    const auto xcopy = [](auto, auto, auto xi, auto yi) { batmat::linalg::copy(xi, yi); };

    ocp.foreach_stage(ctx, xcopy, x, y);

}


template <index_t VL, StorageOrder DefaultOrder>

template <class T, class U>


void CyQPALMBackend<VL, DefaultOrder>::set_constant(Context &ctx, T &x, const U &y) const {

    const auto set_constant = [y](auto, auto, auto xi) { batmat::linalg::fill(y, xi); };

    ocp.foreach_stage(ctx, set_constant, x);

}


template <index_t VL, StorageOrder DefaultOrder>

template <class T>


void CyQPALMBackend<VL, DefaultOrder>::scale(Context &ctx, real_t s, T &x) const {

    const auto scale = [&](auto, auto, auto xi) { linalg::axpy<0>(s, xi, xi); };

    ocp.foreach_stage(ctx, scale, x);

}


template <index_t VL, StorageOrder DefaultOrder>


real_t CyQPALMBackend<VL, DefaultOrder>::dot(Context &ctx, const var_vec_t &a,

                                             const var_vec_t &b) const {

    real_t sum     = 0;

    const auto dot = [&](auto, auto, auto ai, auto bi) { sum += linalg::dot(ai, bi); };

    ocp.foreach_stage(ctx, dot, a, b);

    return ctx.reduce(sum);

}


template <index_t VL, StorageOrder DefaultOrder>

template <class... Args>


void CyQPALMBackend<VL, DefaultOrder>::local_dots(std::span<real_t, 1 + sizeof...(Args) / 2> out,

                                                  const auto &a, const auto &b,

                                                  const Args &...others) const {

    out[0] += linalg::dot(a, b);

    if constexpr (sizeof...(Args) > 0)

        local_dots(out.template subspan<1>(), others...);

}


template <index_t VL, StorageOrder DefaultOrder>

template <class... Args>

std::array<real_t, sizeof...(Args) / 2>


CyQPALMBackend<VL, DefaultOrder>::dots(Context &ctx, const Args &...args) const {

    using local_sums_t = std::array<real_t, sizeof...(Args) / 2>;

    local_sums_t local_sums{};

    const auto dots = [&](auto, auto, auto... batches) { local_dots(local_sums, batches...); };

    ocp.foreach_stage(ctx, dots, args...);

    return ctx.reduce(local_sums, [](local_sums_t a, local_sums_t b) {

        local_sums_t c{};

        for (size_t i = 0; i < a.size(); ++i)

            c[i] = a[i] + b[i];

        return c;

    });

}


template <index_t VL, StorageOrder DefaultOrder>

template <class T>


auto CyQPALMBackend<VL, DefaultOrder>::norm_inf_l1_sq(Context &ctx, const T &x) const {

    GUANAQO_TRACE("norm_inf_l1_sq", 0, 4 * x.batch_size() * x.rows() * ocp.n);

    auto nrm                  = norms.zero();

    const auto norm_inf_l1_sq = [&](auto, auto, auto xi) {

        nrm = norms(nrm, linalg::norms_all(xi));

    };

    ocp.foreach_stage(ctx, norm_inf_l1_sq, x);

    return ctx.reduce(nrm, norms);

}


template <index_t VL, StorageOrder DefaultOrder>

template <class T>


real_t CyQPALMBackend<VL, DefaultOrder>::norm_inf(Context &ctx, const T &x) const {

    using std::isfinite;

    return norm_inf_l1_sq(ctx, x).norm_inf();

}


template <index_t VL, StorageOrder DefaultOrder>

template <class T>


real_t CyQPALMBackend<VL, DefaultOrder>::norm_squared(Context &ctx, const T &x) const {

    real_t sumsq            = 0;

    const auto norm_squared = [&](auto, auto, auto xi) { sumsq += linalg::norm_2_squared(xi); };

    ocp.foreach_stage(ctx, norm_squared, x);

    return ctx.reduce(sumsq);

}


} // namespace CYQLONE_NS(cyqlone::qpalm)

CYQLONE_NS
#define CYQLONE_NS(ns)
Definition config.hpp:10

cyqlone::linalg::axpy
void axpy(Vy &&y, const std::array< simdified_value_t< Vy >, sizeof...(Vx)> &alphas, Vx &&...x)
Add scaled vector y = ∑ᵢ αᵢxᵢ + βy.
Definition linalg.hpp:361

cyqlone::linalg::norms_all
norms< simdified_value_t< Vx > >::result norms_all(Vx &&x)
Compute the norms (max, 1-norm, and 2-norm) of a vector.
Definition linalg.hpp:254

cyqlone::linalg::norm_2_squared
simdified_value_t< Vx > norm_2_squared(Vx &&x)
Compute the squared 2-norm of a vector.
Definition linalg.hpp:272

batmat::linalg::copy
void copy(VA &&A, VB &&B, Opts... opts)

cyqlone::linalg::dot
simdified_value_t< Vx > dot(Vx &&x, Vy &&y)
Compute the dot product of two vectors.
Definition linalg.hpp:286

batmat::linalg::fill
void fill(simdified_value_t< VB > a, VB &&B)

GUANAQO_TRACE
#define GUANAQO_TRACE(name, instance,...)

linalg.hpp

cyqlone
Definition barrier.hpp:25

ocp-backend-cyqlone.tpp

cyqlone::qpalm::CyQPALMBackend::var_vec_t
Definition ocp-backend-cyqlone.tpp:45

cyqlone::qpalm::CyQPALMBackend::local_dots
void local_dots(std::span< real_t, 1+sizeof...(Args)/2 > out, const auto &a, const auto &b, const Args &...others) const
Compute multiple partial dot products, without reducing across threads.
Definition linalg.tpp:50

cyqlone::qpalm::CyQPALMBackend::xcopy
void xcopy(Context &ctx, const T &x, U &y) const
Copy x to y.
Definition linalg.tpp:20

cyqlone::qpalm::CyQPALMBackend::dot
real_t dot(Context &ctx, const var_vec_t &a, const var_vec_t &b) const
Dot product of a and b.
Definition linalg.tpp:40

cyqlone::qpalm::CyQPALMBackend::norm_inf
real_t norm_inf(Context &ctx, const T &x) const
Infinity or max norm of x.
Definition linalg.tpp:88

cyqlone::qpalm::CyQPALMBackend::Context
typename OCP_t::Context Context
Definition ocp-backend-cyqlone.tpp:40

cyqlone::qpalm::CyQPALMBackend::xaxpy
void xaxpy(Context &ctx, real_t a, const T &x, U &y)
Compute y = a x + y.
Definition linalg.tpp:13

cyqlone::qpalm::CyQPALMBackend::ocp
OCP_t ocp
Definition ocp-backend-cyqlone.tpp:79

cyqlone::qpalm::CyQPALMBackend::norm_squared
real_t norm_squared(Context &ctx, const T &x) const
Squared l2 norm of x.
Definition linalg.tpp:95

cyqlone::qpalm::CyQPALMBackend::norm_inf_l1_sq
auto norm_inf_l1_sq(Context &ctx, const T &x) const
Compute the infinity, l1 and l2 norms of x.
Definition linalg.tpp:76

cyqlone::qpalm::CyQPALMBackend::set_constant
void set_constant(Context &ctx, T &x, const U &y) const
Set each element of x to the constant value y.
Definition linalg.tpp:27

cyqlone::qpalm::CyQPALMBackend::scale
void scale(Context &ctx, real_t s, T &x) const
Multiply a vector x by a scalar s.
Definition linalg.tpp:34

cyqlone::qpalm::CyQPALMBackend::norms
static constexpr auto norms
Definition ocp-backend-cyqlone.tpp:43

cyqlone::qpalm::CyQPALMBackend::dots
std::array< real_t, sizeof...(Args)/2 > dots(Context &ctx, const Args &...args) const
Compute multiple dot products at once.
Definition linalg.tpp:61