develop/Doxygen/mat-vec_8tpp_source.html

#include <cyqlone/cyqlone.hpp>

#include <cyqlone/linalg.hpp>


#include <batmat/assume.hpp>

#include <batmat/linalg/gemv.hpp>

#include <batmat/linalg/simdify.hpp>

#include <batmat/linalg/symv.hpp>

#include <batmat/linalg/uview.hpp>

#include <batmat/loop.hpp>


namespace CYQLONE_NS(cyqlone) {


using namespace linalg;

using namespace batmat::linalg;


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::residual_dynamics_constr(Context &ctx, view<> x,

                                                                       view<> b,

                                                                       mut_view<> Mxb) const {

    // (Mx + b)(j) = A(j) x(j) + B(j) u(j) - x(j+1) + b(j)

    auto arrival          = ctx.arrive();

    const index_t c       = riccati_thread_assignment(ctx);

    const index_t dn      = c * n; // data batch index

    const index_t jn      = c * n; // stage index

    const index_t c_next  = add_wrap_p(c, 1);

    const index_t dn_next = c_next * n, d1_next = dn_next + n - 1;

    for (index_t i = n; i-- > 0;) {

        [[maybe_unused]] index_t j = sub_wrap_ceil_N(jn, i);

        GUANAQO_TRACE("resid_dyn_constr", j);

        index_t di = dn + i;

        auto BAj   = data_F.batch(di);

        auto uxj   = x.batch(di);

        auto bj    = b.batch(di);

        auto Mxbj  = Mxb.batch(di);

        gemv_add(BAj, uxj, bj, Mxbj); // A(j) x(j) + B(j) u(j) + b(j)

        if (i > 0) {

            index_t di_next = di - 1; // j + 1

            auto x_next     = x.batch(di_next).bottom_rows(nx);

            sub(Mxbj, x_next); // - x(j+1)

        } else {

            ctx.wait(std::move(arrival)); // x_next comes from next thread

            auto x_next = x.batch(d1_next).bottom_rows(nx);

            if (c_next > 0 || v == 1)

                sub(Mxbj, x_next);

            else

                sub(Mxbj, x_next, with_rotate<1>);

        }

    }

}


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::transposed_dynamics_constr(Context &ctx, view<> λ,

                                                                         mut_view<> Mᵀλ,

                                                                         bool accum) const {

    // (Mᵀλ)(j) = [ B(j)ᵀ ] λ(j) - [ 0 ] λ(j-1)

    //            [ A(j)ᵀ ]        [ I ]

    auto arrival          = ctx.arrive();

    const index_t c       = riccati_thread_assignment(ctx);

    const index_t dn      = c * n; // data batch index

    const index_t jn      = c * n; // stage index

    const index_t c_prev  = sub_wrap_p(c, 1);

    const index_t dn_prev = c_prev * n;

    for (index_t i = 0; i < n; ++i) {

        [[maybe_unused]] index_t j = sub_wrap_ceil_N(jn, i);

        GUANAQO_TRACE("trans_dyn_constr", j);

        index_t di = dn + i;

        auto BAj = data_F.batch(di), Bj = BAj.left_cols(nu);

        auto λj   = λ.batch(di);

        auto Mᵀλj = Mᵀλ.batch(di);

        if (v > 1 || c > 0 || i > 0) {

            accum ? gemv_add(BAj.transposed(), λj, Mᵀλj) //

                  : gemv(BAj.transposed(), λj, Mᵀλj);

        } else {

            accum ? gemv_add(Bj.transposed(), λj, Mᵀλj.top_rows(nu)) //

                  : gemv(Bj.transposed(), λj, Mᵀλj.top_rows(nu));

            if (!accum)

                Mᵀλj.bottom_rows(nx).set_constant(0);

        }

        if (i + 1 < n) {

            index_t di_prev = di + 1; // j - 1

            auto λ_prev     = λ.batch(di_prev);

            sub(Mᵀλj.bottom_rows(nx), λ_prev);

        } else {

            ctx.wait(std::move(arrival)); // λ_prev comes from previous thread

            auto λ_prev = λ.batch(dn_prev);

            if (c > 0 || v == 1)

                sub(Mᵀλj.bottom_rows(nx), λ_prev);

            else

                sub(Mᵀλj.bottom_rows(nx), λ_prev, with_rotate<-1>);

        }

    }

}


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::general_constr(Context &ctx, view<> ux,

                                                             mut_view<> DCux) const {

    const auto mul_Gx = []([[maybe_unused]] auto j, auto, auto Gᵀj, auto uxj, auto DCuxj) {

        GUANAQO_TRACE("general_constr", j);

        gemv(Gᵀj.transposed(), uxj, DCuxj);

    };

    foreach_stage(ctx, mul_Gx, data_Gᵀ, ux, DCux);

}


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::transposed_general_constr(Context &ctx, view<> y,

                                                                        mut_view<> DCᵀy) const {

    const auto mul_Gᵀy = []([[maybe_unused]] auto j, auto, auto Gᵀj, auto yj, auto DCᵀyj) {

        GUANAQO_TRACE("transposed_general_constr", j);

        gemv(Gᵀj, yj, DCᵀyj);

    };

    foreach_stage(ctx, mul_Gᵀy, data_Gᵀ, y, DCᵀy);

}


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::cost_gradient(Context &ctx, view<> ux, value_type α,

                                                            view<> q, value_type β,

                                                            mut_view<> grad_f) const {

    const auto mul_Hx = [&]([[maybe_unused]] auto j, auto, auto qj, auto Hj, auto uxj,

                            auto grad_fj) {

        GUANAQO_TRACE("cost_gradient", j);

        if (α != 0 || β != 1)

            axpby(α, qj, β, grad_fj);

        symv_add(tril(Hj), uxj, grad_fj);

    };

    foreach_stage(ctx, mul_Hx, q, data_H, ux, grad_f);

}


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::cost_gradient_regularized(Context &ctx, value_type γ,

                                                                        view<> ux, view<> ux0,

                                                                        view<> q,

                                                                        mut_view<> grad_f) const {

    simd inv_γ{1 / γ};

    const auto reg_simd = [inv_γ](auto qji, auto xji, auto x0ji) {

        return inv_γ * (xji - x0ji) + qji;

    };

    const auto mul_Hx = [&]([[maybe_unused]] auto j, auto, auto qj, auto Hj, auto uxj, auto ux0j,

                            auto grad_fj) {

        GUANAQO_TRACE("cost_gradient_regularized", j);

        linalg::transform_elementwise(reg_simd, grad_fj, qj, uxj, ux0j);

        symv_add(tril(Hj), uxj, grad_fj);

    };

    foreach_stage(ctx, mul_Hx, q, data_H, ux, ux0, grad_f);

}


template <index_t VL, class T, StorageOrder DefaultOrder, class Ctx>


void CyqloneSolver<VL, T, DefaultOrder, Ctx>::cost_gradient_remove_regularization(

    Context &ctx, value_type γ, view<> ux, view<> ux0, mut_view<> grad_f) const {

    simd inv_γ{1 / γ};

    const auto sub_reg_simd = [inv_γ](auto grad_fji, auto xji, auto x0ji) {

        return grad_fji + inv_γ * (x0ji - xji);

    };

    const auto sub_reg = [&]([[maybe_unused]] auto j, auto, auto uxj, auto ux0j, auto grad_fj) {

        GUANAQO_TRACE("cost_gradient_remove_regularization", j);

        linalg::transform_elementwise(sub_reg_simd, grad_fj, grad_fj, uxj, ux0j);

    };

    foreach_stage(ctx, sub_reg, ux, ux0, grad_f);

}


} // namespace CYQLONE_NS(cyqlone)

cyqlone.hpp
The main header for the Cyqlone and Tricyqle linear solvers.

batmat::linalg::gemv_add
void gemv_add(VA &&A, VB &&B, VC &&C, VD &&D, Opts... opts)

cyqlone::linalg::transform_elementwise
void transform_elementwise(F &&fun, VA &&A, VAs &&...As)
Apply a function to all elements of the given matrices or vectors, storing the result in the first ar...
Definition linalg.hpp:443

batmat::linalg::symv_add
void symv_add(Structured< VA, SA > A, VB &&B, VC &&C, VD &&D)

cyqlone::linalg::axpby
void axpby(Ta alpha, Vx &&x, Tb beta, Vy &&y, Vz &&z)
Add scaled vector z = αx + βy.
Definition linalg.hpp:343

batmat::linalg::gemv
void gemv(VA &&A, VB &&B, VD &&D, Opts... opts)

cyqlone::linalg::sub
void sub(VA &&A, VB &&B, VC &&C, with_rotate_t< Rotate >={})
Subtract two matrices or vectors C = A - B. Rotate affects B.
Definition linalg.hpp:401

batmat::linalg::tril
constexpr auto tril(M &&m)

GUANAQO_TRACE
#define GUANAQO_TRACE(name, instance,...)

linalg.hpp

batmat::linalg::with_rotate
constexpr with_rotate_t< I > with_rotate

cyqlone::CyqloneSolver::n
const index_t n
Number of stages per thread per vector lane (rounded up).
Definition cyqlone.hpp:605

cyqlone::CyqloneSolver::simd
tricyqle_t::simd simd
Definition cyqlone.hpp:598

cyqlone::CyqloneSolver::data_H
matrix< default_order > data_H
Stage-wise Hessian blocks H(j) = [ R(j) S(j); S(j)ᵀ Q(j) ] of the OCP cost function.
Definition cyqlone.hpp:762

cyqlone::CyqloneSolver::view
typename tricyqle_t::template view< O > view
Non-owning immutable view type for matrix.
Definition cyqlone.hpp:693

cyqlone::CyqloneSolver::data_F
matrix< default_order > data_F
Stage-wise dynamics matrices F(j) = [ B(j) A(j) ] of the OCP.
Definition cyqlone.hpp:766

cyqlone::CyqloneSolver::data_Gᵀ
matrix< default_order > data_Gᵀ
Stage-wise constraint Jacobians G(j)ᵀ = [ D(j) C(j) ]ᵀ of the OCP.
Definition cyqlone.hpp:770

cyqlone::CyqloneSolver::cost_gradient_remove_regularization
void cost_gradient_remove_regularization(Context &ctx, value_type γ, view<> x, view<> x0, mut_view<> grad_f) const
Subtract the regularization term from the cost gradient.
Definition mat-vec.tpp:147

cyqlone::CyqloneSolver::transposed_dynamics_constr
void transposed_dynamics_constr(Context &ctx, view<> λ, mut_view<> Mᵀλ, bool accum=false) const
Compute Mᵀλ, where M is the dynamics constraint Jacobian matrix of the OCP.
Definition mat-vec.tpp:52

cyqlone::CyqloneSolver::residual_dynamics_constr
void residual_dynamics_constr(Context &ctx, view<> x, view<> b, mut_view<> Mxb) const
Compute Mx + b, where M is the dynamics constraint Jacobian matrix of the OCP.
Definition mat-vec.tpp:17

cyqlone::CyqloneSolver::sub_wrap_ceil_N
index_t sub_wrap_ceil_N(index_t a, index_t b) const
Subtract b from a modulo N_horiz.
Definition indexing.tpp:53

cyqlone::CyqloneSolver::add_wrap_p
index_t add_wrap_p(index_t a, index_t b) const
Add b to a modulo p.
Definition indexing.tpp:73

cyqlone::CyqloneSolver::cost_gradient_regularized
void cost_gradient_regularized(Context &ctx, value_type γ, view<> ux, view<> ux0, view<> q, mut_view<> grad_f) const
Compute the regularized cost gradient, with regularization parameter γ⁻¹, with respect to the point u...
Definition mat-vec.tpp:129

cyqlone::CyqloneSolver::Context
tricyqle_t::Context Context
Definition cyqlone.hpp:596

cyqlone::CyqloneSolver::cost_gradient
void cost_gradient(Context &ctx, view<> ux, value_type α, view<> q, value_type β, mut_view<> grad_f) const
Compute the cost gradient, with optional scaling factors.
Definition mat-vec.tpp:115

cyqlone::CyqloneSolver::transposed_general_constr
void transposed_general_constr(Context &ctx, view<> y, mut_view<> DCᵀy) const
Compute Gᵀy, where G is the general constraint Jacobian matrix of the OCP.
Definition mat-vec.tpp:105

cyqlone::CyqloneSolver::foreach_stage
void foreach_stage(Context &ctx, auto &&func, auto &&...xs) const
Call a function for each stage in the horizon, passing the stage index, the data batch index,...
Definition cyqlone.hpp:623

cyqlone::CyqloneSolver::riccati_thread_assignment
index_t riccati_thread_assignment(Context &ctx) const
Definition cyqlone.hpp:972

cyqlone::CyqloneSolver::general_constr
void general_constr(Context &ctx, view<> ux, mut_view<> DCux) const
Compute the general constraints Gx, where G is the general constraint Jacobian matrix of the OCP.
Definition mat-vec.tpp:95

cyqlone::CyqloneSolver::sub_wrap_p
index_t sub_wrap_p(index_t a, index_t b) const
Subtract b from a modulo p.
Definition indexing.tpp:64

cyqlone::CyqloneSolver::mut_view
typename tricyqle_t::template mut_view< O > mut_view
Non-owning mutable view type for matrix.
Definition cyqlone.hpp:696

cyqlone::CyqloneSolver::nu
const index_t nu
Number of controls of the OCP.
Definition cyqlone.hpp:569

cyqlone::CyqloneSolver::value_type
T value_type
Definition cyqlone.hpp:562

cyqlone::CyqloneSolver::v
static constexpr index_t v
Vector length.
Definition cyqlone.hpp:603

cyqlone::CyqloneSolver::nx
const index_t nx
Number of states of the OCP.
Definition cyqlone.hpp:568