ONE/onert-micro_2include_2pal_2common_2_p_a_l_add_common_8h_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 * Copyright 2017 The TensorFlow Authors. All Rights Reserved.

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#ifndef ONERT_MICRO_EXECUTE_PAL_ADD_COMMON_H

#define ONERT_MICRO_EXECUTE_PAL_ADD_COMMON_H


#include "PALArithmeticOpCommon.h"


namespace onert_micro

{

namespace execute

{

namespace pal

{


int8_t AddFunc(int8_t x, int8_t y, const core::ArithmeticQuantParams &params)

{

  const int32_t input1_val = params.input1_offset + x;

  const int32_t input2_val = params.input2_offset + y;

  const int32_t shifted_input1_val = input1_val * (1 << params.left_shift);

  const int32_t shifted_input2_val = input2_val * (1 << params.left_shift);

  const int32_t scaled_input1_val = multiplyByQuantizedMultiplierSmallerThanOneExp(

    shifted_input1_val, params.input1_multiplier, params.input1_shift);

  const int32_t scaled_input2_val = multiplyByQuantizedMultiplierSmallerThanOneExp(

    shifted_input2_val, params.input2_multiplier, params.input2_shift);

  const int32_t raw_sum = scaled_input1_val + scaled_input2_val;

  const int32_t raw_output = multiplyByQuantizedMultiplierSmallerThanOneExp(

                               raw_sum, params.output_multiplier, params.output_shift) +

                             params.output_offset;

  const int32_t clamped_output = std::min(params.quantized_activation_max,

                                          std::max(params.quantized_activation_min, raw_output));

  return static_cast<int8_t>(clamped_output);

}


template <typename T>


OMStatus Add(const core::BinaryArithmeticBroadcastParams &params, const int flat_size,

             const T *input1_data, const T *input2_data, T *output_data)

{

  ArithmeticOp<T, AddFn<T>>(params, flat_size, input1_data, input2_data, output_data);

  return Ok;

}


template <typename T>


OMStatus BroadcastAdd4DSlow(const core::BinaryArithmeticBroadcastParams &params,

                            const core::OMRuntimeShape &input1_shape, const T *input1_data,

                            const core::OMRuntimeShape &input2_shape, const T *input2_data,

                            const core::OMRuntimeShape &output_shape, T *output_data)

{

  BroadcastArithmeticOp4DSlow<T, AddFn<T>>(params, input1_shape, input1_data, input2_shape,

                                           input2_data, output_shape, output_data);

  return Ok;

}


OMStatus BroadcastAdd4DSlow(const core::ArithmeticQuantParams &params,

                            const core::OMRuntimeShape &input1_shape, const int8_t *input1_data,

                            const core::OMRuntimeShape &input2_shape, const int8_t *input2_data,

                            const core::OMRuntimeShape &output_shape, int8_t *output_data)

{

  BroadcastBinaryFunction6DSlow(params, input1_shape, input1_data, input2_shape, input2_data,

                                output_shape, output_data, AddFunc);

  return Ok;

}


} // namespace pal

} // namespace execute

} // namespace onert_micro


#endif // ONERT_MICRO_EXECUTE_PAL_ADD_COMMON_H

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:31

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

onert_micro::execute::pal::BroadcastAdd4DSlow
OMStatus BroadcastAdd4DSlow(const core::BinaryArithmeticBroadcastParams &params, const core::OMRuntimeShape &input1_shape, const T *input1_data, const core::OMRuntimeShape &input2_shape, const T *input2_data, const core::OMRuntimeShape &output_shape, T *output_data)
Definition PALAddCommon.h:58

onert_micro::execute::pal::multiplyByQuantizedMultiplierSmallerThanOneExp
int32_t multiplyByQuantizedMultiplierSmallerThanOneExp(int32_t x, int32_t quantized_multiplier, int left_shift)
Definition PALUtils.h:112

onert_micro::execute::pal::Add
OMStatus Add(const core::ArithmeticQuantParams &params, const uint32_t flat_size, const int8_t *input1_data, const int8_t *input2_data, int8_t *output_data)
Definition PALAdd.h:33

onert_micro::execute::pal::AddFunc
int8_t AddFunc(int8_t x, int8_t y, const core::ArithmeticQuantParams &params)
Definition PALAddCommon.h:30

onert_micro::execute::pal::BroadcastBinaryFunction6DSlow
void BroadcastBinaryFunction6DSlow(const core::ArithmeticQuantParams &params, const core::OMRuntimeShape &input1_shape, const T *input1_data, const core::OMRuntimeShape &input2_shape, const T *input2_data, const core::OMRuntimeShape &output_shape, T *output_data, T(*binary_func)(T, T, const core::ArithmeticQuantParams &))
Definition PALArithmeticOpCommon.h:320

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

PALArithmeticOpCommon.h

onert_micro::core::ArithmeticQuantParams
Definition OMKernelData.h:111

onert_micro::core::ArithmeticQuantParams::output_offset
int32_t output_offset
Definition OMKernelData.h:121

onert_micro::core::ArithmeticQuantParams::quantized_activation_min
int32_t quantized_activation_min
Definition OMKernelData.h:123

onert_micro::core::ArithmeticQuantParams::left_shift
int left_shift
Definition OMKernelData.h:114

onert_micro::core::ArithmeticQuantParams::quantized_activation_max
int32_t quantized_activation_max
Definition OMKernelData.h:122

onert_micro::core::ArithmeticQuantParams::output_shift
int output_shift
Definition OMKernelData.h:120

onert_micro::core::ArithmeticQuantParams::input2_offset
int32_t input2_offset
Definition OMKernelData.h:113

onert_micro::core::ArithmeticQuantParams::input1_multiplier
int32_t input1_multiplier
Definition OMKernelData.h:115

onert_micro::core::ArithmeticQuantParams::input1_offset
int32_t input1_offset
Definition OMKernelData.h:112

onert_micro::core::ArithmeticQuantParams::input2_multiplier
int32_t input2_multiplier
Definition OMKernelData.h:116

onert_micro::core::ArithmeticQuantParams::output_multiplier
int32_t output_multiplier
Definition OMKernelData.h:119

onert_micro::core::ArithmeticQuantParams::input1_shift
int input1_shift
Definition OMKernelData.h:117

onert_micro::core::ArithmeticQuantParams::input2_shift
int input2_shift
Definition OMKernelData.h:118

onert_micro::core::BinaryArithmeticBroadcastParams
Definition OMKernelData.h:127