ONE/onert-micro_2src_2execute_2kernels_2_convolution_common_8cpp_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "execute/kernels/ConvolutionCommon.h"

#include "execute/OMUtils.h"


using namespace onert_micro;

using namespace onert_micro::core;


namespace onert_micro

{

namespace execute

{


OMStatus createConvParams(core::ConvQuant &params, const circle::Tensor *input,

                          const circle::Tensor *filter, const circle::Tensor *output,

                          circle::ActivationFunctionType act_type)

{

  assert(input->quantization() != nullptr);  // Fix caller

  assert(filter->quantization() != nullptr); // Fix caller

  assert(output->quantization() != nullptr); // Fix caller


  const auto *input_scales = input->quantization()->scale();

  const auto *filter_scales = filter->quantization()->scale();

  const auto *output_scales = output->quantization()->scale();


  assert(input_scales != nullptr);  // Fix caller

  assert(filter_scales != nullptr); // Fix caller

  assert(output_scales != nullptr); // Fix caller


  assert(input_scales->size() != 0);  // Fix caller

  assert(filter_scales->size() != 0); // Fix caller

  assert(output_scales->size() != 0); // Fix caller


  const auto input_zero_points = input->quantization()->zero_point();

  const auto filter_zero_points = filter->quantization()->zero_point();

  const auto output_zero_points = output->quantization()->zero_point();


  assert(input_zero_points != nullptr);  // Fix caller

  assert(filter_zero_points != nullptr); // Fix caller

  assert(output_zero_points != nullptr); // Fix caller


  assert(input_zero_points->size() != 0);  // Fix caller

  assert(filter_zero_points->size() != 0); // Fix caller

  assert(output_zero_points->size() != 0); // Fix caller


  const auto input_zp = input_zero_points->operator[](0);

  const auto filter_zp = filter_zero_points->operator[](0);

  const auto output_zp = output_zero_points->operator[](0);


  const auto output_scale = output_scales->operator[](0);


  int32_t activation_min{};

  int32_t activation_max{};

  OMStatus status = execute::calculateActivationRangeQuantized(

    act_type, static_cast<int32_t>(output_zp), output_scale, output->type(), &activation_min,

    &activation_max);

  assert(status == Ok);

  if (status != Ok)

    return status;


  // The kernel expects input and filter zero points to be negated.

  params.input_offset = -static_cast<int32_t>(input_zp);    // Note the '-'.

  params.weights_offset = -static_cast<int32_t>(filter_zp); // Note the '-'.

  params.output_offset = static_cast<int32_t>(output_zp);

  params.quantized_activation_min = activation_min;

  params.quantized_activation_max = activation_max;


  assert(filter_scales->size() > 1); // Support only channel-wise quantization

  // Channel-wise quantization

  const auto input_scale = input_scales->operator[](0);

  const std::vector<double> effective_output_scale =

    execute::getQuantizedConvolutionMultiplers(input_scale, filter_scales, output_scale);


  size_t n = effective_output_scale.size();

  params.per_channel_output_shift.resize(n);

  params.per_channel_output_multiplier.resize(n);

  for (size_t i = 0; i < n; ++i)

  {

    execute::quantizeMultiplier(effective_output_scale[i], &params.per_channel_output_multiplier[i],

                                &params.per_channel_output_shift[i]);

  }


  return Ok;

}

OMStatus createConvParams(core::ConvQuant &params, const circle::Tensor *input, {…}


} // namespace execute

} // namespace onert_micro

OMUtils.h

onert_micro::core
Definition OMMemoryManager.h:28

onert_micro::execute::quantizeMultiplier
void quantizeMultiplier(double double_multiplier, int32_t *quantized_multiplier, int *shift)
Definition OMUtils.cpp:23

onert_micro::execute::getQuantizedConvolutionMultiplers
std::vector< double > getQuantizedConvolutionMultiplers(float input_scale, const flatbuffers::Vector< float > *filter_scale, float output_scale)
Definition OMUtils.h:95

onert_micro::execute::calculateActivationRangeQuantized
OMStatus calculateActivationRangeQuantized(circle::ActivationFunctionType activation, int32_t output_zero_point, float output_scale, circle::TensorType data_type, int32_t *activation_min, int32_t *activation_max)
Definition OMUtils.cpp:112

onert_micro::execute::createConvParams
OMStatus createConvParams(core::ConvQuant &params, const circle::Tensor *input, const circle::Tensor *filter, const circle::Tensor *output, circle::ActivationFunctionType act_type)
Definition ConvolutionCommon.cpp:28

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

ConvolutionCommon.h

onert_micro::core::ConvQuant
Definition OMKernelData.h:139

onert_micro::core::ConvQuant::per_channel_output_shift
std::vector< int > per_channel_output_shift
Definition OMKernelData.h:157

onert_micro::core::ConvQuant::quantized_activation_min
int32_t quantized_activation_min
Definition OMKernelData.h:153

onert_micro::core::ConvQuant::quantized_activation_max
int32_t quantized_activation_max
Definition OMKernelData.h:154

onert_micro::core::ConvQuant::weights_offset
int32_t weights_offset
Definition OMKernelData.h:149

onert_micro::core::ConvQuant::output_offset
int32_t output_offset
Definition OMKernelData.h:150

onert_micro::core::ConvQuant::per_channel_output_multiplier
std::vector< int32_t > per_channel_output_multiplier
Definition OMKernelData.h:156

onert_micro::core::ConvQuant::input_offset
int32_t input_offset
Definition OMKernelData.h:148