ONE/onert-micro_2onert-micro_2src_2execute_2kernels_2_softmax_8cpp_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "OMStatus.h"


#include "core/OMUtils.h"


#include "execute/OMKernelExecutionBuilder.h"

#include "execute/OMRuntimeKernel.h"


#include "PALSoftmax.h"


#include "execute/OMUtils.h"


using namespace onert_micro;

using namespace onert_micro::execute;


namespace

{


constexpr uint32_t inputTensorIdx = 0;

constexpr uint32_t outputTensorIdx = 0;


static const int kScaledDiffIntegerBits = 5;

void preprocessSoftmaxScaling(double beta, double input_scale, int input_integer_bits,

                              int32_t *quantized_multiplier, int *left_shift)

{

  const double max_real_multiplier = (1LL << 31) - 1.0;

  const double input_beta_real_multiplier =

    std::min<double>(beta * input_scale * (1 << (31 - input_integer_bits)), max_real_multiplier);


  onert_micro::execute::quantizeMultiplier(input_beta_real_multiplier, quantized_multiplier,

                                           left_shift);

}


} // namespace


// NOTE: doesnt currently support dynamic shapes

namespace onert_micro

{

namespace execute

{


OMStatus execute_kernel_CircleSoftmax(const OMExecuteArgs &execute_args)

{

  core::OMRuntimeContext &runtime_context = execute_args.runtime_context;

  core::OMRuntimeStorage &runtime_storage = execute_args.runtime_storage;

  uint16_t op_index = execute_args.kernel_index;


  const circle::Tensor *input = nullptr;

  const circle::Tensor *output = nullptr;


  uint8_t *input_data = nullptr;

  uint8_t *output_data = nullptr;


  OMStatus status = Ok;


  const circle::SoftmaxOptions *options;

  {

    OMRuntimeKernel runtime_kernel;

    runtime_kernel.readKernel(op_index, runtime_context);


    input = runtime_kernel.inputs[inputTensorIdx];

    output = runtime_kernel.outputs[outputTensorIdx];


    assert(input != nullptr);

    assert(output != nullptr);


    status = runtime_kernel.getDataFromStorage(op_index, runtime_storage, runtime_context);

    if (status != Ok)

      return status;


    input_data = runtime_kernel.inputs_data[inputTensorIdx];

    output_data = runtime_kernel.outputs_data[outputTensorIdx];


    options = runtime_kernel.first_operator->builtin_options_as_SoftmaxOptions();

  }


  assert(input_data != nullptr);

  assert(output_data != nullptr);


  const float beta = options->beta();


  core::OMRuntimeShape inputs_shape(input);

  core::OMRuntimeShape outputs_shape(output);


  const auto dim_count = inputs_shape.dimensionsCount();


  const auto trailing_dim = dim_count - 1;


  int flat_size = 1;

  for (int i = 0; i < inputs_shape.dimensionsCount(); ++i)

  {

    flat_size *= (i == trailing_dim) ? 1 : inputs_shape.dims(i);

  }


  core::SoftmaxParams params{};

  params.beta = beta;

  params.num_rows = flat_size;

  params.row_size = std::min(inputs_shape.dims(trailing_dim), outputs_shape.dims(trailing_dim));


  switch (input->type())

  {

#ifndef DIS_FLOAT

    case circle::TensorType_FLOAT32:

    {


      status = pal::Softmax(params, core::utils::castInputData<float>(input_data),

                            core::utils::castOutputData<float>(output_data));

    }

    break;

#endif // DIS_FLOAT

#ifndef DIS_QUANT

    case circle::TensorType_INT8:

    {

      assert(output->type() == circle::TensorType_INT8);

      if (output->type() != circle::TensorType_INT8)

        return UnsupportedType;


      assert(input->quantization() != nullptr and output->quantization() != nullptr);

      assert(input->quantization()->scale() != nullptr and

             output->quantization()->scale() != nullptr);

      assert(input->quantization()->zero_point() != nullptr and

             output->quantization()->zero_point() != nullptr);

      assert(input->quantization()->scale()->size() == 1 and

             output->quantization()->scale()->size() == 1);

      assert(input->quantization()->zero_point()->size() == 1 and

             output->quantization()->zero_point()->size() == 1);


      params.output_scale = output->quantization()->scale()->operator[](0);

      params.input_scale = input->quantization()->scale()->operator[](0);

      params.output_zp = output->quantization()->zero_point()->operator[](0);

      params.input_zp = input->quantization()->zero_point()->operator[](0);


      int left_shift = 0;

      preprocessSoftmaxScaling(static_cast<double>(params.beta),

                               static_cast<double>(params.input_scale), kScaledDiffIntegerBits,

                               &params.input_multiplier, &left_shift);

      params.input_left_shift = left_shift;

      params.diff_min = -1.0 * onert_micro::execute::calculateInputRadius(

                                 kScaledDiffIntegerBits, params.input_left_shift, 31);


      status = pal::Softmax(params, core::utils::castInputData<int8_t>(input_data),

                            core::utils::castOutputData<int8_t>(output_data));

    }

    break;

#endif // DIS_QUANT

    default:

    {

      status = UnsupportedType;

      assert(false && "Unsupported type.");

    }

  }


  return status;

}


} // namespace execute

} // namespace onert_micro

OMKernelExecutionBuilder.h

OMRuntimeKernel.h

OMStatus.h

onert_micro::core::OMRuntimeContext
Definition OMRuntimeContext.h:37

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:31

onert_micro::core::OMRuntimeShape::dimensionsCount
size_t dimensionsCount() const noexcept
Definition OMRuntimeShape.h:148

onert_micro::core::OMRuntimeShape::dims
int32_t dims(size_t i) const
Definition OMRuntimeShape.h:153

onert_micro::core::OMRuntimeStorage
Definition OMRuntimeStorage.h:34

onert_micro::execute::OMRuntimeKernel
Definition OMRuntimeKernel.h:35

onert_micro::execute::OMRuntimeKernel::outputs_data
uint8_t * outputs_data[maxOutputSize]
Definition OMRuntimeKernel.h:55

onert_micro::execute::OMRuntimeKernel::first_operator
const circle::Operator * first_operator
Definition OMRuntimeKernel.h:63

onert_micro::execute::OMRuntimeKernel::getDataFromStorage
OMStatus getDataFromStorage(uint16_t op_index, core::OMRuntimeStorage &storage, core::OMRuntimeContext &context)
Definition OMRuntimeKernel.cpp:67

onert_micro::execute::OMRuntimeKernel::inputs_data
uint8_t * inputs_data[maxInputSize]
Definition OMRuntimeKernel.h:54

onert_micro::execute::OMRuntimeKernel::readKernel
OMStatus readKernel(uint16_t op_index, core::OMRuntimeContext &runtime_context)
Definition OMRuntimeKernel.cpp:22

onert_micro::execute::OMRuntimeKernel::outputs
const circle::Tensor * outputs[maxOutputSize]
Definition OMRuntimeKernel.h:52

onert_micro::execute::OMRuntimeKernel::inputs
const circle::Tensor * inputs[maxInputSize]
Definition OMRuntimeKernel.h:51

OMUtils.h

OMUtils.h

TensorIndexTISO::outputTensorIdx
constexpr uint32_t outputTensorIdx
Definition ReadKernelDataCommon.cpp:28

onert_micro::execute::pal::Softmax
OMStatus Softmax(const core::SoftmaxParams &params, const T *input_data, U *output_data)
Definition PALSoftmaxCommon.h:33

onert_micro::execute
Definition ArgCommon.h:33

onert_micro::execute::quantizeMultiplier
void quantizeMultiplier(double double_multiplier, int32_t *quantized_multiplier, int *shift)
Definition OMUtils.cpp:23

onert_micro::execute::execute_kernel_CircleSoftmax
OMStatus execute_kernel_CircleSoftmax(const OMExecuteArgs &execute_args)
Definition Softmax.cpp:57

onert_micro::execute::calculateInputRadius
int calculateInputRadius(int input_integer_bits, int input_left_shift, int total_signed_bits)
Definition OMUtils.h:170

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

onert_micro::UnsupportedType
@ UnsupportedType
Definition OMStatus.h:26

onert_micro::core::SoftmaxParams
Definition OMKernelData.h:46

onert_micro::core::SoftmaxParams::beta
float beta
Definition OMKernelData.h:47

onert_micro::execute::OMExecuteArgs
Definition OMExecuteArgs.h:31

onert_micro::execute::OMExecuteArgs::kernel_index
uint16_t kernel_index
Definition OMExecuteArgs.h:34

onert_micro::execute::OMExecuteArgs::runtime_context
core::OMRuntimeContext & runtime_context
Definition OMExecuteArgs.h:33

onert_micro::execute::OMExecuteArgs::runtime_storage
core::OMRuntimeStorage & runtime_storage
Definition OMExecuteArgs.h:32