ONE/onert-micro_2onert-micro_2src_2execute_2kernels_2_s_v_d_f_8cpp_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "OMStatus.h"


#include "core/OMUtils.h"

#include "core/OMDataType.h"

#include "core/OMKernelData.h"

#include "core/memory/OMMemoryManager.h"


#include "execute/OMKernelExecutionBuilder.h"

#include "execute/OMUtils.h"

#include "execute/OMRuntimeKernel.h"


#include "PALSVDF.h"


using namespace onert_micro;

using namespace onert_micro::core;

using namespace onert_micro::execute;


namespace

{


constexpr int inputTensorIdx = 0;

constexpr int weightsFeatureTensorIdx = 1;

constexpr int weightsTimeTensorIdx = 2;

constexpr int biasTensorIdx = 3;

constexpr int inputActivationStateTensorIdx =

  4; // This is a variable tensor, and will be modified by this op.

constexpr int outputTensorIdx = 0;


void prepareQuantParams(core::SVDFQuantParams &params, const circle::Tensor *input,

                        const circle::Tensor *weights_feature, const circle::Tensor *weights_time,

                        const circle::Tensor *activation_state, const circle::Tensor *output)

{

  assert(input->quantization() != nullptr);

  assert(output->quantization() != nullptr);

  assert(weights_feature->quantization() != nullptr);

  assert(weights_time->quantization() != nullptr);

  assert(activation_state->quantization() != nullptr);


  // Write zero points

  params.input_zero_point =

    static_cast<int32_t>(input->quantization()->zero_point()->operator[](0));

  params.output_zero_point =

    static_cast<int32_t>(output->quantization()->zero_point()->operator[](0));

  params.activation_state_zero_point =

    static_cast<int32_t>(activation_state->quantization()->zero_point()->operator[](0));


  // Calculate effective scales

  const float effective_scale_1 = (input->quantization()->scale()->operator[](0) *

                                   weights_feature->quantization()->scale()->operator[](0)) /

                                  (activation_state->quantization()->scale()->operator[](0));

  const float effective_scale_2 = (activation_state->quantization()->scale()->operator[](0) *

                                   weights_time->quantization()->scale()->operator[](0)) /

                                  (output->quantization()->scale()->operator[](0));


  execute::quantizeMultiplier(effective_scale_1, &params.effective_scale_1_a,

                              &params.effective_scale_1_b);

  execute::quantizeMultiplier(effective_scale_2, &params.effective_scale_2_a,

                              &params.effective_scale_2_b);

}


} // namespace


namespace onert_micro

{

namespace execute

{


OMStatus execute_kernel_CircleSVDF(const OMExecuteArgs &execute_args)

{

  core::OMRuntimeContext &runtime_context = execute_args.runtime_context;

  core::OMRuntimeStorage &runtime_storage = execute_args.runtime_storage;

  uint16_t op_index = execute_args.kernel_index;


  const circle::Tensor *input;

  const circle::Tensor *weights_feature;

  const circle::Tensor *weights_time;

  const circle::Tensor *bias;

  const circle::Tensor *activation_state;


  const circle::Tensor *output;


  uint8_t *input_data;

  uint8_t *weights_feature_data;

  uint8_t *weights_time_data;

  uint8_t *bias_data;

  uint8_t *activation_state_data;

  uint8_t *output_data;

  const circle::SVDFOptions *options = nullptr;

  // Read kernel

  {

    execute::OMRuntimeKernel runtime_kernel;

    OMStatus status = runtime_kernel.readKernel(op_index, runtime_context);

    if (status != Ok)

      return status;


    input = runtime_kernel.inputs[inputTensorIdx];

    weights_feature = runtime_kernel.inputs[weightsFeatureTensorIdx];

    weights_time = runtime_kernel.inputs[weightsTimeTensorIdx];

    bias = runtime_kernel.inputs[biasTensorIdx];

    activation_state = runtime_kernel.inputs[inputActivationStateTensorIdx];


    output = runtime_kernel.outputs[outputTensorIdx];


    assert(input != nullptr);

    assert(weights_feature != nullptr);

    assert(weights_time != nullptr);

    // bias can be nullptr

    assert(activation_state != nullptr);

    assert(output != nullptr);


    status = runtime_kernel.getDataFromStorage(op_index, runtime_storage, runtime_context);

    if (status != Ok)

      return status;


    input_data = runtime_kernel.inputs_data[inputTensorIdx];

    weights_feature_data = runtime_kernel.inputs_data[weightsFeatureTensorIdx];

    weights_time_data = runtime_kernel.inputs_data[weightsTimeTensorIdx];

    bias_data = runtime_kernel.inputs_data[biasTensorIdx];

    activation_state_data = runtime_kernel.inputs_data[inputActivationStateTensorIdx];

    output_data = runtime_kernel.outputs_data[outputTensorIdx];


    assert(input_data != nullptr);

    assert(weights_feature_data != nullptr);

    assert(weights_time_data != nullptr);

    // bias can be nullptr

    assert(output_data != nullptr);


    options = runtime_kernel.first_operator->builtin_options_as_SVDFOptions();

  }


  OMStatus status;

  OMRuntimeShape input_shape(input);

  OMRuntimeShape weights_feature_shape(weights_feature);

  OMRuntimeShape weights_time_shape(weights_time);

  OMRuntimeShape activation_state_shape(activation_state);

  OMRuntimeShape output_shape(output);


  // Define input constants based on input tensor definition above:

  const int rank = options->rank();

  const int input_size = input_shape.dims(1);

  const int batch_size = input_shape.dims(0);

  const int num_filters = weights_feature_shape.dims(0);


  const int num_units = num_filters / rank;

  const int memory_size = weights_time_shape.dims(1);


  const auto activation_state_size =

    activation_state_shape.flatSize() * sizeof(core::OMDataType(output->type()));

  status =

    core::memory::OMMemoryManager::allocateMemory(activation_state_size, &activation_state_data);

  if (status != Ok)

    return status;


  std::memset(activation_state_data, 0, activation_state_size);


  switch (input->type())

  {

#ifndef DIS_FLOAT

    case circle::TensorType_FLOAT32:

    {

      // Temporary buffer

      uint8_t *scratch_buffer;

      status = core::memory::OMMemoryManager::allocateMemory(

        batch_size * num_filters * sizeof(core::OMDataType(output->type())), &scratch_buffer);


      assert(status == Ok);

      if (status != Ok)

        return status;

      status = pal::SVDF(

        utils::castInputData<float>(input_data), utils::castInputData<float>(weights_feature_data),

        utils::castInputData<float>(weights_time_data), utils::castInputData<float>(bias_data),

        utils::castOutputData<float>(activation_state_data),

        utils::castOutputData<float>(scratch_buffer), utils::castOutputData<float>(output_data),

        rank, input_size, batch_size, num_filters, num_units, memory_size,

        options->fused_activation_function());


      status = core::memory::OMMemoryManager::deallocateMemory(scratch_buffer);

    }

    break;

#endif // DIS_FLOAT

#ifndef DIS_QUANT

    case circle::TensorType_INT8:

    {

      core::SVDFQuantParams params{};

      prepareQuantParams(params, input, weights_feature, weights_time, activation_state, output);


      params.rank = rank;


      status = pal::SVDF(

        params, utils::castInputData<int8_t>(input_data),

        utils::castInputData<int8_t>(weights_feature_data),

        utils::castInputData<int8_t>(weights_time_data), utils::castInputData<int32_t>(bias_data),

        utils::castOutputData<int8_t>(activation_state_data),

        utils::castOutputData<int8_t>(output_data), input_shape, weights_feature_shape,

        weights_time_shape, core::OMRuntimeShape(bias), output_shape);

    }

    break;

#endif // DIS_QUANT

    default:

    {

      status = UnsupportedActivation;

      assert(false && "Unsupported type.");

      break;

    }

  }


  status = core::memory::OMMemoryManager::deallocateMemory(activation_state_data);


  return status;

}


} // namespace execute

} // namespace onert_micro

OMDataType.h

OMKernelData.h

OMKernelExecutionBuilder.h

OMMemoryManager.h

OMRuntimeKernel.h

OMStatus.h

onert_micro::core::OMRuntimeContext
Definition OMRuntimeContext.h:37

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:31

onert_micro::core::OMRuntimeShape::dims
int32_t dims(size_t i) const
Definition OMRuntimeShape.h:153

onert_micro::core::OMRuntimeShape::flatSize
size_t flatSize() const
Definition OMRuntimeShape.h:121

onert_micro::core::OMRuntimeStorage
Definition OMRuntimeStorage.h:35

onert_micro::execute::OMRuntimeKernel
Definition OMRuntimeKernel.h:36

onert_micro::execute::OMRuntimeKernel::outputs_data
uint8_t * outputs_data[maxOutputSize]
Definition OMRuntimeKernel.h:56

onert_micro::execute::OMRuntimeKernel::first_operator
const circle::Operator * first_operator
Definition OMRuntimeKernel.h:64

onert_micro::execute::OMRuntimeKernel::getDataFromStorage
OMStatus getDataFromStorage(uint16_t op_index, core::OMRuntimeStorage &storage, core::OMRuntimeContext &context)
Definition OMRuntimeKernel.cpp:67

onert_micro::execute::OMRuntimeKernel::inputs_data
uint8_t * inputs_data[maxInputSize]
Definition OMRuntimeKernel.h:55

onert_micro::execute::OMRuntimeKernel::readKernel
OMStatus readKernel(uint16_t op_index, core::OMRuntimeContext &runtime_context)
Definition OMRuntimeKernel.cpp:22

onert_micro::execute::OMRuntimeKernel::outputs
const circle::Tensor * outputs[maxOutputSize]
Definition OMRuntimeKernel.h:53

onert_micro::execute::OMRuntimeKernel::inputs
const circle::Tensor * inputs[maxInputSize]
Definition OMRuntimeKernel.h:52

OMUtils.h

OMUtils.h

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

TensorIndexTISO::outputTensorIdx
constexpr uint32_t outputTensorIdx
Definition ReadKernelDataCommon.cpp:28

gen_h5_explicit_inputs_all.output
output
Definition gen_h5_explicit_inputs_all.py:96

mir_caffe::CaffeOpType::input
@ input

onert_micro::core
Definition OMMemoryManager.h:29

onert_micro::core::OMDataType
OMDataType
"scalar" value type
Definition OMDataType.h:35

onert_micro::execute::pal::SVDF
OMStatus SVDF(const core::SVDFQuantParams &params, const int8_t *input_data, const int8_t *weights_feature_data, const int8_t *weights_time_data, const int32_t *bias_data, int8_t *state_data, int8_t *output_data, const core::OMRuntimeShape &input_shape, const core::OMRuntimeShape &weights_feature_shape, const core::OMRuntimeShape &weights_time_shape, const core::OMRuntimeShape &bias_shape, const core::OMRuntimeShape &output_shape)
Definition PALSVDF.h:35

onert_micro::execute
Definition ArgCommon.h:33

onert_micro::execute::quantizeMultiplier
void quantizeMultiplier(double double_multiplier, int32_t *quantized_multiplier, int *shift)
Definition OMUtils.cpp:23

onert_micro::execute::execute_kernel_CircleSVDF
OMStatus execute_kernel_CircleSVDF(const OMExecuteArgs &execute_args)
Definition SVDF.cpp:84

onert_micro
Definition OMMemoryManager.h:27

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

onert_micro::UnsupportedActivation
@ UnsupportedActivation
Definition OMStatus.h:28

onert_micro::core::SVDFQuantParams
Definition OMKernelData.h:234

onert_micro::core::SVDFQuantParams::activation_state_zero_point
int32_t activation_state_zero_point
Definition OMKernelData.h:237

onert_micro::core::SVDFQuantParams::effective_scale_1_b
int effective_scale_1_b
Definition OMKernelData.h:239

onert_micro::core::SVDFQuantParams::effective_scale_2_b
int effective_scale_2_b
Definition OMKernelData.h:241

onert_micro::core::SVDFQuantParams::effective_scale_2_a
int32_t effective_scale_2_a
Definition OMKernelData.h:240

onert_micro::core::SVDFQuantParams::effective_scale_1_a
int32_t effective_scale_1_a
Definition OMKernelData.h:238

onert_micro::core::SVDFQuantParams::input_zero_point
int32_t input_zero_point
Definition OMKernelData.h:235

onert_micro::core::SVDFQuantParams::rank
int rank
Definition OMKernelData.h:242

onert_micro::core::SVDFQuantParams::output_zero_point
int32_t output_zero_point
Definition OMKernelData.h:236

onert_micro::core::memory::OMMemoryManager::deallocateMemory
static OMStatus deallocateMemory(uint8_t *data)
Definition OMMemoryManager.cpp:62

onert_micro::core::memory::OMMemoryManager::allocateMemory
static OMStatus allocateMemory(uint32_t size, uint8_t **data)
Definition OMMemoryManager.cpp:31

onert_micro::execute::OMExecuteArgs
Definition OMExecuteArgs.h:31

onert_micro::execute::OMExecuteArgs::kernel_index
uint16_t kernel_index
Definition OMExecuteArgs.h:34

onert_micro::execute::OMExecuteArgs::runtime_context
core::OMRuntimeContext & runtime_context
Definition OMExecuteArgs.h:33

onert_micro::execute::OMExecuteArgs::runtime_storage
core::OMRuntimeStorage & runtime_storage
Definition OMExecuteArgs.h:32