ONE/onert-micro_2onert-micro_2src_2train_2kernels_2_conv2_d_8cpp_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "OMStatus.h"

#include "core/OMUtils.h"

#include "train/OMBackpropExecutionBuilder.h"

#include "execute/OMRuntimeKernel.h"

#include "PALConv2DWeightGrad.h"

#include "PALReluInputGrad.h"

#include "PALConv2DInputGrad.h"


using namespace onert_micro;

using namespace onert_micro::core;

using namespace onert_micro::train;


namespace

{


constexpr uint32_t inputTensorIdx = 0;

constexpr uint32_t weightTensorIdx = 1;

constexpr uint32_t biasTensorIdx = 2;


constexpr uint32_t outputTensorIdx = 0;


} // namespace


/*

 * - Calculate weight gradient (with bias)

 * - Calculate input gradient - Optional (not required if it is last op)

 */

OMStatus onert_micro::train::train_kernel_CircleConv2D(const OMBackpropExecuteArgs &args)

{

  core::OMRuntimeStorage &forward_storage = args.forward_storage;

  core::OMRuntimeStorage &backward_storage = args.backward_storage;

  core::OMRuntimeContext &context = args.backward_context;

  uint16_t op_index = args.kernel_index;


  const circle::Tensor *input;

  const circle::Tensor *weight;

  const circle::Tensor *output;


  int32_t weight_tensor_index = -1;


  uint8_t *input_data;

  uint8_t *dloss_dinput_data;


  uint8_t *weight_data;

  uint8_t *dloss_dweight_data;


  uint8_t *bias_data;

  uint8_t *dloss_dbias_data;


  uint8_t *output_data;

  uint8_t *dloss_doutput_data;


  const circle::Conv2DOptions *options;

  // Read kernel

  {

    execute::OMRuntimeKernel runtime_kernel;

    runtime_kernel.readKernel(op_index, context);


    input = runtime_kernel.inputs[inputTensorIdx];

    weight = runtime_kernel.inputs[weightTensorIdx];

    output = runtime_kernel.outputs[outputTensorIdx];

    assert(input != nullptr);

    assert(weight != nullptr);

    // Bias can be nullptr

    assert(output != nullptr);


    weight_tensor_index = runtime_kernel.inputs_index[weightTensorIdx];

    assert(weight_tensor_index != -1);


    // Read forward storage

    {

      runtime_kernel.getDataFromStorage(op_index, forward_storage, context);


      input_data = runtime_kernel.inputs_data[inputTensorIdx];

      weight_data = runtime_kernel.inputs_data[weightTensorIdx];

      bias_data = runtime_kernel.inputs_data[biasTensorIdx];

      output_data = runtime_kernel.outputs_data[outputTensorIdx];

      // Bias_data can be nullptr

      // Output_data can be nullptr

      // Input_data can be nullptr if we don't train this layer

      assert(weight_data != nullptr);

    }


    // Read backward storage

    {

      runtime_kernel.getDataFromStorage(op_index, backward_storage, context);


      dloss_dinput_data = runtime_kernel.inputs_data[inputTensorIdx];

      dloss_dweight_data = runtime_kernel.inputs_data[weightTensorIdx];

      dloss_dbias_data = runtime_kernel.inputs_data[biasTensorIdx];

      dloss_doutput_data = runtime_kernel.outputs_data[outputTensorIdx];

      // Bias_data and dloss_dinput_data can be nullptr

      // Note: dloss_dinput_data can be nullptr due to it can be last trainable node

      assert(dloss_dweight_data != nullptr);

      assert(dloss_doutput_data != nullptr);

    }


    options = runtime_kernel.first_operator->builtin_options_as_Conv2DOptions();

  }


  OMRuntimeShape input_shape(input);

  OMRuntimeShape output_shape(output);

  OMRuntimeShape weight_shape(weight);


  // 1. Handle activation functions

  switch (options->fused_activation_function())

  {

    case circle::ActivationFunctionType_NONE:

      // Do nothing

      break;

    case circle::ActivationFunctionType_RELU:

    {

      assert(output_data != nullptr);

      pal::ReluInputGrad(utils::castInputData<float>(output_data),

                         utils::castOutputData<float>(dloss_doutput_data), output_shape);

      break;

    }

    default:

    {

      assert(false && "Unsupported activation type");

      return UnsupportedType;

    }

  }


  const int input_width = input_shape.dims(3);

  const int input_height = input_shape.dims(2);

  const int weight_width = output_shape.dims(3);

  const int weight_height = output_shape.dims(2);


  FloatConv2D params{};


  params.stride_w = options->stride_w();

  params.stride_h = options->stride_h();

  params.dilation_width_factor = options->dilation_w_factor();

  params.dilation_height_factor = options->dilation_h_factor();

  params.pad_h = 0;

  params.pad_w = 0;


  if (args.is_trainable_layer)

  {

    // Check is only bias updating

    if (args.train_rank_type != ONLY_BIAS)

    {

      assert(input_data != nullptr); // FIX memory planner then


      // Get weight shape

      OMRuntimeShape dynamic_shapes = backward_storage.getDynamicRuntimeShape(weight_tensor_index);

      if (dynamic_shapes.flatSize() != 0)

        weight_shape = dynamic_shapes;


      // 2. Calculate weight gradient

      pal::Conv2DWeightGrad(params, input_shape, utils::castInputData<float>(input_data),

                            output_shape, utils::castInputData<float>(dloss_doutput_data),

                            weight_shape, utils::castOutputData<float>(dloss_dweight_data),

                            args.train_rank_type);

    }


    // 3. Calculate bias gradient

    if (dloss_dbias_data)

    {

      assert(bias_data != nullptr);

      if (bias_data == nullptr)

        return UnknownError;


      pal::Conv2DBiasGrad(output_shape, utils::castInputData<float>(dloss_doutput_data),

                          utils::castOutputData<float>(dloss_dbias_data));

    }

  }


  // 4. Calculate (if needed) input grad

  if (args.is_last_layer == false)

  {

    assert(dloss_dinput_data != nullptr);

    pal::Conv2DInputGrad(params, weight_shape, utils::castInputData<float>(weight_data),

                         output_shape, utils::castInputData<float>(dloss_doutput_data), input_shape,

                         utils::castOutputData<float>(dloss_dinput_data));

  }


  return Ok;

}

OMBackpropExecutionBuilder.h

OMRuntimeKernel.h

OMStatus.h

PALConv2DInputGrad.h

PALConv2DWeightGrad.h

PALReluInputGrad.h

luci_interpreter::RuntimeShape::dims
int32_t dims(int i) const
Definition Tensor.h:108

onert_micro::core::OMRuntimeContext
Definition OMRuntimeContext.h:37

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:34

onert_micro::core::OMRuntimeShape::flatSize
int flatSize() const
Definition OMRuntimeShape.h:64

onert_micro::core::OMRuntimeStorage
Definition OMRuntimeStorage.h:34

onert_micro::core::OMRuntimeStorage::getDynamicRuntimeShape
OMRuntimeShape getDynamicRuntimeShape(uint16_t tensor_index)
Definition OMRuntimeStorage.h:73

onert_micro::execute::OMRuntimeKernel
Definition OMRuntimeKernel.h:35

onert_micro::execute::OMRuntimeKernel::outputs_data
uint8_t * outputs_data[maxOutputSize]
Definition OMRuntimeKernel.h:55

onert_micro::execute::OMRuntimeKernel::first_operator
const circle::Operator * first_operator
Definition OMRuntimeKernel.h:63

onert_micro::execute::OMRuntimeKernel::getDataFromStorage
OMStatus getDataFromStorage(uint16_t op_index, core::OMRuntimeStorage &storage, core::OMRuntimeContext &context)
Definition OMRuntimeKernel.cpp:67

onert_micro::execute::OMRuntimeKernel::inputs_data
uint8_t * inputs_data[maxInputSize]
Definition OMRuntimeKernel.h:54

onert_micro::execute::OMRuntimeKernel::readKernel
OMStatus readKernel(uint16_t op_index, core::OMRuntimeContext &runtime_context)
Definition OMRuntimeKernel.cpp:22

onert_micro::execute::OMRuntimeKernel::outputs
const circle::Tensor * outputs[maxOutputSize]
Definition OMRuntimeKernel.h:52

onert_micro::execute::OMRuntimeKernel::inputs_index
int32_t inputs_index[maxInputSize]
Definition OMRuntimeKernel.h:57

onert_micro::execute::OMRuntimeKernel::inputs
const circle::Tensor * inputs[maxInputSize]
Definition OMRuntimeKernel.h:51

OMUtils.h

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

TensorIndexTISO::outputTensorIdx
constexpr uint32_t outputTensorIdx
Definition ReadKernelDataCommon.cpp:28

gen_h5_explicit_inputs_all.output
output
Definition gen_h5_explicit_inputs_all.py:96

infer.args
args
Definition infer.py:21

infer.input_data
list input_data
Definition infer.py:29

mir_caffe::CaffeOpType::input
@ input

onert_micro::core
Definition OMMemoryManager.h:28

onert_micro::core::ONLY_BIAS
@ ONLY_BIAS
Definition OMKernelType.h:32

onert_micro::train::pal::ReluInputGrad
void ReluInputGrad(const float *input_relu_data, float *dloss_doutput_data, const core::OMRuntimeShape &dloss_doutput_shape)
Definition PALReluInputGrad.h:34

onert_micro::train::pal::Conv2DWeightGrad
void Conv2DWeightGrad(const core::FloatConv2D &params, const core::OMRuntimeShape &input_shape, const float *input_data, const core::OMRuntimeShape &dloss_doutput_shape, const float *dloss_doutput_data, const core::OMRuntimeShape &dloss_dweight_shape, float *dloss_dweight_data, core::OpTrainableRankType rank)
Definition PALConv2DWeightGrad.h:58

onert_micro::train::pal::Conv2DInputGrad
void Conv2DInputGrad(const core::FloatConv2D &params, const core::OMRuntimeShape &weight_shape, const float *weight_data, const core::OMRuntimeShape &dloss_doutput_shape, const float *dloss_doutput_data, const core::OMRuntimeShape &dloss_dinput_shape, float *dloss_dinput_data)
Definition PALConv2DInputGrad.h:60

onert_micro::train::pal::Conv2DBiasGrad
void Conv2DBiasGrad(const core::OMRuntimeShape &dloss_doutput_shape, const float *dloss_doutput_data, float *dloss_dbias_data)
Definition PALConv2DWeightGrad.h:31

onert_micro::train
Definition PALConv2DInputGrad.h:28

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::UnknownError
@ UnknownError
Definition OMStatus.h:30

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

onert_micro::UnsupportedType
@ UnsupportedType
Definition OMStatus.h:26

onnx_legalizer.options
options
Definition onnx_legalizer.py:1070

part_eval_one.output_data
output_data
Definition part_eval_one.py:112

onert_micro::core::FloatConv2D
Definition OMKernelData.h:167

onert_micro::core::FloatConv2D::stride_w
int32_t stride_w
Definition OMKernelData.h:168

onert_micro::train::OMBackpropExecuteArgs
Definition OMBackpropExecuteArgs.h:35