ONE/onert-micro_2onert-micro_2src_2train_2kernels_2_strided_slice_8cpp_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "OMStatus.h"


#include "core/OMUtils.h"

#include "core/OMDataType.h"


#include "train/OMBackpropExecutionBuilder.h"

#include "execute/OMRuntimeKernel.h"


using namespace onert_micro;

using namespace onert_micro::train;


namespace

{


constexpr uint32_t inputTensorIdx = 0;

constexpr uint32_t outputTensorIdx = 0;


} // namespace


/*

 * - Calculate input gradient - Optional (not required if it is last op)

 * Note: now support when it is just reshape, number of output tensor is one and flat size of the

 * output tensor is equal to input

 */

// TODO: support more general part

OMStatus onert_micro::train::train_kernel_CircleStridedSlice(const OMBackpropExecuteArgs &args)

{

  // Check is it last layer for training

  if (args.is_last_layer)

    return Ok;


  core::OMRuntimeContext &runtime_context = args.backward_context;

  core::OMRuntimeStorage &runtime_storage = args.backward_storage;

  uint16_t op_index = args.kernel_index;


  execute::OMRuntimeKernel runtime_kernel;

  runtime_kernel.readKernel(op_index, runtime_context);


  const circle::Tensor *input = runtime_kernel.inputs[inputTensorIdx];

  const circle::Tensor *output = runtime_kernel.outputs[outputTensorIdx];


  assert(input != nullptr);

  assert(output != nullptr);


  // Note: now support when it is just reshape, number of output tensor is one and flat size of the

  // output tensor is equal to input

  assert(runtime_kernel.outputs_num == 1);

  const core::OMRuntimeShape shape(input);

  const core::OMRuntimeShape output_shape(input);

  assert(shape.flatSize() == output_shape.flatSize());

  if (runtime_kernel.outputs_num > 1 or shape.flatSize() != output_shape.flatSize())

    return UnsupportedType;


  OMStatus status = Ok;


  status = runtime_kernel.getDataFromStorage(op_index, runtime_storage, runtime_context);

  if (status != Ok)

    return status;


  uint8_t *input_data = runtime_kernel.inputs_data[inputTensorIdx];

  uint8_t *output_data = runtime_kernel.outputs_data[outputTensorIdx];


  assert(input_data != nullptr);

  assert(output_data != nullptr);


  // Check is it inplace kernel

  if (input_data == output_data)

    return Ok;


  const size_t element_size =

    static_cast<uint32_t>(getOMDataTypeSize(core::onertMicroDatatype(input->type())));

  const int32_t num_elements = shape.flatSize();

  std::memcpy(input_data, output_data, num_elements * element_size);


  return status;

}

OMBackpropExecutionBuilder.h

OMDataType.h

OMRuntimeKernel.h

OMStatus.h

luci_interpreter::RuntimeShape::flatSize
int flatSize() const
Definition Tensor.h:45

onert_micro::core::OMRuntimeContext
Definition OMRuntimeContext.h:37

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:31

onert_micro::core::OMRuntimeStorage
Definition OMRuntimeStorage.h:34

onert_micro::execute::OMRuntimeKernel
Definition OMRuntimeKernel.h:35

onert_micro::execute::OMRuntimeKernel::outputs_data
uint8_t * outputs_data[maxOutputSize]
Definition OMRuntimeKernel.h:55

onert_micro::execute::OMRuntimeKernel::outputs_num
uint32_t outputs_num
Definition OMRuntimeKernel.h:60

onert_micro::execute::OMRuntimeKernel::getDataFromStorage
OMStatus getDataFromStorage(uint16_t op_index, core::OMRuntimeStorage &storage, core::OMRuntimeContext &context)
Definition OMRuntimeKernel.cpp:67

onert_micro::execute::OMRuntimeKernel::inputs_data
uint8_t * inputs_data[maxInputSize]
Definition OMRuntimeKernel.h:54

onert_micro::execute::OMRuntimeKernel::readKernel
OMStatus readKernel(uint16_t op_index, core::OMRuntimeContext &runtime_context)
Definition OMRuntimeKernel.cpp:22

onert_micro::execute::OMRuntimeKernel::outputs
const circle::Tensor * outputs[maxOutputSize]
Definition OMRuntimeKernel.h:52

onert_micro::execute::OMRuntimeKernel::inputs
const circle::Tensor * inputs[maxInputSize]
Definition OMRuntimeKernel.h:51

OMUtils.h

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

TensorIndexTISO::outputTensorIdx
constexpr uint32_t outputTensorIdx
Definition ReadKernelDataCommon.cpp:28

gen_h5_explicit_inputs_all.output
output
Definition gen_h5_explicit_inputs_all.py:96

infer.args
args
Definition infer.py:21

infer.input_data
list input_data
Definition infer.py:29

mir_caffe::CaffeOpType::input
@ input

nncc::core::ADT::feature::num_elements
uint32_t num_elements(const Shape &shape)
The number of elements of a feature map of a given shape.
Definition Shape.h:59

onert_micro::core::onertMicroDatatype
OMDataType onertMicroDatatype(const circle::TensorType type)
Definition OMDataType.cpp:19

onert_micro::core::getOMDataTypeSize
size_t getOMDataTypeSize(OMDataType data_type)
Definition OMDataType.h:179

onert_micro::train
Definition PALConv2DInputGrad.h:28

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

onert_micro::UnsupportedType
@ UnsupportedType
Definition OMStatus.h:26

part_eval_one.output_data
output_data
Definition part_eval_one.py:112

onert_micro::train::OMBackpropExecuteArgs
Definition OMBackpropExecuteArgs.h:35