ONE/onert-micro_2onert-micro_2include_2pal_2cmsisnn_2_p_a_l_depthwise_conv2d_8h_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 * Copyright 2017 The TensorFlow Authors. All Rights Reserved.

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#ifndef ONERT_MICRO_EXECUTE_PAL_DEPTHWISE_CONV_2D_H

#define ONERT_MICRO_EXECUTE_PAL_DEPTHWISE_CONV_2D_H


#include "PALDepthwiseConv2DCommon.h"

#include "core/OMKernelData.h"

#include "core/OMRuntimeShape.h"

#include "PALUtils.h"


#include <arm_nnfunctions.h>


namespace onert_micro

{

namespace execute

{

namespace pal

{


// Fixed-point per-channel-quantization deptwise_conv2D reference kernel.


OMStatus DepthwiseConvPerChannel(const core::ConvQuant &params,

                                 const core::OMRuntimeShape &input_shape, const int8_t *input_data,

                                 const core::OMRuntimeShape &filter_shape,

                                 const int8_t *filter_data, const int32_t *bias_data,

                                 const core::OMRuntimeShape &output_shape, int8_t *output_data)

{

  cmsis_nn_dw_conv_params conv_params;

  conv_params.dilation.h = params.dilation_height_factor;

  conv_params.dilation.w = params.dilation_width_factor;


  assert(conv_params.dilation.h == 1);

  assert(conv_params.dilation.w == 1);


  conv_params.input_offset = params.input_offset;

  conv_params.output_offset = params.output_offset;

  conv_params.stride.h = params.stride_height;

  conv_params.stride.w = params.stride_width;

  conv_params.padding.h = params.pad_h;

  conv_params.padding.w = params.pad_w;

  conv_params.activation.min = params.quantized_activation_min;

  conv_params.activation.max = params.quantized_activation_max;

  conv_params.ch_mult = params.depth_multiplier;


  cmsis_nn_per_channel_quant_params quant_params;

  quant_params.multiplier = const_cast<int32_t *>(params.per_channel_output_multiplier.data());

  quant_params.shift = const_cast<int32_t *>(

    reinterpret_cast<const int32_t *>(params.per_channel_output_shift.data()));


  assert(conv_params.activation.min <= conv_params.activation.max);

  const int batch_size = input_shape.dims(0);

  const int input_depth = input_shape.dims(3);

  const int output_depth = filter_shape.dims(0);


  cmsis_nn_dims input_dims;

  input_dims.n = batch_size;

  input_dims.h = input_shape.dims(1);

  input_dims.w = input_shape.dims(2);

  input_dims.c = input_depth;


  cmsis_nn_dims filter_dims;

  filter_dims.n = output_depth;

  filter_dims.h = filter_shape.dims(1);

  filter_dims.w = filter_shape.dims(2);

  filter_dims.c = input_depth;


  cmsis_nn_dims bias_dims;

  bias_dims.n = 1;

  bias_dims.h = 1;

  bias_dims.w = 1;

  bias_dims.c = output_depth;


  cmsis_nn_dims output_dims;

  output_dims.n = batch_size;

  output_dims.h = output_shape.dims(1);

  output_dims.w = output_shape.dims(2);

  output_dims.c = output_depth;


  auto buf_size = arm_depthwise_conv_wrapper_s8_get_buffer_size(&conv_params, &input_dims,

                                                                &filter_dims, &output_dims);


  auto buffer = std::make_unique<int8_t[]>(buf_size);

  assert(buffer != nullptr);


  cmsis_nn_context ctx;

  ctx.buf = buffer.get();

  ctx.size = buf_size;


  auto res = arm_depthwise_conv_wrapper_s8(&ctx, &conv_params, &quant_params, &input_dims,

                                           input_data, &filter_dims, filter_data, &bias_dims,

                                           bias_data, &output_dims, output_data);


  assert(res == ARM_CMSIS_NN_SUCCESS);

  if (res != ARM_CMSIS_NN_SUCCESS)

    return CmsisNNError;

  return Ok;

}

OMStatus DepthwiseConvPerChannel(const core::ConvQuant &params, {…}


} // namespace pal

} // namespace execute

} // namespace onert_micro


#endif // ONERT_MICRO_EXECUTE_PAL_DEPTHWISE_CONV_2D_H

OMKernelData.h

OMRuntimeShape.h

luci_interpreter::RuntimeShape::dims
int32_t dims(int i) const
Definition Tensor.h:108

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:34

onert_micro::core::OMRuntimeShape::dims
int32_t dims(int i) const
Definition OMRuntimeShape.h:129

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

onert_micro::execute::pal::DepthwiseConvPerChannel
OMStatus DepthwiseConvPerChannel(const core::ConvQuant &params, const core::OMRuntimeShape &input_shape, const int8_t *input_data, const core::OMRuntimeShape &filter_shape, const int8_t *filter_data, const int32_t *bias_data, const core::OMRuntimeShape &output_shape, int8_t *output_data)
Definition PALDepthwiseConv2D.h:36

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

onert_micro::CmsisNNError
@ CmsisNNError
Definition OMStatus.h:37

onert_micro::core::ConvQuant
Definition OMKernelData.h:139

onert_micro::core::ConvQuant::per_channel_output_shift
std::vector< int > per_channel_output_shift
Definition OMKernelData.h:157

onert_micro::core::ConvQuant::quantized_activation_min
int32_t quantized_activation_min
Definition OMKernelData.h:153

onert_micro::core::ConvQuant::stride_width
int32_t stride_width
Definition OMKernelData.h:144

onert_micro::core::ConvQuant::quantized_activation_max
int32_t quantized_activation_max
Definition OMKernelData.h:154

onert_micro::core::ConvQuant::dilation_height_factor
int32_t dilation_height_factor
Definition OMKernelData.h:147

onert_micro::core::ConvQuant::output_offset
int32_t output_offset
Definition OMKernelData.h:150

onert_micro::core::ConvQuant::dilation_width_factor
int32_t dilation_width_factor
Definition OMKernelData.h:146

onert_micro::core::ConvQuant::per_channel_output_multiplier
std::vector< int32_t > per_channel_output_multiplier
Definition OMKernelData.h:156

onert_micro::core::ConvQuant::input_offset
int32_t input_offset
Definition OMKernelData.h:148

onert_micro::core::ConvQuant::stride_height
int32_t stride_height
Definition OMKernelData.h:145

onert_micro::core::ConvQuant::pad_h
int32_t pad_h
Definition OMKernelData.h:140

onert_micro::core::ConvQuant::depth_multiplier
int32_t depth_multiplier
Definition OMKernelData.h:155

onert_micro::core::ConvQuant::pad_w
int32_t pad_w
Definition OMKernelData.h:141