ONE/compiler_2luci-compute_2src_2_depthwise_conv2_d_8cpp_source.html

/* Copyright (c) 2023 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "luci_compute/Types.h"

#include "luci_compute/DepthwiseConv2D.h"


#include "ConvertTypes.h"

#include "ConvertValues.h"


#include <tensorflow/lite/kernels/internal/reference/depthwiseconv_float.h>


#include <cassert>

#include <cstdint>


namespace luci

{

namespace compute

{


namespace

{


int32_t compute_output(PaddingType padding, int32_t in_size, int32_t filter_size, int32_t stride,

                       int32_t dilation_rate)

{

  assert(in_size > 0);

  assert(filter_size > 0);

  assert(stride > 0);

  assert(dilation_rate > 0);


  auto const effective_filter_size = (filter_size - 1) * dilation_rate + 1;

  switch (padding)

  {

    case PaddingType::kSame:

      return (in_size + stride - 1) / stride;


    case PaddingType::kValid:

      return (in_size + stride - effective_filter_size) / stride;


    default:

      return -1;

  }

  return -1;

}


int16_t compute_padding(int32_t out_size, int32_t in_size, int32_t filter_size, int32_t stride,

                        int32_t dilation_rate)

{

  assert(out_size > 0);

  assert(in_size > 0);

  assert(filter_size > 0);

  assert(stride > 0);

  assert(dilation_rate > 0);


  auto const effective_filter_size = (filter_size - 1) * dilation_rate + 1;

  auto const padding = ((out_size - 1) * stride + effective_filter_size - in_size) / 2;

  assert(padding < INT16_MAX);

  return padding > 0 ? static_cast<int16_t>(padding) : 0;

}


} // namespace


bool DepthwiseConv2D::prepare(void)

{

  // TODO support other ranks if necessary

  if (_input_shape.rank() != 4 || _filter_shape.rank() != 4)

    return false;

  // if bias exist, check if rank is 1

  if (_bias_data && _bias_shape.rank() != 1)

    return false;


  auto const input_batches = _input_shape.dim(0).value();

  auto const input_height = _input_shape.dim(1).value();

  auto const input_width = _input_shape.dim(2).value();

  auto const input_depth = _input_shape.dim(3).value();


  auto const filter_height = _filter_shape.dim(1).value();

  auto const filter_width = _filter_shape.dim(2).value();

  auto const filter_channels_out = _filter_shape.dim(3).value();


  if (filter_channels_out % input_depth != 0)

    return false; // wrong input/output depth ratio


  if (_params.depth_multiplier != static_cast<int32_t>(filter_channels_out / input_depth))

    return false; // wrong depth multiplier value


  if (_bias_shape.dim(0).value() != filter_channels_out)

    return false; // unsupported bias value


  auto output_height = compute_output(_params.padding_type, input_height, filter_height,

                                      _params.stride_height, _params.dilation_height_factor);

  if (output_height < 0)

    return false;


  auto output_width = compute_output(_params.padding_type, input_width, filter_width,

                                     _params.stride_width, _params.dilation_width_factor);

  if (output_width < 0)

    return false;


  get_act_minmax(_fused_act_func, _params.float_activation_min, _params.float_activation_max);


  _output_shape.rank(4);

  _output_shape.dim(0) = input_batches;

  _output_shape.dim(1) = output_height;

  _output_shape.dim(2) = output_width;

  _output_shape.dim(3) = filter_channels_out;


  _params.padding_values.height =

    compute_padding(output_height, input_height, filter_height, _params.stride_height,

                    _params.dilation_height_factor);

  _params.padding_values.width = compute_padding(

    output_width, input_width, filter_width, _params.stride_width, _params.dilation_width_factor);


  return true;

}

bool DepthwiseConv2D::prepare(void) {…}


void DepthwiseConv2D::compute(void)

{

  assert(_input_data != nullptr);

  assert(_filter_data != nullptr);

  // NOTE _bias_shape can be nullptr

  assert(_output_data != nullptr);


  // NOTE if this fails, structure may have changed

  static_assert(sizeof(compute::DepthwiseParams) == sizeof(tflite::DepthwiseParams));


  tflite::DepthwiseParams params;


  // clang-format off

  params.padding_type                   = tflite_padding(_params.padding_type);

  params.padding_values.width           = _params.padding_values.width;

  params.padding_values.height          = _params.padding_values.height;

  params.padding_values.width_offset    = _params.padding_values.width_offset;

  params.padding_values.height_offset   = _params.padding_values.height_offset;

  params.stride_width                   = _params.stride_width;

  params.stride_height                  = _params.stride_height;

  params.dilation_width_factor          = _params.dilation_width_factor;

  params.dilation_height_factor         = _params.dilation_height_factor;

  params.depth_multiplier               = _params.depth_multiplier;

  params.input_offset                   = _params.input_offset;

  params.weights_offset                 = _params.weights_offset;

  params.output_offset                  = _params.output_offset;

  params.output_multiplier              = _params.output_multiplier;

  params.output_shift                   = _params.output_shift;

  params.quantized_activation_min       = _params.quantized_activation_min;

  params.quantized_activation_max       = _params.quantized_activation_max;

  params.float_activation_min           = _params.float_activation_min;

  params.float_activation_max           = _params.float_activation_max;

  params.output_multiplier_per_channel  = _params.output_multiplier_per_channel;

  params.output_shift_per_channel       = _params.output_shift_per_channel;

  // clang-format on


  tflite::reference_ops::DepthwiseConv(

    params, tflite_shape(_input_shape), _input_data, tflite_shape(_filter_shape), _filter_data,

    tflite_shape(_bias_shape), _bias_data, tflite_shape(_output_shape), _output_data);

}

void DepthwiseConv2D::compute(void) {…}


} // namespace compute

} // namespace luci

ConvertTypes.h

ConvertValues.h

loco::Dimension::value
uint32_t value(void) const
Return the value.
Definition Dimension.h:51

loco::TensorShape::dim
const Dimension & dim(uint32_t axis) const
Definition TensorShape.h:38

loco::TensorShape::rank
uint32_t rank(void) const
Definition TensorShape.h:35

luci::compute::DepthwiseConv2D::compute
void compute(void)
Definition DepthwiseConv2D.cpp:129

luci::compute::DepthwiseConv2D::prepare
bool prepare(void)
Definition DepthwiseConv2D.cpp:75

luci::compute::DepthwiseConv2D::params
DepthwiseParams & params(void)
Definition DepthwiseConv2D.h:35

DepthwiseConv2D.h

Types.h

luci::compute::tflite_padding
tflite::PaddingType tflite_padding(const PaddingType type)
Definition ConvertTypes.cpp:38

luci::compute::PaddingType
PaddingType
Definition Types.h:33

luci::compute::PaddingType::kValid
@ kValid

luci::compute::PaddingType::kSame
@ kSame

luci::compute::get_act_minmax
void get_act_minmax(const FusedActFunc act, float &act_min, float &act_max)
Definition ConvertValues.cpp:26

luci::compute::tflite_shape
tflite::RuntimeShape tflite_shape(const loco::TensorShape &shape)
Definition ConvertTypes.cpp:26

luci
Definition DepthwiseConv2D.h:24

luci::compute::DepthwiseParams
Definition Types.h:54

luci::compute::DepthwiseParams::padding_values
PaddingValues padding_values
Definition Types.h:56

luci::compute::DepthwiseParams::float_activation_max
float float_activation_max
Definition Types.h:74

luci::compute::DepthwiseParams::dilation_height_factor
int16_t dilation_height_factor
Definition Types.h:60

luci::compute::DepthwiseParams::stride_width
int16_t stride_width
Definition Types.h:57

luci::compute::DepthwiseParams::depth_multiplier
int16_t depth_multiplier
Definition Types.h:61

luci::compute::DepthwiseParams::padding_type
PaddingType padding_type
Definition Types.h:55

luci::compute::DepthwiseParams::output_offset
int32_t output_offset
Definition Types.h:66

luci::compute::DepthwiseParams::weights_offset
int32_t weights_offset
Definition Types.h:65

luci::compute::DepthwiseParams::quantized_activation_max
int32_t quantized_activation_max
Definition Types.h:71

luci::compute::DepthwiseParams::float_activation_min
float float_activation_min
Definition Types.h:73

luci::compute::DepthwiseParams::output_shift
int output_shift
Definition Types.h:68

luci::compute::DepthwiseParams::output_multiplier_per_channel
const int32_t * output_multiplier_per_channel
Definition Types.h:75

luci::compute::DepthwiseParams::input_offset
int32_t input_offset
Definition Types.h:64

luci::compute::DepthwiseParams::quantized_activation_min
int32_t quantized_activation_min
Definition Types.h:70

luci::compute::DepthwiseParams::output_multiplier
int32_t output_multiplier
Definition Types.h:67

luci::compute::DepthwiseParams::stride_height
int16_t stride_height
Definition Types.h:58

luci::compute::DepthwiseParams::dilation_width_factor
int16_t dilation_width_factor
Definition Types.h:59

luci::compute::DepthwiseParams::output_shift_per_channel
const int32_t * output_shift_per_channel
Definition Types.h:76

luci::compute::PaddingValues::width
int16_t width
Definition Types.h:42

luci::compute::PaddingValues::height_offset
int16_t height_offset
Definition Types.h:49

luci::compute::PaddingValues::height
int16_t height
Definition Types.h:43

luci::compute::PaddingValues::width_offset
int16_t width_offset
Definition Types.h:47