ONE/cpu_2ops_2_conv2_d_layer_8cc_source.html

/*

 * Copyright (c) 2018 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *      http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "Conv2DLayer.h"


#include "OperationUtils.h"

#include "../Tensor.h"

#include "../KernelGenerator.h"

#include "../Validator.h"


#include <cker/operation/Conv.h>

#include <cker/PortableTensorUtils.h>

#include <ir/Padding.h>


namespace onert::backend::cpu

{


void Validator::visit(const ir::operation::Conv2D &) { _supported = true; }


void KernelGenerator::visit(const ir::operation::Conv2D &node)

{

  using ir::operation::Conv2D;


  const auto ofm_index{node.getOutputs().at(0)};

  const auto ifm_index{node.getInputs().at(Conv2D::Input::INPUT)};

  const auto ker_index{node.getInputs().at(Conv2D::Input::KERNEL)};

  const auto bias_index{node.getInputs().at(Conv2D::Input::BIAS)};


  auto ofm_tensor = _tensor_reg->getPortableTensor(ofm_index);

  auto ifm_tensor = _tensor_reg->getPortableTensor(ifm_index);

  auto ker_tensor = _tensor_reg->getPortableTensor(ker_index);

  auto bias_tensor = _tensor_reg->getPortableTensor(bias_index);


  const auto stride = node.param().stride;

  const auto activation = node.param().activation;

  const auto &param_padding = node.param().padding;

  const auto dilation = node.param().dilation;


  const bool is_cacheable_weights = ker_tensor->is_constant();


  auto fn = std::make_unique<ops::ConvolutionLayer>();


  if (_ctx.at(ifm_index).info().isDynamic() || _ctx.at(ker_index).info().isDynamic())

  {

    fn->configure(ifm_tensor, ker_tensor, bias_tensor, param_padding.type, param_padding.param.left,

                  param_padding.param.right, param_padding.param.top, param_padding.param.bottom,

                  stride.horizontal, stride.vertical, dilation.width_factor, dilation.height_factor,

                  activation, ofm_tensor, is_cacheable_weights);


    _return_fn = std::move(fn);

    return;

  }

  const auto ifm_shape = _ctx.at(ifm_index).shape().asFeature();

  const auto ofm_shape = _ctx.at(ofm_index).shape().asFeature();

  // Kernel format is [depth_out, kernel_height, kernel_width, depth_in].

  const auto &ker_shape = _ctx.at(ker_index).shape();

  const auto ker_height = ker_shape.dim(1);

  const auto ker_width = ker_shape.dim(2);


  const auto padding =

    ir::calculatePadding(param_padding, ifm_shape, ofm_shape, stride, ker_width, ker_height,

                         dilation.width_factor, dilation.height_factor);


  fn->configure(ifm_tensor, ker_tensor, bias_tensor, param_padding.type, padding.left,

                padding.right, padding.top, padding.bottom, stride.horizontal, stride.vertical,

                dilation.width_factor, dilation.height_factor, activation, ofm_tensor,

                is_cacheable_weights);


  _return_fn = std::move(fn);

}


} // namespace onert::backend::cpu


namespace onert::backend::cpu::ops

{


ConvolutionLayer::ConvolutionLayer()

  : _input(nullptr), _kernel(nullptr), _bias(nullptr), _output(nullptr),

    _paddingType(ir::PaddingType::EXPLICIT), _paddingLeft(0), _paddingTop(0), _paddingRight(0),

    _paddingBottom(0), _strideWidth(0), _strideHeight(0), _dilationWidthFactor(1),

    _dilationHeightFactor(1), _activation(ir::Activation::NONE),

    _conv_kernel(new nnfw::cker::Conv()), _prepare(false), _is_cachable_weights(false),

    _is_hybrid(false)

{

  // DO NOTHING

}


ConvolutionLayer::~ConvolutionLayer() = default;


void ConvolutionLayer::convFloat32()

{

  float output_activation_min = 0, output_activation_max = 0;

  CalculateActivationRange(_activation, &output_activation_min, &output_activation_max);


  nnfw::cker::ConvParams op_params;

  op_params.padding_type = getPaddingType(_paddingType);

  op_params.padding_values.width = _paddingLeft;

  op_params.padding_values.height = _paddingTop;

  op_params.stride_width = _strideWidth;

  op_params.stride_height = _strideHeight;

  op_params.dilation_width_factor = _dilationWidthFactor;

  op_params.dilation_height_factor = _dilationHeightFactor;

  op_params.float_activation_min = output_activation_min;

  op_params.float_activation_max = output_activation_max;


  nnfw::cker::Conv &kernel = *_conv_kernel;

  kernel(op_params, getShape(_input), getBuffer<float>(_input), getShape(_kernel),

         getBuffer<float>(_kernel), getShape(_bias), getBuffer<float>(_bias), getShape(_output),

         getBuffer<float>(_output));

}


void ConvolutionLayer::convQ8uPerTensor()

{

  int32_t output_activation_min = 0;

  int32_t output_activation_max = 0;

  CalculateActivationRangeQuantized(_activation, _output, &output_activation_min,

                                    &output_activation_max);


  double real_multiplier = 0.0;

  int32_t output_multiplier = 0;

  int32_t output_shift = 0;

  GetQuantizedConvolutionMultiplier(_input, _kernel, _bias, _output, &real_multiplier);

  QuantizeMultiplier(real_multiplier, &output_multiplier, &output_shift);


  nnfw::cker::ConvParams op_params;

  op_params.stride_width = _strideWidth;

  op_params.stride_height = _strideHeight;

  op_params.dilation_width_factor = _dilationWidthFactor;

  op_params.dilation_height_factor = _dilationHeightFactor;

  op_params.padding_type = getPaddingType(_paddingType);

  op_params.padding_values.width = _paddingLeft;

  op_params.padding_values.height = _paddingTop;

  op_params.input_offset = -_input->data_zero_point();

  op_params.weights_offset = -_kernel->data_zero_point();

  op_params.output_offset = _output->data_zero_point();

  op_params.output_multiplier = output_multiplier;

  op_params.output_shift = output_shift;

  op_params.quantized_activation_min = output_activation_min;

  op_params.quantized_activation_max = output_activation_max;

  op_params.is_replaced_weights = true;


  nnfw::cker::Conv &kernel = *_conv_kernel;

  kernel(op_params, getShape(_input), getBuffer<uint8_t>(_input), getShape(_kernel),

         getBuffer<uint8_t>(_kernel), getShape(_bias), getBuffer<int32_t>(_bias), getShape(_output),

         getBuffer<uint8_t>(_output));

}


void ConvolutionLayer::convQ8uPerChannel()

{

  nnfw::cker::ConvParams op_params;

  op_params.padding_values.width = _paddingLeft;

  op_params.padding_values.height = _paddingTop;

  op_params.stride_width = _strideWidth;

  op_params.stride_height = _strideHeight;

  op_params.dilation_width_factor = _dilationWidthFactor;

  op_params.dilation_height_factor = _dilationHeightFactor;

  op_params.input_offset = -_input->data_zero_point();

  op_params.output_offset = _output->data_zero_point();

  int32_t output_activation_min = 0;

  int32_t output_activation_max = 0;

  CalculateActivationRangeQuantized(_activation, _output, &output_activation_min,

                                    &output_activation_max);

  op_params.quantized_activation_min = output_activation_min;

  op_params.quantized_activation_max = output_activation_max;

  // NOTE: The following fields of ConvParams are not used:

  // padding_type, weights_offset, output_{multiplier,shift}, float_activation_{min,max}


  nnfw::cker::Conv &kernel = *_conv_kernel;

  kernel(op_params, getShape(_input), getBuffer<uint8_t>(_input), getShape(_kernel),

         getBuffer<uint8_t>(_kernel), _kernel->data_zero_points().data(), getShape(_bias),

         getBuffer<int32_t>(_bias), getShape(_output), getBuffer<uint8_t>(_output));

}


void ConvolutionLayer::convQ8i()

{

  int32_t output_activation_min = 0;

  int32_t output_activation_max = 0;

  CalculateActivationRangeQuantized(_activation, _output, &output_activation_min,

                                    &output_activation_max);


  nnfw::cker::ConvParams op_params;

  op_params.input_offset = -_input->data_zero_point();

  op_params.output_offset = _output->data_zero_point();

  op_params.stride_height = _strideHeight;

  op_params.stride_width = _strideWidth;

  op_params.dilation_height_factor = _dilationHeightFactor;

  op_params.dilation_width_factor = _dilationWidthFactor;

  op_params.padding_values.height = _paddingTop;

  op_params.padding_values.width = _paddingLeft;

  op_params.quantized_activation_min = output_activation_min;

  op_params.quantized_activation_max = output_activation_max;


  nnfw::cker::Conv &kernel = *_conv_kernel;

  kernel(op_params, getShape(_input), reinterpret_cast<const int8_t *>(_input->buffer()),

         getShape(_kernel), reinterpret_cast<const int8_t *>(_kernel->buffer()), getShape(_bias),

         reinterpret_cast<const int32_t *>(_bias->buffer()), getShape(_output),

         reinterpret_cast<int8_t *>(_output->buffer()));

}


void ConvolutionLayer::convQ8iHybridPerChannel()

{

  float output_activation_min = 0;

  float output_activation_max = 0;

  CalculateActivationRange(_activation, &output_activation_min, &output_activation_max);


  const int batch_size = getShape(_input).Dims(0);

  if (batch_size == 0)

    throw std::runtime_error{"Convolution input batch_size = 0"};

  auto input_shape = getShape(_input);

  const int input_size = input_shape.FlatSize() / batch_size;


  auto input_quantized_ptr = _hybrid_arena->input_quantized.data();

  auto input_scaling_factors_ptr = _hybrid_arena->input_scaling_factors.data();

  auto input_offsets_ptr = _hybrid_arena->input_offsets.data();

  for (int b = 0; b < batch_size; ++b)

  {

    const int offset = b * input_size;

    nnfw::cker::PortableAsymmetricQuantizeFloats(

      reinterpret_cast<const float *>(_input->buffer()) + offset, input_size,

      input_quantized_ptr + offset, &input_scaling_factors_ptr[b], &input_offsets_ptr[b]);

  }

  nnfw::cker::ConvParams op_params;

  op_params.padding_type = getPaddingType(_paddingType);

  op_params.padding_values.width = _paddingLeft;

  op_params.padding_values.height = _paddingTop;

  op_params.stride_width = _strideWidth;

  op_params.stride_height = _strideHeight;

  op_params.dilation_width_factor = _dilationWidthFactor;

  op_params.dilation_height_factor = _dilationHeightFactor;

  op_params.float_activation_min = output_activation_min;

  op_params.float_activation_max = output_activation_max;


  const auto *filter_per_channel_scales = _kernel->data_scales().data();

  nnfw::cker::reference::HybridConvPerChannel(

    op_params, input_scaling_factors_ptr, getShape(_input), input_quantized_ptr, getShape(_kernel),

    reinterpret_cast<const int8_t *>(_kernel->buffer()), getShape(_bias),

    reinterpret_cast<const float *>(_bias->buffer()), getShape(_output),

    reinterpret_cast<float *>(_output->buffer()), filter_per_channel_scales, input_offsets_ptr);

}


void ConvolutionLayer::configure(const IPortableTensor *input, const IPortableTensor *kernel,

                                 const IPortableTensor *bias, const ir::PaddingType paddingType,

                                 const uint32_t paddingLeft, const uint32_t paddingRight,

                                 const uint32_t paddingTop, const uint32_t paddingBottom,

                                 const uint32_t strideWidth, const uint32_t strideHeight,

                                 const uint32_t dilationWidthFactor,

                                 const uint32_t dilationHeightFactor,

                                 const ir::Activation activation, IPortableTensor *output,

                                 bool is_cachable_weights)

{

  _input = input;

  _kernel = kernel;

  _bias = bias;

  _paddingType = paddingType;

  _paddingLeft = paddingLeft;

  _paddingRight = paddingRight;

  _paddingTop = paddingTop;

  _paddingBottom = paddingBottom;

  _strideWidth = strideWidth;

  _strideHeight = strideHeight;

  _dilationWidthFactor = dilationWidthFactor;

  _dilationHeightFactor = dilationHeightFactor;

  _activation = activation;

  _output = output;

  _is_cachable_weights = is_cachable_weights;

  _is_hybrid = _input->data_type() == OperandType::FLOAT32 &&

               _kernel->data_type() == OperandType::QUANT_INT8_SYMM;

}


void ConvolutionLayer::run()

{

  prepare();

  if (_input->is_dynamic() || _kernel->is_dynamic())

  {

    const auto ifm_shape = _input->getShape().asFeature();

    const auto ofm_shape = _output->getShape().asFeature();

    // Kernel format is [depth_out, kernel_height, kernel_width, depth_in].

    const auto ker_shape = _kernel->getShape();

    const auto ker_height = ker_shape.dim(1);

    const auto ker_width = ker_shape.dim(2);


    ir::Stride stride;

    stride.vertical = _strideWidth;

    stride.horizontal = _strideWidth;


    ir::Padding param_padding;

    param_padding.type = _paddingType;

    param_padding.param.left = _paddingLeft;

    param_padding.param.right = _paddingRight;

    param_padding.param.top = _paddingTop;

    param_padding.param.bottom = _paddingBottom;


    const auto padding =

      ir::calculatePadding(param_padding, ifm_shape, ofm_shape, stride, ker_width, ker_height,

                           _dilationWidthFactor, _dilationHeightFactor);


    _paddingLeft = padding.left;

    _paddingRight = padding.right;

    _paddingTop = padding.top;

    _paddingBottom = padding.bottom;

  }

  if (_is_hybrid)

  {

    convQ8iHybridPerChannel();

  }

  else if (_input->data_type() == OperandType::FLOAT32)

  {

    convFloat32();

  }

  else if (_input->data_type() == OperandType::QUANT_UINT8_ASYMM)

  {

    const bool per_channel_quantized = _kernel->data_scales().size() > 1;

    if (per_channel_quantized)

      convQ8uPerChannel();

    else

      convQ8uPerTensor();

  }

  else if (_input->data_type() == OperandType::QUANT_INT8_ASYMM)

  {

    convQ8i();

  }

  else

  {

    throw std::runtime_error{"Conv: unsupported data type"};

  }

}


void ConvolutionLayer::prepare()

{

  if (_prepare)

    return;


  if (_is_hybrid)

  {

    // ensure weight is per-channel quantized.

    int32_t kernel_output_channel = getShape(_kernel).Dims(0);

    // zero_points comes from flatbuffer vector. Its size is within uint32_t range.

    size_t kernel_zerop_cnt = _kernel->data_scales().size();

    // promote to int64_t to compare int32_t and uint32_t

    if ((int64_t)kernel_output_channel != (int64_t)kernel_zerop_cnt)

      throw std::runtime_error{"Conv2D hybrid supports only per-channel quantized weight."};


    // allocate memory for activation quantization.

    // - quantized values (int8_t type and same shape of original input)

    // - quantization params (= scale/zeropoint for each input)

    auto input_shape = getShape(_input);

    const int batch_size = input_shape.Dims(0);

    const int input_size = input_shape.FlatSize() / batch_size;

    _hybrid_arena = std::make_unique<nnfw::cker::ConvHybridTempArena>(batch_size, input_size);

    _prepare = true;

    return;

  }


  nnfw::cker::Conv &kernel = *_conv_kernel;

  if (_input->data_type() == OperandType::FLOAT32 && _is_cachable_weights)

  {

    bool is_transposed = false;

    kernel.prepareF32(getShape(_kernel), getBuffer<float>(_kernel), getPaddingType(_paddingType),

                      is_transposed, _dilationWidthFactor, _dilationHeightFactor);


    // Decrease reference of _kernel(weights) only when _kernel is constant

    if (is_transposed)

    {

      auto kernel_tensor = dynamic_cast<const Tensor *>(_kernel);

      if (kernel_tensor)

        // TODO Remove const_cast

        const_cast<Tensor *>(kernel_tensor)->decrease_ref();

    }

  }

  else if (_input->data_type() == OperandType::QUANT_UINT8_ASYMM && _is_cachable_weights &&

           !_input->is_dynamic() && !_output->is_dynamic())

  {

    const bool per_channel_quantized = _kernel->data_scales().size() > 1;

    if (per_channel_quantized)

    {

      GetQuantizedConvolutionMultipliersAndShifts(

        _input->data_scale(), _output->data_scale(), _kernel->data_scales().data(),

        _kernel->data_scales().size(), getShape(_kernel).Dims(0),

        kernel.per_channel_output_multiplier(), kernel.per_channel_output_shift());

    }

    else

    {

      kernel.prepareQ8uPerTensor(getShape(_input), getShape(_kernel), getShape(_output),

                                 _strideWidth, _strideHeight, _dilationWidthFactor,

                                 _dilationHeightFactor);

    }

  }

  else if (_input->data_type() == OperandType::QUANT_INT8_ASYMM)

  {

    if (_is_cachable_weights && !_input->is_dynamic() && !_output->is_dynamic())

    {

      GetQuantizedConvolutionMultipliersAndShifts(

        _input->data_scale(), _output->data_scale(), _kernel->data_scales().data(),

        _kernel->data_scales().size(), getShape(_kernel).Dims(0),

        kernel.per_channel_output_multiplier(), kernel.per_channel_output_shift());

    }

    else

    {

      throw std::runtime_error{"Conv2D: Int8 dynamic weight is not supported"};

    }

  }

  _prepare = true;

}


} // namespace onert::backend::cpu::ops

Conv
void Conv(const float *input_data, const Dims< 4 > &input_dims, const float *filter_data, const Dims< 4 > &filter_dims, const float *bias_data, const Dims< 4 > &bias_dims, int stride_width, int stride_height, int pad_width, int pad_height, float *output_data, const Dims< 4 > &output_dims, float *im2col_data, const Dims< 4 > &im2col_dims)
Definition Conv2D.float.cpp:150

FusedActivationFunc::NONE
@ NONE

PortableTensorUtils.h

nnfw::cker::Conv
Definition Conv.h:56

nnfw::cker::Conv::per_channel_output_shift
std::vector< int > & per_channel_output_shift()
Definition Conv.h:151

nnfw::cker::Conv::prepareQ8uPerTensor
void prepareQ8uPerTensor(const Shape &input_shape, const Shape &kernel_shape, const Shape &output_shape, uint32_t stride_width, uint32_t stride_height, uint32_t dilation_width_factor, uint32_t dilation_height_factor)
Definition Conv.h:74

nnfw::cker::Conv::prepareF32
void prepareF32(const Shape &filter_shape, const float *filter_data, PaddingType padding_type, bool &is_replaced_weights, uint32_t dilationWidthFactor, uint32_t dilationHeightFactor)
Definition Conv.h:60

nnfw::cker::Conv::per_channel_output_multiplier
std::vector< int32_t > & per_channel_output_multiplier()
Definition Conv.h:150

nnfw::cker::Shape::Dims
int32_t Dims(int i) const
Definition Shape.h:106

onert::backend::IPortableTensor
A tensor class that is portable for other backends.
Definition IPortableTensor.h:37

onert::backend::IPortableTensor::data_scales
const std::vector< float > & data_scales() const override final
Definition IPortableTensor.h:57

onert::backend::IPortableTensor::data_scale
float data_scale() const override final
Definition IPortableTensor.h:55

onert::backend::IPortableTensor::data_zero_point
int32_t data_zero_point() const override final
Definition IPortableTensor.h:56

onert::backend::IPortableTensor::data_zero_points
const std::vector< int32_t > & data_zero_points() const override
Definition IPortableTensor.h:58

onert::backend::IPortableTensor::data_type
ir::DataType data_type() const override final
Definition IPortableTensor.h:54

onert::backend::IPortableTensor::getShape
ir::Shape getShape() const override final
Get ir::Shape of tensor.
Definition IPortableTensor.h:64

onert::backend::IPortableTensor::is_dynamic
bool is_dynamic() const override final
Return true if the tensor needs dynamic allocation, meaning that during compile-time the outpus shape...
Definition IPortableTensor.h:63

onert::backend::ITensor::buffer
virtual uint8_t * buffer() const =0

onert::backend::ValidatorBase::_supported
bool _supported
Definition ValidatorBase.h:50

onert::backend::basic::KernelGeneratorBase::_return_fn
std::unique_ptr< exec::IFunction > _return_fn
Definition KernelGeneratorBase.h:60

onert::backend::basic::Tensor
Definition Tensor.h:32

onert::backend::cpu::ops::ConvolutionLayer::_prepare
bool _prepare
Definition Conv2DLayer.h:83

onert::backend::cpu::ops::ConvolutionLayer::_paddingBottom
uint32_t _paddingBottom
Definition Conv2DLayer.h:71

onert::backend::cpu::ops::ConvolutionLayer::_conv_kernel
std::unique_ptr< nnfw::cker::Conv > _conv_kernel
Definition Conv2DLayer.h:80

onert::backend::cpu::ops::ConvolutionLayer::configure
void configure(const IPortableTensor *input, const IPortableTensor *kernel, const IPortableTensor *bias, ir::PaddingType _paddingType, const uint32_t paddingLeft, const uint32_t paddingRight, const uint32_t paddingTop, const uint32_t paddingBottom, const uint32_t strideWidth, const uint32_t strideHeight, const uint32_t dilationWidthFactor, const uint32_t dilationHeightFactor, const ir::Activation activation, IPortableTensor *output, bool is_cachable_weights)
Definition Conv2DLayer.cc:253

onert::backend::cpu::ops::ConvolutionLayer::_is_cachable_weights
bool _is_cachable_weights
Definition Conv2DLayer.h:84

onert::backend::cpu::ops::ConvolutionLayer::run
void run() override
Definition Conv2DLayer.cc:282

onert::backend::cpu::ops::ConvolutionLayer::_is_hybrid
bool _is_hybrid
Definition Conv2DLayer.h:85

onert::backend::cpu::ops::ConvolutionLayer::_strideHeight
uint32_t _strideHeight
Definition Conv2DLayer.h:74

onert::backend::cpu::ops::ConvolutionLayer::_activation
ir::Activation _activation
Definition Conv2DLayer.h:78

onert::backend::cpu::ops::ConvolutionLayer::_paddingTop
uint32_t _paddingTop
Definition Conv2DLayer.h:69

onert::backend::cpu::ops::ConvolutionLayer::_bias
const IPortableTensor * _bias
Definition Conv2DLayer.h:64

onert::backend::cpu::ops::ConvolutionLayer::ConvolutionLayer
ConvolutionLayer()
Definition Conv2DLayer.cc:89

onert::backend::cpu::ops::ConvolutionLayer::_kernel
const IPortableTensor * _kernel
Definition Conv2DLayer.h:63

onert::backend::cpu::ops::ConvolutionLayer::_input
const IPortableTensor * _input
Definition Conv2DLayer.h:62

onert::backend::cpu::ops::ConvolutionLayer::prepare
void prepare() override
Definition Conv2DLayer.cc:340

onert::backend::cpu::ops::ConvolutionLayer::_paddingLeft
uint32_t _paddingLeft
Definition Conv2DLayer.h:68

onert::backend::cpu::ops::ConvolutionLayer::_dilationWidthFactor
uint32_t _dilationWidthFactor
Definition Conv2DLayer.h:75

onert::backend::cpu::ops::ConvolutionLayer::_output
IPortableTensor * _output
Definition Conv2DLayer.h:65

onert::backend::cpu::ops::ConvolutionLayer::_paddingType
ir::PaddingType _paddingType
Definition Conv2DLayer.h:67

onert::backend::cpu::ops::ConvolutionLayer::_hybrid_arena
std::unique_ptr< nnfw::cker::ConvHybridTempArena > _hybrid_arena
Definition Conv2DLayer.h:81

onert::backend::cpu::ops::ConvolutionLayer::_dilationHeightFactor
uint32_t _dilationHeightFactor
Definition Conv2DLayer.h:76

onert::backend::cpu::ops::ConvolutionLayer::_strideWidth
uint32_t _strideWidth
Definition Conv2DLayer.h:73

onert::backend::cpu::ops::ConvolutionLayer::_paddingRight
uint32_t _paddingRight
Definition Conv2DLayer.h:70

onert::backend::cpu::ops::ConvolutionLayer::~ConvolutionLayer
~ConvolutionLayer()

onert::util::ObjectManager::at
const Object & at(const Index &index) const
Get the object that is associated with the given index.
Definition ObjectManager.h:119

offset
__global uchar * offset(const Image *img, int x, int y)
Definition helpers.h:540

jpeg2hdf5.b
b
Definition jpeg2hdf5.py:105

nnfw::cker::reference::HybridConvPerChannel
void HybridConvPerChannel(const ConvParams &params, float *scaling_factors_ptr, const Shape &input_shape, const int8_t *input_data, const Shape &filter_shape, const int8_t *filter_data, const Shape &bias_shape, const float *bias_data, const Shape &output_shape, float *output_data, const float *per_channel_scale, const int32_t *input_offset)
Definition Conv.h:314

nnfw::cker::PortableAsymmetricQuantizeFloats
void PortableAsymmetricQuantizeFloats(const float *values, const int size, int8_t *quantized_values, float *scaling_factor, int32_t *offset)
Definition PortableTensorUtils.h:147

nnfw
Definition topk_v2.h:30

onert::backend::cpu::ops
Definition AddNLayer.cc:51

onert::backend::cpu::ops::getShape
nnfw::cker::Shape getShape(const IPortableTensor *tensor)
Definition OperationUtils.h:89

onert::backend::cpu::ops::GetQuantizedConvolutionMultipliersAndShifts
void GetQuantizedConvolutionMultipliersAndShifts(float input_scale, float output_scale, const float *filter_scales, size_t filter_scales_size, int num_channels, std::vector< int32_t > &per_channel_output_multiplier, std::vector< int > &per_channel_output_shift)
Definition OperationUtils.cc:93

onert::backend::cpu::ops::QuantizeMultiplier
void QuantizeMultiplier(double double_multiplier, int32_t *quantized_multiplier, int *shift)
Definition OperationUtils.cc:56

onert::backend::cpu::ops::getPaddingType
nnfw::cker::PaddingType getPaddingType(ir::PaddingType ir_padding_type)
Definition OperationUtils.cc:262

onert::backend::cpu::ops::CalculateActivationRangeQuantized
void CalculateActivationRangeQuantized(ir::Activation activation, const IPortableTensor *output, int32_t *act_min, int32_t *act_max)
Definition OperationUtils.cc:138

onert::backend::cpu::ops::GetQuantizedConvolutionMultiplier
void GetQuantizedConvolutionMultiplier(const IPortableTensor *input, const IPortableTensor *filter, const IPortableTensor *bias, const IPortableTensor *output, double *multiplier)
Definition OperationUtils.cc:77

onert::backend::cpu
Definition Backend.h:31

onert::ir::calculatePadding
const ExplicitPadding calculatePadding(const Padding &padding, const FeatureShape &ifm_shape, const FeatureShape &ofm_shape, const Stride &stride, uint32_t kw, uint32_t kh, uint32_t dwf=1, uint32_t dhf=1)
Definition Padding.cc:131

onert::ir::Activation
Activation
Definition InternalType.h:26

onert::ir::PaddingType
PaddingType
Definition Padding.h:30

onert::util::CalculateActivationRange
void CalculateActivationRange(ir::Activation activation, T *activation_min, T *activation_max)
Definition CalculateActivationRange.h:28

Conv.h

Padding.h

ker_tensor
CLTensor ker_tensor
Definition Convolution.cpp:293

bias_tensor
CLTensor bias_tensor
Definition Convolution.cpp:294

Conv2DLayer.h

Dims
Definition Dims.h:26

nnfw::cker::ConvParams
Definition Types.h:141

nnfw::cker::ConvParams::stride_height
int16_t stride_height
Definition Types.h:146

nnfw::cker::ConvParams::padding_values
PaddingValues padding_values
Definition Types.h:143

nnfw::cker::ConvParams::output_shift
int output_shift
Definition Types.h:155

nnfw::cker::ConvParams::stride_width
int16_t stride_width
Definition Types.h:145

nnfw::cker::ConvParams::float_activation_max
float float_activation_max
Definition Types.h:161

nnfw::cker::ConvParams::input_offset
int32_t input_offset
Definition Types.h:151

nnfw::cker::ConvParams::output_multiplier
int32_t output_multiplier
Definition Types.h:154

nnfw::cker::ConvParams::weights_offset
int32_t weights_offset
Definition Types.h:152

nnfw::cker::ConvParams::output_offset
int32_t output_offset
Definition Types.h:153

nnfw::cker::ConvParams::dilation_width_factor
int16_t dilation_width_factor
Definition Types.h:147

nnfw::cker::ConvParams::float_activation_min
float float_activation_min
Definition Types.h:160

nnfw::cker::ConvParams::quantized_activation_max
int32_t quantized_activation_max
Definition Types.h:158

nnfw::cker::ConvParams::padding_type
PaddingType padding_type
Definition Types.h:142

nnfw::cker::ConvParams::dilation_height_factor
int16_t dilation_height_factor
Definition Types.h:148

nnfw::cker::ConvParams::quantized_activation_min
int32_t quantized_activation_min
Definition Types.h:157

nnfw::cker::ConvParams::is_replaced_weights
bool is_replaced_weights
Definition Types.h:162

nnfw::cker::PaddingValues::height
int16_t height
Definition Types.h:75

nnfw::cker::PaddingValues::width
int16_t width
Definition Types.h:74

onert::ir::ExplicitPadding::top
uint32_t top
Definition Padding.h:47

onert::ir::ExplicitPadding::right
uint32_t right
Definition Padding.h:46

onert::ir::ExplicitPadding::left
uint32_t left
Definition Padding.h:45

onert::ir::ExplicitPadding::bottom
uint32_t bottom
Definition Padding.h:48

onert::ir::Padding
Definition Padding.h:53

onert::ir::Padding::type
PaddingType type
Definition Padding.h:59

onert::ir::Padding::param
ExplicitPadding param
Definition Padding.h:60

onert::ir::Stride
Definition InternalType.h:36

onert::ir::Stride::horizontal
uint32_t horizontal
Definition InternalType.h:38

onert::ir::Stride::vertical
uint32_t vertical
Definition InternalType.h:37

OperationUtils.h