ONE/onert-micro_2include_2pal_2common_2_p_a_l_fully_connected_common_8h_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 * Copyright 2020 The TensorFlow Authors. All Rights Reserved.

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#ifndef ONERT_MICRO_EXECUTE_PAL_FULLY_CONNECTED_COMMON_H

#define ONERT_MICRO_EXECUTE_PAL_FULLY_CONNECTED_COMMON_H


#include "OMStatus.h"

#include "PALUtils.h"


#include <cmath>


namespace onert_micro

{

namespace execute

{

namespace pal

{


template <typename InputType, typename WeightType, typename OutputType, typename BiasType>


OMStatus FullyConnected(const core::FullyConnectedParams &params, const InputType *input_data,

                        const core::OMRuntimeShape &filter_shape, const WeightType *filter_data,

                        const BiasType *bias_data, const core::OMRuntimeShape &output_shape,

                        OutputType *output_data)

{

  const int32_t input_offset = params.input_offset;

  const int32_t filter_offset = params.weights_offset;

  const int32_t output_offset = params.output_offset;

  const int32_t output_multiplier = params.output_multiplier;

  const int output_shift = params.output_shift;

  const int32_t output_activation_min = params.quantized_activation_min;

  const int32_t output_activation_max = params.quantized_activation_max;


  const int filter_dim_count = filter_shape.dimensionsCount();

  const int output_dim_count = output_shape.dimensionsCount();

  const int batches =

    flatSizeSkipDim(output_shape.dimsData(), output_dim_count - 1, output_dim_count);

  const int output_depth = output_shape.dims(output_dim_count - 1);


  const int accum_depth = filter_shape.dims(filter_dim_count - 1);

  for (int b = 0; b < batches; ++b)

  {

    for (int out_c = 0; out_c < output_depth; ++out_c)

    {

      BiasType acc = 0;

      for (int d = 0; d < accum_depth; ++d)

      {

        int32_t input_val = input_data[b * accum_depth + d];

        int32_t filter_val = filter_data[out_c * accum_depth + d];

        acc += (filter_val + filter_offset) * (input_val + input_offset);

      }

      if (bias_data)

      {

        acc += bias_data[out_c];

      }

      int32_t acc_scaled = multiplyByQuantizedMultiplier(acc, output_multiplier, output_shift);

      acc_scaled += output_offset;

      acc_scaled = std::max(acc_scaled, output_activation_min);

      acc_scaled = std::min(acc_scaled, output_activation_max);

      output_data[out_c + output_depth * b] = static_cast<OutputType>(acc_scaled);

    }

  }

  return Ok;

}


template <typename WeightType>


OMStatus inline FullyConnected(const core::FullyConnectedParams &params, const float *input_data,

                               const core::OMRuntimeShape &filter_shape,

                               const WeightType *filter_data, const float *bias_data,

                               const core::OMRuntimeShape &output_shape, float *output_data)

{

  const float output_activation_min = params.float_activation_min;

  const float output_activation_max = params.float_activation_max;


  const int batches = flatSizeSkipDim(output_shape.dimsData(), output_shape.dimensionsCount() - 1,

                                      output_shape.dimensionsCount());

  const int output_depth = output_shape.dims(output_shape.dimensionsCount() - 1);

  const int accum_depth = filter_shape.dims(filter_shape.dimensionsCount() - 1);


  for (int b = 0; b < batches; ++b)

  {

    const float *weight_scale_ptr = params.weights_scales;

    for (int out_c = 0; out_c < output_depth; ++out_c)

    {

      float total = 0.f;

      for (int d = 0; d < accum_depth; ++d)

      {

        auto input_value = input_data[b * accum_depth + d];

        if (std::is_same<WeightType, float>::value)

        {

          total += input_value * filter_data[out_c * accum_depth + d];

        }

        else

        {

          const float filter_scale = *weight_scale_ptr;

          const float filter_value =

            static_cast<float>(filter_data[out_c * accum_depth + d]) * filter_scale;

          total += input_value * filter_value;

        }

      }

      float bias_value = 0.0f;

      if (bias_data)

      {

        bias_value = bias_data[out_c];

      }

      output_data[out_c + output_depth * b] =

        std::min(std::max(total + bias_value, output_activation_min), output_activation_max);


      if (std::is_same<WeightType, int8_t>::value)

      {

        if (params.is_channel_wise_quant)

          weight_scale_ptr++;

      }

    }

  }

  return Ok;

}


} // namespace pal

} // namespace execute

} // namespace onert_micro


#endif // ONERT_MICRO_EXECUTE_PAL_FULLY_CONNECTED_COMMON_H

OMStatus.h

luci_interpreter::RuntimeShape::dimensionsCount
int32_t dimensionsCount() const
Definition Tensor.h:106

luci_interpreter::RuntimeShape::dims
int32_t dims(int i) const
Definition Tensor.h:108

luci_interpreter::RuntimeShape::dimsData
int32_t * dimsData()
Definition Tensor.h:56

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:31

onert_micro::core::OMRuntimeShape::dimensionsCount
size_t dimensionsCount() const noexcept
Definition OMRuntimeShape.h:148

onert_micro::core::OMRuntimeShape::dims
int32_t dims(size_t i) const
Definition OMRuntimeShape.h:153

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

onert_micro::execute::pal::flatSizeSkipDim
int flatSizeSkipDim(const int32_t *dims_data, int skip_dim, int num_dims)
Definition PALUtils.h:210

onert_micro::execute::pal::FullyConnected
OMStatus FullyConnected(const core::FullyConnectedParams &params, const int16_t *input_data, const core::OMRuntimeShape &filter_shape, const int8_t *filter_data, const int64_t *bias_data, const core::OMRuntimeShape &output_shape, int16_t *output_data)
Definition PALFullyConnected.h:98

onert_micro::execute::pal::multiplyByQuantizedMultiplier
int32_t multiplyByQuantizedMultiplier(int32_t x, int32_t quantized_multiplier, int shift)
Definition PALUtils.h:104

onert_micro
Definition OMMemoryManager.h:26

onert_micro::OMStatus
OMStatus
Definition OMStatus.h:24

onert_micro::Ok
@ Ok
Definition OMStatus.h:25

PALUtils.h

onert_micro::core::FullyConnectedParams
Definition OMKernelData.h:180

onert_micro::core::FullyConnectedParams::is_channel_wise_quant
bool is_channel_wise_quant
Definition OMKernelData.h:190

onert_micro::core::FullyConnectedParams::input_offset
int32_t input_offset
Definition OMKernelData.h:185

onert_micro::core::FullyConnectedParams::weights_offset
int32_t weights_offset
Definition OMKernelData.h:186

onert_micro::core::FullyConnectedParams::float_activation_min
float float_activation_min
Definition OMKernelData.h:182

onert_micro::core::FullyConnectedParams::output_multiplier
int32_t output_multiplier
Definition OMKernelData.h:188

onert_micro::core::FullyConnectedParams::quantized_activation_max
int32_t quantized_activation_max
Definition OMKernelData.h:194

onert_micro::core::FullyConnectedParams::output_shift
int output_shift
Definition OMKernelData.h:191

onert_micro::core::FullyConnectedParams::quantized_activation_min
int32_t quantized_activation_min
Definition OMKernelData.h:193

onert_micro::core::FullyConnectedParams::output_offset
int32_t output_offset
Definition OMKernelData.h:187

onert_micro::core::FullyConnectedParams::float_activation_max
float float_activation_max
Definition OMKernelData.h:183

onert_micro::core::FullyConnectedParams::weights_scales
const float * weights_scales
Definition OMKernelData.h:189