ONE/onert-micro_2include_2pal_2common_2_p_a_l_comparisons_8h_source.html

/*

 * Copyright (c) 2024 Samsung Electronics Co., Ltd. All Rights Reserved

 * Copyright 2017 The TensorFlow Authors. All Rights Reserved.

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#ifndef ONERT_MICRO_EXECUTE_PAL_COMPARISONS_H

#define ONERT_MICRO_EXECUTE_PAL_COMPARISONS_H


#include "OMStatus.h"

#include "core/OMRuntimeShape.h"

#include "PALUtils.h"

#include "ProcessBroadcastShapes.h"


namespace onert_micro

{

namespace execute

{

namespace pal

{


namespace

{


struct BroadcastComparison4DSlowCommon

{

  const core::OMRuntimeShape output_shape;

  NdArrayDesc<4> desc1;

  NdArrayDesc<4> desc2;

};


inline BroadcastComparison4DSlowCommon

BroadcastComparison4DSlowPreprocess(const core::OMRuntimeShape &unextended_input1_shape,

                                    const core::OMRuntimeShape &unextended_input2_shape,

                                    const core::OMRuntimeShape &unextended_output_shape)

{

  NdArrayDesc<4> desc1;

  NdArrayDesc<4> desc2;

  NdArrayDescsForElementwiseBroadcast(unextended_input1_shape, unextended_input2_shape, &desc1,

                                      &desc2);

  return {core::OMRuntimeShape::extendedShape(4, unextended_output_shape), desc1, desc2};

}


} // namespace


template <typename T> inline bool LessFn(T lhs, T rhs) { return lhs < rhs; }

template <typename T> inline bool LessEqualFn(T lhs, T rhs) { return lhs <= rhs; }

template <typename T> inline bool EqualFn(T lhs, T rhs) { return lhs == rhs; }

template <typename T> inline bool GreaterFn(T lhs, T rhs) { return lhs > rhs; }

template <typename T> inline bool GreaterEqualFn(T lhs, T rhs) { return lhs >= rhs; }

template <typename T> inline bool NotEqualFn(T lhs, T rhs) { return lhs != rhs; }


template <typename T>


inline void ComparisonNoScaling(const int64_t flat_size, const T *input1_data, const T *input2_data,

                                bool *output_data, bool F(T, T))

{

  for (int64_t i = 0; i < flat_size; ++i)

  {

    output_data[i] = F(input1_data[i], input2_data[i]);

  }

}


template <typename T, typename AccType>


inline void BroadcastComparison4DSlowWithScaling(

  const core::ComparisonParams &op_params, const core::OMRuntimeShape &unextended_input1_shape,

  const T *input1_data, const core::OMRuntimeShape &unextended_input2_shape, const T *input2_data,

  const core::OMRuntimeShape &unextended_output_shape, bool *output_data, bool F(AccType, AccType))

{

  const BroadcastComparison4DSlowCommon dims = BroadcastComparison4DSlowPreprocess(

    unextended_input1_shape, unextended_input2_shape, unextended_output_shape);


  int left_shift = op_params.left_shift;

  int32_t input1_offset = op_params.input1_offset;

  int32_t input1_multiplier = op_params.input1_multiplier;

  int input1_shift = op_params.input1_shift;

  int32_t input2_offset = op_params.input2_offset;

  int32_t input2_multiplier = op_params.input2_multiplier;

  int input2_shift = op_params.input2_shift;


  for (int b = 0; b < dims.output_shape.dims(0); ++b)

  {

    for (int y = 0; y < dims.output_shape.dims(1); ++y)

    {

      for (int x = 0; x < dims.output_shape.dims(2); ++x)

      {

        for (int c = 0; c < dims.output_shape.dims(3); ++c)

        {

          const int32_t input1_val =

            input1_offset + input1_data[subscriptToIndex(dims.desc1, b, y, x, c)];

          const int32_t input2_val =

            input2_offset + input2_data[subscriptToIndex(dims.desc2, b, y, x, c)];

          const int32_t shifted_input1_val = input1_val * (1 << left_shift);

          const int32_t shifted_input2_val = input2_val * (1 << left_shift);

          const int32_t scaled_input1_val = multiplyByQuantizedMultiplierSmallerThanOneExp(

            shifted_input1_val, input1_multiplier, input1_shift);

          const int32_t scaled_input2_val = multiplyByQuantizedMultiplierSmallerThanOneExp(

            shifted_input2_val, input2_multiplier, input2_shift);


          const int output_data_offset =

            ((b * dims.output_shape.dims(1) + y) * dims.output_shape.dims(2) + x) *

              dims.output_shape.dims(3) +

            c;

          output_data[output_data_offset] = F(scaled_input1_val, scaled_input2_val);

        }

      }

    }

  }

}


template <typename T, typename AccType>


inline void ComparisonWithScaling(const core::ComparisonParams &op_params, const int64_t flat_size,

                                  const T *input1_data, const T *input2_data, bool *output_data,

                                  bool F(AccType, AccType))

{

  int left_shift = op_params.left_shift;

  int32_t input1_offset = op_params.input1_offset;

  int32_t input1_multiplier = op_params.input1_multiplier;

  int input1_shift = op_params.input1_shift;

  int32_t input2_offset = op_params.input2_offset;

  int32_t input2_multiplier = op_params.input2_multiplier;

  int input2_shift = op_params.input2_shift;


  for (int64_t i = 0; i < flat_size; ++i)

  {

    const int32_t input1_val = input1_offset + input1_data[i];

    const int32_t input2_val = input2_offset + input2_data[i];

    const int32_t shifted_input1_val = input1_val * (1 << left_shift);

    const int32_t shifted_input2_val = input2_val * (1 << left_shift);

    const int32_t scaled_input1_val = multiplyByQuantizedMultiplierSmallerThanOneExp(

      shifted_input1_val, input1_multiplier, input1_shift);

    const int32_t scaled_input2_val = multiplyByQuantizedMultiplierSmallerThanOneExp(

      shifted_input2_val, input2_multiplier, input2_shift);

    output_data[i] = F(scaled_input1_val, scaled_input2_val);

  }

}


template <typename T>


inline void BroadcastComparison4DSlowNoScaling(

  const core::ComparisonParams &op_params, const core::OMRuntimeShape &unextended_input1_shape,

  const T *input1_data, const core::OMRuntimeShape &unextended_input2_shape, const T *input2_data,

  const core::OMRuntimeShape &unextended_output_shape, bool *output_data, bool F(T, T))

{

  const BroadcastComparison4DSlowCommon dims = BroadcastComparison4DSlowPreprocess(

    unextended_input1_shape, unextended_input2_shape, unextended_output_shape);


  for (int b = 0; b < dims.output_shape.dims(0); ++b)

  {

    for (int y = 0; y < dims.output_shape.dims(1); ++y)

    {

      for (int x = 0; x < dims.output_shape.dims(2); ++x)

      {

        for (int c = 0; c < dims.output_shape.dims(3); ++c)

        {

          const int output_data_offset =

            ((b * dims.output_shape.dims(1) + y) * dims.output_shape.dims(2) + x) *

              dims.output_shape.dims(3) +

            c;

          output_data[output_data_offset] =

            F(input1_data[subscriptToIndex(dims.desc1, b, y, x, c)],

              input2_data[subscriptToIndex(dims.desc2, b, y, x, c)]);

        }

      }

    }

  }

}


} // namespace pal

} // namespace execute

} // namespace onert_micro


#endif // ONERT_MICRO_EXECUTE_PAL_BINARYOP_COMMON_H

OMRuntimeShape.h

OMStatus.h

onert_micro::core::OMRuntimeShape
Definition OMRuntimeShape.h:31

onert_micro::core::OMRuntimeShape::extendedShape
static OMRuntimeShape extendedShape(size_t new_shape_size, const OMRuntimeShape &shape)
Definition OMRuntimeShape.h:111

desc1
NdArrayDesc< 4 > desc1
Definition PALComparisons.h:33

desc2
NdArrayDesc< 4 > desc2
Definition PALComparisons.h:34

onert_micro::execute::pal::ComparisonNoScaling
void ComparisonNoScaling(const int64_t flat_size, const T *input1_data, const T *input2_data, bool *output_data, bool F(T, T))
Definition PALComparisons.h:65

onert_micro::execute::pal::NotEqualFn
bool NotEqualFn(T lhs, T rhs)
Definition PALComparisons.h:62

onert_micro::execute::pal::LessEqualFn
bool LessEqualFn(T lhs, T rhs)
Definition PALComparisons.h:58

onert_micro::execute::pal::GreaterFn
bool GreaterFn(T lhs, T rhs)
Definition PALComparisons.h:60

onert_micro::execute::pal::EqualFn
bool EqualFn(T lhs, T rhs)
Definition PALComparisons.h:59

onert_micro::execute::pal::multiplyByQuantizedMultiplierSmallerThanOneExp
int32_t multiplyByQuantizedMultiplierSmallerThanOneExp(int32_t x, int32_t quantized_multiplier, int left_shift)
Definition PALUtils.h:112

onert_micro::execute::pal::NdArrayDescsForElementwiseBroadcast
void NdArrayDescsForElementwiseBroadcast(const core::OMRuntimeShape &input0_shape, const core::OMRuntimeShape &input1_shape, NdArrayDesc< N > *desc0_out, NdArrayDesc< N > *desc1_out)
Definition ProcessBroadcastShapes.h:94

onert_micro::execute::pal::ComparisonWithScaling
void ComparisonWithScaling(const core::ComparisonParams &op_params, const int64_t flat_size, const T *input1_data, const T *input2_data, bool *output_data, bool F(AccType, AccType))
Definition PALComparisons.h:122

onert_micro::execute::pal::BroadcastComparison4DSlowWithScaling
void BroadcastComparison4DSlowWithScaling(const core::ComparisonParams &op_params, const core::OMRuntimeShape &unextended_input1_shape, const T *input1_data, const core::OMRuntimeShape &unextended_input2_shape, const T *input2_data, const core::OMRuntimeShape &unextended_output_shape, bool *output_data, bool F(AccType, AccType))
Definition PALComparisons.h:75

onert_micro::execute::pal::GreaterEqualFn
bool GreaterEqualFn(T lhs, T rhs)
Definition PALComparisons.h:61

onert_micro::execute::pal::BroadcastComparison4DSlowNoScaling
void BroadcastComparison4DSlowNoScaling(const core::ComparisonParams &op_params, const core::OMRuntimeShape &unextended_input1_shape, const T *input1_data, const core::OMRuntimeShape &unextended_input2_shape, const T *input2_data, const core::OMRuntimeShape &unextended_output_shape, bool *output_data, bool F(T, T))
Definition PALComparisons.h:149

onert_micro::execute::pal::subscriptToIndex
int subscriptToIndex(const NdArrayDesc< 4 > &desc, int i0, int i1, int i2, int i3)
Definition ProcessBroadcastShapes.h:130

onert_micro::execute::pal::LessFn
bool LessFn(T lhs, T rhs)
Definition PALComparisons.h:57

onert_micro
Definition OMMemoryManager.h:27

PALUtils.h

ProcessBroadcastShapes.h

NdArrayDesc
Definition NDArray.h:38

onert_micro::core::ComparisonParams
Definition OMKernelData.h:206

onert_micro::core::ComparisonParams::left_shift
int left_shift
Definition OMKernelData.h:208

onert_micro::core::ComparisonParams::input2_shift
int input2_shift
Definition OMKernelData.h:214

onert_micro::core::ComparisonParams::input1_shift
int input1_shift
Definition OMKernelData.h:211

onert_micro::core::ComparisonParams::input2_offset
int32_t input2_offset
Definition OMKernelData.h:212

onert_micro::core::ComparisonParams::input2_multiplier
int32_t input2_multiplier
Definition OMKernelData.h:213

onert_micro::core::ComparisonParams::input1_offset
int32_t input1_offset
Definition OMKernelData.h:209

onert_micro::core::ComparisonParams::input1_multiplier
int32_t input1_multiplier
Definition OMKernelData.h:210