ONE/compiler_2luci-interpreter_2src_2kernels_2_sum_8cpp_source.html

/*

 * Copyright (c) 2023 Samsung Electronics Co., Ltd. All Rights Reserved

 * Copyright 2019 The TensorFlow Authors. All Rights Reserved.

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *    http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#include "kernels/Sum.h"


#include "kernels/Utils.h"


#include <tensorflow/lite/kernels/internal/reference/reduce.h>


#include <stdexcept>


namespace luci_interpreter

{

namespace kernels

{


// Returns the number of axes that will be reduced. Removes duplicates.

static int getAxisReductionCount(const int32_t *axes_data, int num_axes, int input_num_dims)

{

  int reduction_count = num_axes;

  for (int i = 0; i < num_axes; ++i)

  {

    int current = axes_data[i] >= 0 ? axes_data[i] : axes_data[i] + input_num_dims;

    assert(current >= 0 && current < input_num_dims);

    for (int j = 0; j < i; j++)

    {

      int previous = axes_data[j] >= 0 ? axes_data[j] : axes_data[j] + input_num_dims;

      // This checks for duplicate axis

      if (current == previous)

      {

        --reduction_count;

        break;

      }

    }

  }

  return reduction_count;

}


static Shape getOutputShape(const Shape &input_shape, const int32_t *axes_data, int num_axes,

                            bool keep_dims)

{

  int input_num_dims = input_shape.num_dims();

  if (input_num_dims == 0)

  {

    return Shape(0);

  }


  if (keep_dims)

  {

    Shape output_shape(input_num_dims);

    for (int idx = 0; idx < input_num_dims; ++idx)

    {

      bool is_axis = false;

      for (int axis_idx = 0; axis_idx < num_axes; ++axis_idx)

      {

        if (axes_data[axis_idx] == idx || axes_data[axis_idx] + input_num_dims == idx)

        {

          is_axis = true;

          break;

        }

      }

      if (is_axis)

      {

        output_shape.dim(idx) = 1;

      }

      else

      {

        output_shape.dim(idx) = input_shape.dim(idx);

      }

    }

    return output_shape;

  }

  else

  {

    int num_reduce_axes = getAxisReductionCount(axes_data, num_axes, input_num_dims);

    Shape output_shape(input_num_dims - num_reduce_axes);

    int num_skip_axes = 0;

    for (int idx = 0; idx < input_num_dims; ++idx)

    {

      bool is_axis = false;

      for (int axis_idx = 0; axis_idx < num_axes; ++axis_idx)

      {

        if (axes_data[axis_idx] == idx || axes_data[axis_idx] + input_num_dims == idx)

        {

          ++num_skip_axes;

          is_axis = true;

          break;

        }

      }

      if (!is_axis)

      {

        output_shape.dim(idx - num_skip_axes) = input_shape.dim(idx);

      }

    }

    return output_shape;

  }

}


Sum::Sum(const Tensor *input, const Tensor *axes, Tensor *output, Tensor *temp_index,

         Tensor *resolved_axes, const ReducerParams &params)

  : KernelWithParams<ReducerParams>({input, axes}, {output, temp_index, resolved_axes}, params)

{

}


void Sum::configure()

{

  LUCI_INTERPRETER_CHECK(input()->element_type() == output()->element_type());

  LUCI_INTERPRETER_CHECK(axes()->element_type() == DataType::S32);


  const Shape &input_shape = input()->shape();

  int input_num_dims = input_shape.num_dims();


  const auto *axes_data = getTensorData<int32_t>(axes());

  int num_axes = axes()->shape().num_elements();

  LUCI_INTERPRETER_CHECK(num_axes <= 4);


  // We compute shapes of outputs in configure, assuming that outputs have

  // static shape

  // TODO Support dynamic shape

  Shape output_shape = getOutputShape(input_shape, axes_data, num_axes, _params.keep_dims);

  output()->resize(output_shape);


  auto temp_index = getOutputTensors()[1];

  auto resolved_axes = getOutputTensors()[2];


  temp_index->resize(Shape(input_num_dims));

  resolved_axes->resize(Shape(num_axes));

}


void Sum::execute() const

{

  switch (input()->element_type())

  {

    case DataType::FLOAT32:

      evalFloat();

      break;

    default:

      throw std::runtime_error("luci-intp Sum Unsupported type.");

  }

}


void Sum::evalFloat() const

{

  const auto *axes_data = getTensorData<int32_t>(axes());

  int num_axes = axes()->shape().num_elements();


  auto temp_index = getOutputTensors()[1];

  auto resolved_axes = getOutputTensors()[2];


  int num_resolved_axis = 0;

  LUCI_INTERPRETER_CHECK(

    tflite::reference_ops::ResolveAxis(input()->shape().num_dims(), axes_data, num_axes,

                                       getTensorData<int>(resolved_axes), &num_resolved_axis));


  float init_value = 0.0;

  tflite::reference_ops::ReduceGeneric<float>(

    getTensorData<float>(input()), getTensorShape(input()).DimsData(), input()->shape().num_dims(),

    getTensorData<float>(output()), getTensorShape(output()).DimsData(),

    output()->shape().num_dims(), axes_data, num_axes, _params.keep_dims,

    getTensorData<int>(temp_index), getTensorData<int>(resolved_axes), init_value,

    [](const float current, const float in) -> float { return current + in; });

}


} // namespace kernels

} // namespace luci_interpreter

luci_interpreter::Kernel::getOutputTensors
const std::vector< Tensor * > & getOutputTensors() const
Definition Kernel.h:40

luci_interpreter::KernelWithParams
Definition Kernel.h:58

luci_interpreter::KernelWithParams< ReducerParams >::_params
const ReducerParams _params
Definition Kernel.h:70

luci_interpreter::Shape
Definition Tensor.h:33

luci_interpreter::Shape::num_elements
int32_t num_elements() const
Definition Tensor.h:53

luci_interpreter::Shape::num_dims
int num_dims() const
Definition Tensor.h:39

luci_interpreter::Tensor
Definition Tensor.h:101

luci_interpreter::Tensor::resize
void resize(const Shape &new_shape)
Definition Tensor.cpp:56

luci_interpreter::Tensor::shape
const Shape & shape() const
Definition Tensor.h:107

luci_interpreter::kernels::Sum::Sum
Sum(const Tensor *input, const Tensor *axes, Tensor *output, Tensor *temp_index, Tensor *resolved_axes, const ReducerParams &params)
Definition Sum.cpp:113

luci_interpreter::kernels::Sum::output
Tensor * output() const
Definition Sum.h:39

luci_interpreter::kernels::Sum::configure
void configure() override
Definition Sum.cpp:119

luci_interpreter::kernels::Sum::axes
const Tensor * axes() const
Definition Sum.h:38

luci_interpreter::kernels::Sum::input
const Tensor * input() const
Definition Sum.h:37

luci_interpreter::kernels::Sum::execute
void execute() const override
Definition Sum.cpp:144

LUCI_INTERPRETER_CHECK
#define LUCI_INTERPRETER_CHECK(cond)
Definition Utils.h:36

output_shape
const luci_interpreter::RuntimeShape output_shape
Definition PALComparisons.h:32

Sum.h

luci_interpreter::kernels::getTensorShape
tflite::RuntimeShape getTensorShape(const Tensor *tensor)
Definition Utils.h:194

luci_interpreter
Definition BuddyMemoryManager.h:22

luci::must_cast
T must_cast(loco::Node *node)
Definition CircleNodeDecl.h:95

Shape
Definition Shape.h:28

luci_interpreter::ReducerParams
Definition KernelParams.h:177

luci_interpreter::ReducerParams::keep_dims
bool keep_dims
Definition KernelParams.h:178