ONE/nnfw__session_8h_source.html

/*

 * Copyright (c) 2019 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *      http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#ifndef __API_NNFW_SESSION_H__

#define __API_NNFW_SESSION_H__


#include "nnfw.h"


#include "CustomKernelRegistry.h"

#include "compiler/CompilerOptions.h"

#include "compiler/ICompiler.h"

#include "exec/Execution.h"

#include "ir/NNPkg.h"

#include "ir/train/TrainingInfo.h"

#include "odc/CodegenManager.h"

#include "odc/QuantizeManager.h"


#include <util/TracingCtx.h>


#include <filesystem>

#include <memory>

#include <string>

#include <thread>

#include <vector>


struct nnfw_session

{

private:

  enum class State

  {

    INITIALIZED,       //< Session is initialized and nothing has done to it

    MODEL_LOADED,      //< Model is loaded

    PREPARED,          //< Prepared(compiled) for execution

    RUNNING,           //< Execution is in progress (only for asynchronous execution)

    FINISHED_RUN,      //< Executed at least once

    PREPARED_TRAINING, //< Prepared for training

    FINISHED_TRAINING  //< Trained at least once

  };


  enum class AutoCompilationState

  {

    INITIAL_STATE,          //< Initial state

    QUANTIZED_MODEL_LOADED, //< Qunatized model is loaded

    COMPILED_MODEL_LOADED   //< Compiled model is loaded

  };


public:

  static NNFW_STATUS create(nnfw_session **session);


private:

  nnfw_session();


public:

  ~nnfw_session();

  NNFW_STATUS load_model_from_path(const char *path);

  NNFW_STATUS prepare();

  NNFW_STATUS run();


  NNFW_STATUS run_async();

  NNFW_STATUS await();


  NNFW_STATUS set_input(uint32_t index, NNFW_TYPE type, const void *buffer, size_t length);

  NNFW_STATUS set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length);


  NNFW_STATUS input_size(uint32_t *number);

  NNFW_STATUS output_size(uint32_t *number);


  NNFW_STATUS set_input_layout(uint32_t index, NNFW_LAYOUT layout);

  NNFW_STATUS set_output_layout(uint32_t index, NNFW_LAYOUT layout);

  NNFW_STATUS set_input_type(uint32_t index, NNFW_TYPE type);

  NNFW_STATUS set_output_type(uint32_t index, NNFW_TYPE type);


  NNFW_STATUS set_input_tensorinfo(uint32_t index, const nnfw_tensorinfo *ti);


  NNFW_STATUS input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);

  NNFW_STATUS output_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);


  NNFW_STATUS set_available_backends(const char *backends);


  NNFW_STATUS set_workspace(const char *dir);


  NNFW_STATUS set_signature_for_tensorinfo(const char *signature);

  NNFW_STATUS set_signature_run(const char *signature);


  static NNFW_STATUS deprecated(const char *msg);


  //

  // Internal-only API

  //


  NNFW_STATUS set_config(const char *key, const char *value);

  NNFW_STATUS get_config(const char *key, char *value, size_t value_size);

  NNFW_STATUS load_circle_from_buffer(uint8_t *buffer, size_t size);

  NNFW_STATUS get_output(uint32_t index, nnfw_tensorinfo *out_info, const void **out_buffer);


  //

  // Experimental API

  //

  NNFW_STATUS register_custom_operation(const std::string &id, nnfw_custom_eval eval_func);

  NNFW_STATUS input_tensorindex(const char *tensorname, uint32_t *index);

  NNFW_STATUS output_tensorindex(const char *tensorname, uint32_t *index);


  // Run inference with auto compilation

  NNFW_STATUS run_with_auto_compilation(const char *target, NNFW_CODEGEN_PREF pref);

  // Set odc parameter: minmax_records_count for quantization in auto compilation mode

  NNFW_STATUS set_odc_param_minmax_records_count(int minmax_records_count);

  // delete MinMax File of on-device compiler

  NNFW_STATUS delete_odc_minmax_file();


  NNFW_STATUS set_backends_per_operation(const char *backend_settings);


  NNFW_STATUS train_get_traininfo(nnfw_train_info *info);

  NNFW_STATUS train_set_traininfo(const nnfw_train_info *info);

  NNFW_STATUS train_prepare();

  NNFW_STATUS train_input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);

  NNFW_STATUS train_expected_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);

  NNFW_STATUS train_set_input(uint32_t index, const void *input,

                              const nnfw_tensorinfo *input_tensorinfo);

  NNFW_STATUS train_set_expected(uint32_t index, const void *expected,

                                 const nnfw_tensorinfo *expected_tensorinfo);

  NNFW_STATUS train_set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length);

  NNFW_STATUS train_run(bool update_weights);

  NNFW_STATUS train_get_loss(uint32_t index, float *loss);

  NNFW_STATUS train_export_circle(const char *path);

  NNFW_STATUS train_export_circleplus(const char *path);

  NNFW_STATUS train_import_checkpoint(const char *path);

  NNFW_STATUS train_export_checkpoint(const char *path);


  NNFW_STATUS set_quantization_type(NNFW_QUANTIZE_TYPE qtype);

  NNFW_STATUS set_quantized_model_path(const char *path);

  NNFW_STATUS quantize();


  NNFW_STATUS set_codegen_model_path(const char *path);

  NNFW_STATUS codegen(const char *target, NNFW_CODEGEN_PREF pref);


  NNFW_STATUS set_prepare_config(const NNFW_PREPARE_CONFIG key, const char *value);

  NNFW_STATUS reset_prepare_config();

  NNFW_STATUS set_execute_config(const NNFW_RUN_CONFIG key, const char *value);

  NNFW_STATUS reset_execute_config();


private:

  const onert::ir::IGraph *primary_subgraph();

  uint32_t getInputSize();

  uint32_t getOutputSize();

  NNFW_STATUS loadModelFile(const std::string &model_file_path, const std::string &model_type);


  bool isStateInitialized();

  bool isStateModelLoaded();

  bool isStatePrepared();

  bool isStateRunning();

  bool isStateFinishedRun();

  bool isStatePreparedOrFinishedRun();

  bool isStatePreparedTraining();

  bool isStateFinishedTraining();

  bool isStatePreparedOrFinishedTraining();


private:

  State _state{State::INITIALIZED};

  std::unique_ptr<onert::ir::NNPkg> _nnpkg;

  std::unique_ptr<onert::compiler::CompilerOptions> _coptions;

  std::unique_ptr<onert::compiler::CompilerArtifact> _compiler_artifact;

  std::unique_ptr<onert::exec::Execution> _execution;

  std::shared_ptr<onert::api::CustomKernelRegistry> _kernel_registry;

  std::vector<std::thread> _threads;

  std::unique_ptr<onert::ir::train::TrainingInfo> _train_info;

  std::unique_ptr<onert::odc::QuantizeManager> _quant_manager;

  std::unique_ptr<onert::odc::CodegenManager> _codegen_manager;

  AutoCompilationState _autoCompilationState = AutoCompilationState::INITIAL_STATE;

  // Remember path to loaded original model

  // It may be used for on-device compiler / on-device training.

  //

  // If necessary, we may replace _model_path to _model_origin like:

  //

  //   union _model_origin {

  //     const char *path;

  //     const uint8 *buf;

  //   }

  std::filesystem::path _model_path;

  std::unordered_map<onert::ir::SubgraphIndex, std::string> _signature_map;

  onert::ir::SubgraphIndex _selected_signature;

};


#endif // __API_NNFW_SESSION_H__

CodegenManager.h

CompilerOptions.h

CustomKernelRegistry.h

Execution.h
This file defines execution.

ICompiler.h
This file contains ICompiler class to define and run compilation phase.

NNPkg.h

QuantizeManager.h

TracingCtx.h

TrainingInfo.h

onert::util::Index< uint16_t, SubgraphIndexTag >

info
volatile const char info[]
Definition library_info.cc:17

backends
Definition backends.py:1

nnfw.h
This file describes runtime API.

NNFW_LAYOUT
NNFW_LAYOUT
Data format of a tensor.
Definition nnfw.h:134

nnfw_custom_eval
void(* nnfw_custom_eval)(nnfw_custom_kernel_params *params, char *userdata, size_t userdata_size)
Definition nnfw_experimental.h:55

NNFW_CODEGEN_PREF
NNFW_CODEGEN_PREF
Preference for target-dependent code generation.
Definition nnfw_experimental.h:595

NNFW_QUANTIZE_TYPE
NNFW_QUANTIZE_TYPE
Convert between training mode and inference mode.
Definition nnfw_experimental.h:543

NNFW_RUN_CONFIG
NNFW_RUN_CONFIG
Configuration key for execution.
Definition nnfw_experimental.h:749

NNFW_PREPARE_CONFIG
NNFW_PREPARE_CONFIG
Configuration key for prepare (compile and schedule)
Definition nnfw_experimental.h:708

size
int32_t size[5]
Definition Slice.cpp:35

NNFW_STATUS
NNFW_STATUS
Result values returned from a call to an API function.
Definition onert-micro.h:86

NNFW_TYPE
NNFW_TYPE
Definition onert-micro.h:75

nnfw_session
Definition onert-micro.cpp:69

nnfw_session::train_prepare
NNFW_STATUS train_prepare()

nnfw_session::run
NNFW_STATUS run()
Definition nnfw_session.cc:465

nnfw_session::set_input_type
NNFW_STATUS set_input_type(uint32_t index, NNFW_TYPE type)
Definition nnfw_session.cc:699

nnfw_session::train_set_output
NNFW_STATUS train_set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length)

nnfw_session::train_get_traininfo
NNFW_STATUS train_get_traininfo(nnfw_train_info *info)
Definition nnfw_session.cc:1338

nnfw_session::set_config
NNFW_STATUS set_config(const char *key, const char *value)
Definition nnfw_session.cc:1070

nnfw_session::train_set_expected
NNFW_STATUS train_set_expected(uint32_t index, void *expected)
Definition onert-micro.cpp:344

nnfw_session::delete_odc_minmax_file
NNFW_STATUS delete_odc_minmax_file()
Definition nnfw_session.cc:2233

nnfw_session::set_odc_param_minmax_records_count
NNFW_STATUS set_odc_param_minmax_records_count(int minmax_records_count)
Definition nnfw_session.cc:2219

nnfw_session::train_run
NNFW_STATUS train_run(bool update_weights)

nnfw_session::set_signature_for_tensorinfo
NNFW_STATUS set_signature_for_tensorinfo(const char *signature)
Definition nnfw_session.cc:1012

nnfw_session::input_tensorinfo
NNFW_STATUS input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)
Definition nnfw_session.cc:824

nnfw_session::output_tensorinfo
NNFW_STATUS output_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)
Definition nnfw_session.cc:866

nnfw_session::set_input_tensorinfo
NNFW_STATUS set_input_tensorinfo(uint32_t index, const nnfw_tensorinfo *ti)
Definition nnfw_session.cc:773

nnfw_session::input_tensorindex
NNFW_STATUS input_tensorindex(const char *tensorname, uint32_t *index)
Definition nnfw_session.cc:1297

nnfw_session::train_export_checkpoint
NNFW_STATUS train_export_checkpoint(const char *path)

nnfw_session::set_output
NNFW_STATUS set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length)
Definition nnfw_session.cc:552

nnfw_session::train_import_checkpoint
NNFW_STATUS train_import_checkpoint(const char *path)

nnfw_session::set_workspace
NNFW_STATUS set_workspace(const char *dir)
Definition nnfw_session.cc:997

nnfw_session::deprecated
static NNFW_STATUS deprecated(const char *msg)
Definition nnfw_session.cc:1064

nnfw_session::train_expected_tensorinfo
NNFW_STATUS train_expected_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)

nnfw_session::reset_prepare_config
NNFW_STATUS reset_prepare_config()
Definition nnfw_session.cc:2161

nnfw_session::set_codegen_model_path
NNFW_STATUS set_codegen_model_path(const char *path)
Definition nnfw_session.cc:2052

nnfw_session::train_set_input
NNFW_STATUS train_set_input(uint32_t index, void *input)
Definition onert-micro.cpp:337

nnfw_session::reset_execute_config
NNFW_STATUS reset_execute_config()
Definition nnfw_session.cc:2204

nnfw_session::set_input
NNFW_STATUS set_input(uint32_t index, NNFW_TYPE type, const void *buffer, size_t length)
Definition nnfw_session.cc:524

nnfw_session::output_size
NNFW_STATUS output_size(uint32_t *number)
Definition nnfw_session.cc:602

nnfw_session::train_get_loss
NNFW_STATUS train_get_loss(uint32_t index, float *loss)

nnfw_session::prepare
NNFW_STATUS prepare()
Definition nnfw_session.cc:430

nnfw_session::load_model_from_path
NNFW_STATUS load_model_from_path(const char *path)
Definition nnfw_session.cc:305

nnfw_session::set_backends_per_operation
NNFW_STATUS set_backends_per_operation(const char *backend_settings)
Set backends with string-encoded mapping from operation index to backend type (cpu,...
Definition nnfw_session.cc:1307

nnfw_session::set_quantization_type
NNFW_STATUS set_quantization_type(NNFW_QUANTIZE_TYPE qtype)
Definition nnfw_session.cc:1966

nnfw_session::input_size
NNFW_STATUS input_size(uint32_t *number)
Definition nnfw_session.cc:580

nnfw_session::run_async
NNFW_STATUS run_async()
Definition nnfw_session.cc:494

nnfw_session::set_output_type
NNFW_STATUS set_output_type(uint32_t index, NNFW_TYPE type)
Definition nnfw_session.cc:736

nnfw_session::set_prepare_config
NNFW_STATUS set_prepare_config(const NNFW_PREPARE_CONFIG key, const char *value)
Definition nnfw_session.cc:2138

nnfw_session::set_available_backends
NNFW_STATUS set_available_backends(const char *backends)
Definition nnfw_session.cc:973

nnfw_session::await
NNFW_STATUS await()
Definition nnfw_session.cc:509

nnfw_session::get_config
NNFW_STATUS get_config(const char *key, char *value, size_t value_size)
Definition nnfw_session.cc:1178

nnfw_session::codegen
NNFW_STATUS codegen(const char *target, NNFW_CODEGEN_PREF pref)
Definition nnfw_session.cc:2074

nnfw_session::set_execute_config
NNFW_STATUS set_execute_config(const NNFW_RUN_CONFIG key, const char *value)
Definition nnfw_session.cc:2174

nnfw_session::run_with_auto_compilation
NNFW_STATUS run_with_auto_compilation(const char *target, NNFW_CODEGEN_PREF pref)
Definition nnfw_session.cc:2248

nnfw_session::set_output_layout
NNFW_STATUS set_output_layout(uint32_t index, NNFW_LAYOUT layout)
Definition nnfw_session.cc:661

nnfw_session::~nnfw_session
~nnfw_session()

nnfw_session::train_input_tensorinfo
NNFW_STATUS train_input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)

nnfw_session::register_custom_operation
NNFW_STATUS register_custom_operation(const std::string &id, nnfw_custom_eval eval_func)
Definition nnfw_session.cc:910

nnfw_session::get_output
NNFW_STATUS get_output(uint32_t index, nnfw_tensorinfo *out_info, const void **out_buffer)
Definition nnfw_session.cc:917

nnfw_session::train_export_circle
NNFW_STATUS train_export_circle(const char *path)

nnfw_session::output_tensorindex
NNFW_STATUS output_tensorindex(const char *tensorname, uint32_t *index)
Definition nnfw_session.cc:1302

nnfw_session::set_quantized_model_path
NNFW_STATUS set_quantized_model_path(const char *path)
Definition nnfw_session.cc:2006

nnfw_session::set_signature_run
NNFW_STATUS set_signature_run(const char *signature)
Definition nnfw_session.cc:1039

nnfw_session::load_circle_from_buffer
NNFW_STATUS load_circle_from_buffer(uint8_t *buffer, size_t size)
Definition nnfw_session.cc:278

nnfw_session::train_export_circleplus
NNFW_STATUS train_export_circleplus(const char *path)
Definition nnfw_session.cc:1853

nnfw_session::set_input_layout
NNFW_STATUS set_input_layout(uint32_t index, NNFW_LAYOUT layout)
Definition nnfw_session.cc:624

nnfw_session::create
static NNFW_STATUS create(nnfw_session **session)
Factory method. It creates and initialize nnfw_session.

nnfw_session::train_set_traininfo
NNFW_STATUS train_set_traininfo(const nnfw_train_info *info)

nnfw_session::quantize
NNFW_STATUS quantize()
Definition nnfw_session.cc:2027

nnfw_tensorinfo
tensor info describes the type and shape of tensors
Definition onert-micro.h:124

nnfw_train_info
Training information to prepare training.
Definition onert-micro.h:187

onert::ir::IGraph
Definition IGraph.h:27