ONE/runtime_2onert_2api_2nnfw_2src_2_session_8h_source.html

/*

 * Copyright (c) 2019 Samsung Electronics Co., Ltd. All Rights Reserved

 *

 * Licensed under the Apache License, Version 2.0 (the "License");

 * you may not use this file except in compliance with the License.

 * You may obtain a copy of the License at

 *

 *      http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */


#ifndef __API_NNFW_SESSION_H__

#define __API_NNFW_SESSION_H__


#include "nnfw.h"


#include "CustomKernelRegistry.h"

#include "compiler/CompilerOptions.h"

#include "compiler/ICompiler.h"

#include "exec/Execution.h"

#include "ir/NNPkg.h"

#include "ir/train/TrainingInfo.h"

#include "odc/CodegenManager.h"

#include "odc/QuantizeManager.h"


#include <util/TracingCtx.h>


#include <filesystem>

#include <memory>

#include <string>

#include <vector>


namespace onert::api

{


struct Session

{

private:

  enum class State

  {

    INITIALIZED,       //< Session is initialized and nothing has done to it

    MODEL_LOADED,      //< Model is loaded

    PREPARED,          //< Prepared(compiled) for execution

    RUNNING,           //< Execution is in progress (only for asynchronous execution)

    FINISHED_RUN,      //< Executed at least once

    PREPARED_TRAINING, //< Prepared for training

    FINISHED_TRAINING  //< Trained at least once

  };


  enum class AutoCompilationState

  {

    INITIAL_STATE,          //< Initial state

    QUANTIZED_MODEL_LOADED, //< Qunatized model is loaded

    COMPILED_MODEL_LOADED   //< Compiled model is loaded

  };


public:

  static NNFW_STATUS create(Session **session);


private:

  Session();


public:

  ~Session();

  NNFW_STATUS load_model_from_path(const char *path);

  NNFW_STATUS prepare();

  NNFW_STATUS run();


  NNFW_STATUS run_async();

  NNFW_STATUS await();


  NNFW_STATUS set_input(uint32_t index, NNFW_TYPE type, const void *buffer, size_t length);

  NNFW_STATUS set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length);


  NNFW_STATUS input_size(uint32_t *number);

  NNFW_STATUS output_size(uint32_t *number);


  NNFW_STATUS set_input_layout(uint32_t index, NNFW_LAYOUT layout);

  NNFW_STATUS set_output_layout(uint32_t index, NNFW_LAYOUT layout);

  NNFW_STATUS set_input_type(uint32_t index, NNFW_TYPE type);

  NNFW_STATUS set_output_type(uint32_t index, NNFW_TYPE type);


  NNFW_STATUS set_input_tensorinfo(uint32_t index, const nnfw_tensorinfo *ti);


  NNFW_STATUS input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);

  NNFW_STATUS output_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);


  NNFW_STATUS set_available_backends(const char *backends);


  NNFW_STATUS set_workspace(const char *dir);


  NNFW_STATUS configure_signature(const char *signature);

  NNFW_STATUS set_signature_run(const char *signature);


  NNFW_STATUS get_last_error_message(char *buffer, size_t length) const;


  NNFW_STATUS deprecated(const char *msg);


  //

  // Internal-only API

  //


  NNFW_STATUS set_config(const char *key, const char *value);

  NNFW_STATUS get_config(const char *key, char *value, size_t value_size);

  NNFW_STATUS load_circle_from_buffer(uint8_t *buffer, size_t size);

  NNFW_STATUS get_output(uint32_t index, nnfw_tensorinfo *out_info, const void **out_buffer);


  //

  // Experimental API

  //

  NNFW_STATUS register_custom_operation(const std::string &id, nnfw_custom_eval eval_func);

  NNFW_STATUS input_tensorindex(const char *tensorname, uint32_t *index);

  NNFW_STATUS output_tensorindex(const char *tensorname, uint32_t *index);


  // Run inference with auto compilation

  NNFW_STATUS run_with_auto_compilation(const char *target, NNFW_CODEGEN_PREF pref);

  // Set odc parameter: minmax_records_count for quantization in auto compilation mode

  NNFW_STATUS set_odc_param_minmax_records_count(int minmax_records_count);

  // delete MinMax File of on-device compiler

  NNFW_STATUS delete_odc_minmax_file();


  NNFW_STATUS set_backends_per_operation(const char *backend_settings);


  NNFW_STATUS train_get_traininfo(nnfw_train_info *info);

  NNFW_STATUS train_set_traininfo(const nnfw_train_info *info);

  NNFW_STATUS train_prepare();

  NNFW_STATUS train_input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);

  NNFW_STATUS train_expected_tensorinfo(uint32_t index, nnfw_tensorinfo *ti);

  NNFW_STATUS train_set_input(uint32_t index, const void *input,

                              const nnfw_tensorinfo *input_tensorinfo);

  NNFW_STATUS train_set_expected(uint32_t index, const void *expected,

                                 const nnfw_tensorinfo *expected_tensorinfo);

  NNFW_STATUS train_set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length);

  NNFW_STATUS train_run(bool update_weights);

  NNFW_STATUS train_get_loss(uint32_t index, float *loss);

  NNFW_STATUS train_export_circle(const char *path);

  NNFW_STATUS train_export_circleplus(const char *path);

  NNFW_STATUS train_import_checkpoint(const char *path);

  NNFW_STATUS train_export_checkpoint(const char *path);


  NNFW_STATUS set_quantization_type(NNFW_QUANTIZE_TYPE qtype);

  NNFW_STATUS set_quantized_model_path(const char *path);

  NNFW_STATUS quantize();


  NNFW_STATUS set_codegen_model_path(const char *path);

  NNFW_STATUS codegen(const char *target, NNFW_CODEGEN_PREF pref);


  NNFW_STATUS set_prepare_config(const NNFW_PREPARE_CONFIG key, const char *value);

  NNFW_STATUS reset_prepare_config();

  NNFW_STATUS set_execute_config(const NNFW_RUN_CONFIG key, const char *value);

  NNFW_STATUS reset_execute_config();


private:

  const onert::ir::IGraph *primary_subgraph();

  uint32_t getInputSize();

  uint32_t getOutputSize();

  NNFW_STATUS loadModelFile(const std::string &model_file_path, const std::string &model_type);

  NNFW_STATUS getTensorIndexImpl(const onert::ir::IGraph &graph, const char *tensorname,

                                 uint32_t *index, bool is_input);

  void setLastErrorMessage(std::string message);


  bool isStateInitialized();

  bool isStateModelLoaded();

  bool isStatePrepared();

  bool isStateRunning();

  bool isStateFinishedRun();

  bool isStatePreparedOrFinishedRun();

  bool isStatePreparedTraining();

  bool isStateFinishedTraining();

  bool isStatePreparedOrFinishedTraining();


private:

  State _state{State::INITIALIZED};

  std::unique_ptr<onert::ir::NNPkg> _nnpkg;

  std::unique_ptr<onert::compiler::CompilerOptions> _coptions;

  std::unique_ptr<onert::compiler::CompilerArtifact> _compiler_artifact;

  std::unique_ptr<onert::exec::Execution> _execution;

  std::shared_ptr<onert::api::CustomKernelRegistry> _kernel_registry;

  std::unique_ptr<onert::ir::train::TrainingInfo> _train_info;

  std::unique_ptr<onert::odc::QuantizeManager> _quant_manager;

  std::unique_ptr<onert::odc::CodegenManager> _codegen_manager;

  AutoCompilationState _autoCompilationState = AutoCompilationState::INITIAL_STATE;

  // Remember path to loaded original model

  // It may be used for on-device compiler / on-device training.

  //

  // If necessary, we may replace _model_path to _model_origin like:

  //

  //   union _model_origin {

  //     const char *path;

  //     const uint8 *buf;

  //   }

  std::filesystem::path _model_path;

  std::unordered_map<onert::ir::SubgraphIndex, std::string> _signature_map;

  onert::ir::SubgraphIndex _selected_signature;

  std::string _last_error_message;

};


} // namespace onert::api


#endif // __API_NNFW_SESSION_H__

type
int32_t type
Definition BulkPipelineBuffer.cc:0

CodegenManager.h

CompilerOptions.h

CustomKernelRegistry.h

Execution.h
This file defines execution.

ICompiler.h
This file contains ICompiler class to define and run compilation phase.

NNPkg.h

QuantizeManager.h

TracingCtx.h

TrainingInfo.h

onert::util::Index< uint16_t, SubgraphIndexTag >

info
volatile const char info[]
Definition library_info.cc:17

backends
Definition backends.py:1

codegen
Definition codegen.py:1

onert::api
Definition CustomKernel.cc:20

nnfw.h
This file describes runtime API.

NNFW_LAYOUT
NNFW_LAYOUT
Data format of a tensor.
Definition nnfw.h:134

nnfw_custom_eval
void(* nnfw_custom_eval)(nnfw_custom_kernel_params *params, char *userdata, size_t userdata_size)
Definition nnfw_experimental.h:55

NNFW_CODEGEN_PREF
NNFW_CODEGEN_PREF
Preference for target-dependent code generation.
Definition nnfw_experimental.h:595

NNFW_QUANTIZE_TYPE
NNFW_QUANTIZE_TYPE
Convert between training mode and inference mode.
Definition nnfw_experimental.h:543

NNFW_RUN_CONFIG
NNFW_RUN_CONFIG
Configuration key for execution.
Definition nnfw_experimental.h:749

NNFW_PREPARE_CONFIG
NNFW_PREPARE_CONFIG
Configuration key for prepare (compile and schedule)
Definition nnfw_experimental.h:708

size
int32_t size[5]
Definition Slice.cpp:35

NNFW_STATUS
NNFW_STATUS
Result values returned from a call to an API function.
Definition onert-micro.h:86

NNFW_TYPE
NNFW_TYPE
Definition onert-micro.h:75

nnfw_tensorinfo
tensor info describes the type and shape of tensors
Definition onert-micro.h:124

nnfw_train_info
Training information to prepare training.
Definition onert-micro.h:187

onert::api::Session
Definition Session.h:42

onert::api::Session::reset_execute_config
NNFW_STATUS reset_execute_config()
Definition Session.cc:2367

onert::api::Session::get_last_error_message
NNFW_STATUS get_last_error_message(char *buffer, size_t length) const
Definition Session.cc:1131

onert::api::Session::set_codegen_model_path
NNFW_STATUS set_codegen_model_path(const char *path)
Definition Session.cc:2213

onert::api::Session::run_async
NNFW_STATUS run_async()
Definition Session.cc:507

onert::api::Session::train_prepare
NNFW_STATUS train_prepare()
Definition Session.cc:1719

onert::api::Session::set_output_type
NNFW_STATUS set_output_type(uint32_t index, NNFW_TYPE type)
Definition Session.cc:773

onert::api::Session::set_signature_run
NNFW_STATUS set_signature_run(const char *signature)
Definition Session.cc:1102

onert::api::Session::train_set_input
NNFW_STATUS train_set_input(uint32_t index, const void *input, const nnfw_tensorinfo *input_tensorinfo)
Definition Session.cc:1791

onert::api::Session::train_get_loss
NNFW_STATUS train_get_loss(uint32_t index, float *loss)
Definition Session.cc:1945

onert::api::Session::await
NNFW_STATUS await()
Definition Session.cc:522

onert::api::Session::train_export_checkpoint
NNFW_STATUS train_export_checkpoint(const char *path)
Definition Session.cc:2064

onert::api::Session::load_model_from_path
NNFW_STATUS load_model_from_path(const char *path)
Definition Session.cc:296

onert::api::Session::reset_prepare_config
NNFW_STATUS reset_prepare_config()
Definition Session.cc:2323

onert::api::Session::set_input_type
NNFW_STATUS set_input_type(uint32_t index, NNFW_TYPE type)
Definition Session.cc:729

onert::api::Session::train_set_output
NNFW_STATUS train_set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length)
Definition Session.cc:1883

onert::api::Session::set_backends_per_operation
NNFW_STATUS set_backends_per_operation(const char *backend_settings)
Set backends with string-encoded mapping from operation index to backend type (cpu,...
Definition Session.cc:1457

onert::api::Session::prepare
NNFW_STATUS prepare()
Definition Session.cc:446

onert::api::Session::set_input_layout
NNFW_STATUS set_input_layout(uint32_t index, NNFW_LAYOUT layout)
Definition Session.cc:642

onert::api::Session::train_get_traininfo
NNFW_STATUS train_get_traininfo(nnfw_train_info *info)
Definition Session.cc:1497

onert::api::Session::set_workspace
NNFW_STATUS set_workspace(const char *dir)
Definition Session.cc:1052

onert::api::Session::load_circle_from_buffer
NNFW_STATUS load_circle_from_buffer(uint8_t *buffer, size_t size)
Definition Session.cc:260

onert::api::Session::deprecated
NNFW_STATUS deprecated(const char *msg)
Definition Session.cc:1145

onert::api::Session::input_tensorindex
NNFW_STATUS input_tensorindex(const char *tensorname, uint32_t *index)
Definition Session.cc:1447

onert::api::Session::set_available_backends
NNFW_STATUS set_available_backends(const char *backends)
Definition Session.cc:1018

onert::api::Session::output_tensorindex
NNFW_STATUS output_tensorindex(const char *tensorname, uint32_t *index)
Definition Session.cc:1452

onert::api::Session::set_prepare_config
NNFW_STATUS set_prepare_config(const NNFW_PREPARE_CONFIG key, const char *value)
Definition Session.cc:2299

onert::api::Session::set_output
NNFW_STATUS set_output(uint32_t index, NNFW_TYPE type, void *buffer, size_t length)
Definition Session.cc:563

onert::api::Session::set_input
NNFW_STATUS set_input(uint32_t index, NNFW_TYPE type, const void *buffer, size_t length)
Definition Session.cc:537

onert::api::Session::input_size
NNFW_STATUS input_size(uint32_t *number)
Definition Session.cc:590

onert::api::Session::~Session
~Session()

onert::api::Session::set_config
NNFW_STATUS set_config(const char *key, const char *value)
Definition Session.cc:1151

onert::api::Session::train_export_circleplus
NNFW_STATUS train_export_circleplus(const char *path)
Definition Session.cc:2008

onert::api::Session::train_input_tensorinfo
NNFW_STATUS train_input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)
Definition Session.cc:1757

onert::api::Session::get_output
NNFW_STATUS get_output(uint32_t index, nnfw_tensorinfo *out_info, const void **out_buffer)
Definition Session.cc:963

onert::api::Session::train_set_traininfo
NNFW_STATUS train_set_traininfo(const nnfw_train_info *info)
Definition Session.cc:1615

onert::api::Session::train_run
NNFW_STATUS train_run(bool update_weights)
Definition Session.cc:1911

onert::api::Session::set_quantized_model_path
NNFW_STATUS set_quantized_model_path(const char *path)
Definition Session.cc:2163

onert::api::Session::set_quantization_type
NNFW_STATUS set_quantization_type(NNFW_QUANTIZE_TYPE qtype)
Definition Session.cc:2121

onert::api::Session::output_size
NNFW_STATUS output_size(uint32_t *number)
Definition Session.cc:616

onert::api::Session::run_with_auto_compilation
NNFW_STATUS run_with_auto_compilation(const char *target, NNFW_CODEGEN_PREF pref)
Definition Session.cc:2414

onert::api::Session::get_config
NNFW_STATUS get_config(const char *key, char *value, size_t value_size)
Definition Session.cc:1281

onert::api::Session::run
NNFW_STATUS run()
Definition Session.cc:479

onert::api::Session::register_custom_operation
NNFW_STATUS register_custom_operation(const std::string &id, nnfw_custom_eval eval_func)
Definition Session.cc:957

onert::api::Session::output_tensorinfo
NNFW_STATUS output_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)
Definition Session.cc:912

onert::api::Session::delete_odc_minmax_file
NNFW_STATUS delete_odc_minmax_file()
Definition Session.cc:2398

onert::api::Session::set_output_layout
NNFW_STATUS set_output_layout(uint32_t index, NNFW_LAYOUT layout)
Definition Session.cc:685

onert::api::Session::train_export_circle
NNFW_STATUS train_export_circle(const char *path)
Definition Session.cc:1979

onert::api::Session::quantize
NNFW_STATUS quantize()
Definition Session.cc:2185

onert::api::Session::train_set_expected
NNFW_STATUS train_set_expected(uint32_t index, const void *expected, const nnfw_tensorinfo *expected_tensorinfo)
Definition Session.cc:1834

onert::api::Session::train_import_checkpoint
NNFW_STATUS train_import_checkpoint(const char *path)
Definition Session.cc:2037

onert::api::Session::set_odc_param_minmax_records_count
NNFW_STATUS set_odc_param_minmax_records_count(int minmax_records_count)
Definition Session.cc:2382

onert::api::Session::create
static NNFW_STATUS create(Session **session)
Factory method. It creates and initialize Session.
Definition Session.cc:231

onert::api::Session::input_tensorinfo
NNFW_STATUS input_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)
Definition Session.cc:869

onert::api::Session::set_execute_config
NNFW_STATUS set_execute_config(const NNFW_RUN_CONFIG key, const char *value)
Definition Session.cc:2336

onert::api::Session::configure_signature
NNFW_STATUS configure_signature(const char *signature)
Definition Session.cc:1073

onert::api::Session::train_expected_tensorinfo
NNFW_STATUS train_expected_tensorinfo(uint32_t index, nnfw_tensorinfo *ti)
Definition Session.cc:1774

onert::api::Session::set_input_tensorinfo
NNFW_STATUS set_input_tensorinfo(uint32_t index, const nnfw_tensorinfo *ti)
Definition Session.cc:817

onert::ir::IGraph
Definition IGraph.h:27