模板类 Int8Calibrator¶

继承关系¶

template<typename Algorithm, typename DataLoaderUniquePtr> class Int8Calibrator : private Algorithm ¶

基于指定的 TensorRT 校准算法和 LibTorch DataLoader 的通用 Int8Calibrator 实现。

模板参数

Algorithm – 类 nvinfer1::IInt8Calibrator（默认：nvinfer1::IInt8EntropyCalibrator2）- 要使用的算法
DataLoaderUniquePtr – std::unique_ptr<torch::data::DataLoader> - DataLoader 类型

公共函数

inline Int8Calibrator(DataLoaderUniquePtr dataloader, const std::string &cache_file_path, bool use_cache)¶

构造一个新的 Int8Calibrator 对象。

使用提供的 DataLoader 构造一个可用于 Torch-TensorRT 进行 PTQ 的校准器

参数

dataloader – std::unqiue_ptr<torch::data::DataLoader> - 指向 DataLoader 的唯一指针，应为 make_data_loader 工厂返回的值
cache_file_path – const std::string& - 存储/查找校准缓存的路径
use_cache – : bool - 是否使用缓存（如果存在）

inline int getBatchSize() const noexcept override¶

获取下一批次的批次大小（由于 TRT 和显式批次的问题，始终为 1）

inline bool getBatch(void *bindings[], const char *names[], int nbBindings) noexcept override¶

获取下一批次数据。

参数

返回值

true - 校准器有新的批次数据可消耗

返回值

false - 校准器没有新的批次数据可消耗

inline const void *readCalibrationCache(size_t &length) noexcept override¶

读取校准缓存。

如何从校准缓存中读取，仅在使用 use_cache 设置时启用

inline void writeCalibrationCache(const void *cache, size_t length) noexcept override¶

写入校准缓存。

将 TensorRT 提供的校准缓存写入指定文件

参数

inline operator nvinfer1::IInt8Calibrator*()¶

转换为 nvinfer1::IInt8Calibrator* 的操作符

方便的函数，转换为 IInt8Calibrator*，以便轻松分配给 CompileSpec 中的 ptq_calibrator 字段