quantization

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、reg…

Updated Oct 6, 2021
Python

quic / aimet

Star

AIMET is a library that provides advanced quantization and compression techniques for trained neural network models.

open-source machine-learning opensource deep-neural-networks compression deep-learning pruning quantization auto-ml network-quantization network-compression

Updated Apr 7, 2023
Python

neuralmagic / deepsparse

Star

Inference runtime offering GPU-class performance on CPUs and APIs to integrate ML into your application

Updated Apr 7, 2023
Python

tensorflow / model-optimization

Star

A toolkit to optimize ML models for deployment for Keras and TensorFlow, including quantization and pruning.

machine-learning sparsity compression deep-learning tensorflow optimization keras ml pruning quantization model-compression quantized-training quantized-neural-networks quantized-networks

Updated Apr 6, 2023
Python

PaddlePaddle / PaddleSlim

Star

PaddleSlim is an open-source library for deep model compression and architecture search.

sparsity compression detection transformer segmentation pruning quantization nas bert tensorrt distillation ernie yolov5 yolov6 yolov7

Updated Apr 6, 2023
Python

openvinotoolkit / training_extensions

Star

Train, Evaluate, Optimize, Deploy Computer Vision Models via OpenVINO™

machine-learning computer-vision deep-learning pytorch semi-supervised-learning image-classification object-detection transfer-learning image-segmentation quantization action-recognition automl incremental-learning anomaly-detection hyper-parameter-optimization self-supervised-learning openvino neural-networks-compression datumaro

Updated Apr 8, 2023
Python

huggingface / optimum

Star

🚀 Accelerate training and inference of 🤗 Transformers and 🤗 Diffusers with easy to use hardware optimization tools

training optimization intel transformers inference pytorch quantization onnx tflite onnxruntime graphcore habana

Updated Apr 8, 2023
Python

intel / neural-compressor

Star

Intel® Neural Compressor (formerly known as Intel® Low Precision Optimization Tool), targeting to provide unified APIs for network compression technologies, such as low precision quantization, sparsity, pruning, knowledge distillation, across different deep learning frameworks to pursue optimal inference performance.

sparsity deep-learning pruning quantization knowledge-distillation auto-tuning low-precision quantization-aware-training post-training-quantization

Updated Apr 7, 2023
Python

htqin / awesome-model-quantization

Star

A list of papers, docs, codes about model quantization. This repo is aimed to provide the info for model quantization research, we are continuously improving the project. Welcome to PR the works (papers, repositories) that are missed by the repo.

awesome deep-learning quantization binarization model-compression model-acceleration binary-network binarized-neural-networks lightweight-neural-network model-quantization efficient-deep-learning

Updated Apr 6, 2023

guillaumekln / faster-whisper

Star

Faster Whisper transcription with CTranslate2

deep-learning inference transformer speech-recognition openai speech-to-text quantization whisper

Updated Apr 8, 2023
Python

Xilinx / brevitas

Star

Brevitas: quantization-aware training in PyTorch

text-to-speech fpga pytorch speech-recognition neural-networks image-classification xilinx quantization hardware-acceleration brevitas

Updated Apr 6, 2023
Python

openppl-public / ppq

Star

PPL Quantization Tool (PPQ) is a powerful offline neural network quantization tool.

open-source caffe deep-learning neural-network cuda pytorch quantization onnx

Updated Apr 6, 2023
Python

guan-yuan / awesome-AutoML-and-Lightweight-Models

Star

A list of high-quality (newest) AutoML works and lightweight models including 1.) Neural Architecture Search, 2.) Lightweight Structures, 3.) Model Compression, Quantization and Acceleration, 4.) Hyperparameter Optimization, 5.) Automated Feature Engineering.

tensorflow pytorch hyperparameter-optimization awesome-list quantization nas automl model-compression neural-architecture-search meta-learning architecture-search quantized-training model-acceleration automated-feature-engineering quantized-neural-network

Updated Jun 19, 2021

Improve this page

Add a description, image, and links to the quantization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the quantization topic, visit your repo's landing page and select "manage topics."

Learn more

quantization

Here are 405 public repositories matching this topic...

nebuly-ai / nebullvm

kornelski / pngquant

IntelLabs / distiller

ymcui / Chinese-LLaMA-Alpaca

IntelLabs / nlp-architect

huawei-noah / Pretrained-Language-Model

aaron-xichen / pytorch-playground

666DZY666 / micronet

quic / aimet

neuralmagic / deepsparse

tensorflow / model-optimization

PaddlePaddle / PaddleSlim

openvinotoolkit / training_extensions

huggingface / optimum

intel / neural-compressor

htqin / awesome-model-quantization

guillaumekln / faster-whisper

Xilinx / brevitas

openppl-public / ppq

guan-yuan / awesome-AutoML-and-Lightweight-Models

Improve this page

Add this topic to your repo