GitHub - ankitrajsh/Hardware-Aware-Transformers: For internal training and testing

Overview

We release the PyTorch code and 50 pre-trained models for HAT: Hardware-Aware Transformers. Within a Transformer supernet (SuperTransformer), we efficiently search for a specialized fast model (SubTransformer) for each hardware with latency feedback. The search cost is reduced by over 10000×.

HAT Framework overview:

HAT models achieve up to 3× speedup and 3.7× smaller model size with no performance loss.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
assets		assets
configs		configs
fairseq		fairseq
latency_dataset		latency_dataset
README.md		README.md
average_checkpoints.py		average_checkpoints.py
download_model.py		download_model.py
evo_search.py		evo_search.py
generate.py		generate.py
latency_dataset.py		latency_dataset.py
latency_predictor.py		latency_predictor.py
preprocess.py		preprocess.py
score.py		score.py
setup.py		setup.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Overview

About

Uh oh!

Releases

Packages

Uh oh!

Languages

ankitrajsh/Hardware-Aware-Transformers

Folders and files

Latest commit

History

Repository files navigation

Overview

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages