DeInfer: Efficient Parallel Inferencing for Decomposed Large Language Models

Infos: arXiv, DAC, ACM Digital Library (To be published)

Code is under prepration and plan to release around end of May 2026.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
LICENSE		LICENSE
README.md		README.md

Provide feedback