Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

Llama-3.2-1B-Instruct-q4f32_1-MLC

Brief-details: Compact 1B parameter Llama model optimized for web deployment using MLC format, supporting chat and REST API functionality with q4f32_1 quantization.

MLC-LLM

lambdalabs

miniSD-diffusers

Brief-details: A compact Stable Diffusion model fine-tuned on LAION Improved Aesthetics dataset, optimized for efficient text-to-image generation at 256x256 resolution

Text-to-Image

colorfulscoop

sbert-base-ja

Brief Details: Japanese Sentence BERT model trained on JSNLI dataset, optimized for sentence similarity tasks with 523K training samples achieving 85.29% accuracy.

Sentence Similarity

Rakib

roberta-base-on-cuad

Brief-details: RoBERTa-based model fine-tuned for legal contract analysis and question answering, optimized for the CUAD dataset with improved AUPR score of 46.6%

Question Answering

google

electra-base-generator

BRIEF DETAILS: ELECTRA base generator model by Google - A self-supervised language model trained as a discriminator, optimized for efficient pre-training on limited compute resources.

Fill-Mask

deepseek-ai

deepseek-moe-16b-base

Brief Details: DeepSeek MoE 16B Base - A powerful 16.4B parameter Mixture-of-Experts language model supporting commercial use, optimized for text generation tasks.

Text Generation

HuggingFaceTB

SmolLM-360M

Brief Details: SmolLM-360M is a 362M parameter language model optimized for efficiency, trained on high-quality educational content with state-of-the-art performance for its size class

Text Generation

baffo32

decapoda-research-llama-7B-hf

Brief Details: LLaMA-7B HuggingFace port - 7B parameter transformer-based LLM from Meta AI. Research-focused with strong reasoning capabilities across multiple languages.

Text Generation

ai21labs

Jamba-v0.1

Brief Details: Jamba-v0.1: A 51.6B parameter hybrid SSM-Transformer LLM with 256K context length, combining Mamba architecture with MoE for enhanced throughput.

Text Generation

laion

CLIP-ViT-g-14-laion2B-s34B-b88K

Brief-details: A powerful CLIP vision-language model trained on LAION-2B dataset, achieving 78.4% ImageNet accuracy. Excels at zero-shot classification and image-text tasks.

Zero-Shot Image Classification

lytang

MiniCheck-RoBERTa-Large

Brief-details: RoBERTa-Large-based fact-checking model that determines if claims are supported by reference documents, achieving high accuracy on LLM-AggreFact benchmark.

Text Classification

Qwen

Qwen2.5-72B

BRIEF DETAILS: Qwen2.5-72B is a powerful 72.7B parameter language model with 128K token context length, supporting 29+ languages and optimized for diverse tasks including coding and mathematics.

Text Generation

intfloat

e5-base

Brief-details: E5-base is a 109M parameter text embedding model optimized for semantic similarity tasks, featuring 12 layers and 768d embeddings with MTEB benchmarks.

Sentence Similarity

facebook

wmt19-en-de

BRIEF-DETAILS: Facebook's English-to-German translation model using FSMT architecture. Achieves 42.83 BLEU score. Popular choice with 19.5k+ downloads.

Translation

facebook

mms-tts-eng

BRIEF DETAILS: English Text-to-Speech model (36.3M params) from Facebook's MMS project using VITS architecture. Features non-deterministic speech generation with stochastic duration prediction.

Text-to-Speech

liuhaotian

llava-v1.6-vicuna-13b

Brief Details: LLaVA v1.6 Vicuna (13B params) - Advanced multimodal vision-language model for research, combining image understanding with text generation capabilities.

Image-Text-to-Text

01-ai

Yi-1.5-9B

Brief Details: Yi-1.5-9B is a powerful 8.83B parameter language model trained on 3.6T tokens, offering strong performance in coding, math, and reasoning tasks.

Text Generation

TencentARC

PhotoMaker-V2

Brief Details: PhotoMaker-V2 is an advanced text-to-image model specializing in customized photo generation from reference face images, built by TencentARC with SDXL compatibility.

Text-to-Image

mucai

vip-llava-7b

Brief Details: Cutting-edge multimodal chatbot leveraging LLaMA/Vicuna with region-level visual understanding, trained on 1.7M+ data points

Text Generation

BM-K

KoSimCSE-roberta

Brief-details: Korean RoBERTa-based sentence embedding model optimized for semantic similarity tasks, achieving 83.65% avg performance on STS benchmarks. 111M params.

Feature Extraction

MaziyarPanahi

calme-3.3-baguette-3b-GGUF

Brief-details: A 3.09B parameter GGUF-formatted language model optimized for text generation with multiple quantization options (2-8 bit), based on Mistral architecture

Text Generation

Llama-3.2-1B-Instruct-q4f32_1-MLC

miniSD-diffusers

sbert-base-ja

roberta-base-on-cuad

electra-base-generator

deepseek-moe-16b-base

SmolLM-360M

decapoda-research-llama-7B-hf

Jamba-v0.1

CLIP-ViT-g-14-laion2B-s34B-b88K

MiniCheck-RoBERTa-Large

Qwen2.5-72B

e5-base

wmt19-en-de

mms-tts-eng

llava-v1.6-vicuna-13b

Yi-1.5-9B

PhotoMaker-V2

vip-llava-7b

KoSimCSE-roberta

calme-3.3-baguette-3b-GGUF

The first platform built for prompt engineering