Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

AbsoluteReality_v1.8.1

Brief Details: A powerful text-to-image model with 142k+ downloads, specialized in photorealistic generation with strong performance in portraits and detailed scenes.

Text-to-Image

audeering

wav2vec2-large-robust-12-ft-emotion-msp-dim

Brief-details: A speech emotion recognition model based on Wav2vec 2.0, fine-tuned on MSP-Podcast dataset. 165M parameters, predicts arousal, dominance, and valence from audio.

Audio Classification

dangvantuan

sentence-camembert-large

Brief Details: French sentence embedding model based on CamemBERT-Large (337M params), achieving 85.9% Pearson correlation on STS benchmark. Optimized for semantic similarity.

Sentence Similarity

neuralmagic

Llama-3.2-11B-Vision-Instruct-FP8-dynamic

Brief Details: Optimized 11B parameter vision-language model using FP8 quantization, supporting 8 languages with 50% reduced memory footprint for efficient deployment

Text Generation

bhadresh-savani

distilbert-base-uncased-emotion

Brief-details: A lightweight emotion classification model based on DistilBERT, offering 93.8% accuracy for detecting 6 emotions while being 40% smaller than BERT

Text Classification

microsoft

trocr-small-printed

Brief Details: TrOCR small-printed: 61.4M parameter OCR model for printed text recognition. Uses transformer-based vision encoder-decoder architecture.

Image-to-Text

prajjwal1

bert-mini

Brief-details: Compact BERT variant (4 layers, 256 hidden) optimized for efficient pre-training and NLI tasks. MIT licensed with 145K+ downloads.

Transformers

tiiuae

falcon-40b

Brief Details: A powerful 40B parameter LLM trained on 1,000B tokens, optimized for inference with FlashAttention and multiquery architecture under Apache 2.0 license.

Text Generation

timm

inception_resnet_v2.tf_in1k

Brief Details: Inception-ResNet-v2 model with 55.9M params, optimized for ImageNet classification. Features hybrid architecture combining Inception modules with residual connections.

Image Classification

HooshvareLab

bert-fa-base-uncased-ner-peyma

Brief Details: Persian NER model based on BERT architecture, specialized in recognizing 7 entity types with 93.40% F1 score on PEYMA dataset. Apache 2.0 licensed.

Token Classification

microsoft

DialoGPT-large

Brief Details: DialoGPT-large - Microsoft's state-of-the-art conversational AI model trained on 147M Reddit dialogues, offering human-like response generation capabilities.

Text Generation

fixie-ai

ultravox-v0_3

Brief Details: Ultravox v0.3 is an 8.06B parameter multimodal Speech LLM combining Llama3.1-8B-Instruct and Whisper-small for speech/text processing with MIT license.

Feature Extraction

Yehor

w2v-xls-r-uk

BRIEF DETAILS: Ukrainian speech recognition model based on wav2vec2-xls-r-300m with 315M parameters, achieving 4.63% WER on Common Voice 10.0 test set.

Automatic Speech Recognition

cambridgeltl

SapBERT-from-PubMedBERT-fulltext-mean-token

Brief Details: SapBERT model for biomedical entity representations, trained on UMLS with PubMedBERT base. 109M params, optimized for medical entity linking.

Feature Extraction

google

pegasus-xsum

Brief Details: PEGASUS-XSUM is a powerful abstractive summarization model by Google, achieving 46.86 ROUGE-1 scores on XSUM dataset with strong performance across multiple domains.

Summarization

timm

mobilenetv3_large_100.miil_in21k_ft_in1k

Brief Details: MobileNetV3-Large model pretrained on ImageNet-21k-P and fine-tuned on ImageNet-1k. Efficient architecture with 5.51M parameters optimized for mobile devices.

Image Classification

Qwen

Qwen2-1.5B-Instruct

Brief Details: Qwen2-1.5B-Instruct is a 1.54B parameter instruction-tuned language model with impressive performance in reasoning, coding, and multilingual tasks.

Text Generation

Qwen

Qwen1.5-7B

Brief-details: Qwen1.5-7B is a powerful 7.72B parameter transformer-based language model with 32K context length support, offering improved multilingual capabilities and enhanced performance.

Text Generation

OpenGVLab

InternVL2-Llama3-76B

Brief-details: 76B parameter multimodal LLM combining InternViT vision and Llama3 language models, offering strong performance in image, video understanding and grounding tasks.

Image-Text-to-Text

stablediffusionapi

realistic-vision-51

Brief-details: A powerful text-to-image model focused on ultra-realistic image generation, particularly excelling in portrait creation with over 151K downloads and optimized for photorealistic outputs.

Text-to-Image

solidrust

Mistral-7B-Instruct-v0.3-AWQ

Brief-details: Mistral-7B-Instruct-v0.3-AWQ is a 4-bit quantized version of Mistral-7B-Instruct, optimized for efficient inference while maintaining performance using AWQ technology.

Text Generation

AbsoluteReality_v1.8.1

wav2vec2-large-robust-12-ft-emotion-msp-dim

sentence-camembert-large

Llama-3.2-11B-Vision-Instruct-FP8-dynamic

distilbert-base-uncased-emotion

trocr-small-printed

bert-mini

falcon-40b

inception_resnet_v2.tf_in1k

bert-fa-base-uncased-ner-peyma

DialoGPT-large

ultravox-v0_3

w2v-xls-r-uk

SapBERT-from-PubMedBERT-fulltext-mean-token

pegasus-xsum

mobilenetv3_large_100.miil_in21k_ft_in1k

Qwen2-1.5B-Instruct

Qwen1.5-7B

InternVL2-Llama3-76B

realistic-vision-51

Mistral-7B-Instruct-v0.3-AWQ

The first platform built for prompt engineering