Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

CodeLlama-34B-GGUF

BRIEF DETAILS: 34B parameter code generation model optimized for GGUF format, offering multiple quantization options from 2-bit to 8-bit with GPU acceleration support.

Text Generation

cointegrated

rubert-base-cased-nli-threeway

Brief Details: Russian BERT model fine-tuned for natural language inference, supporting 3-way classification (entailment/contradiction/neutral), 178M params

Zero-Shot Classification

google

tapas-large-finetuned-wtq

Brief-details: TAPAS large model (337M params) fine-tuned for table question answering, achieving 50.97% accuracy on WTQ dataset. Built by Google for numerical reasoning.

Table Question Answering

google

mobilebert-uncased

BRIEF DETAILS: MobileBERT: A compact, resource-efficient BERT variant designed for mobile devices. Features 24-layer architecture with optimized 128-dim hidden states and 4-head attention.

Transformers

microsoft

Phi-3-vision-128k-instruct

Brief Details: Microsoft's 4.15B parameter multimodal model combining vision and text capabilities with 128K context length, optimized for efficient commercial and research applications.

Text Generation

TheBloke

Mistral-7B-Instruct-v0.2-GGUF

Brief-details: A powerful 7B parameter instruction-tuned LLM with multiple GGUF quantizations, optimized for efficient CPU/GPU inference, based on Mistral AI's architecture

Text Generation

fal-collab-models

dreamshaper-xl-1-0

Brief-details: A powerful Text-to-Image diffusion model with extensive downloads (150K+), built on StableDiffusionXL pipeline architecture for high-quality image generation

Text-to-Image

microsoft

deberta-xlarge-mnli

Brief-details: DeBERTa XLarge MNLI model (750M params) - Microsoft's enhanced BERT variant with disentangled attention, fine-tuned for natural language inference tasks.

Text Classification

timm

convnext_xxlarge.clip_laion2b_soup_ft_in1k

BRIEF-DETAILS: Large-scale ConvNeXt model (846M params) pretrained on LAION-2B dataset, fine-tuned on ImageNet-1k. Achieves 88.6% top-1 accuracy with efficient processing.

Image Classification

EleutherAI

pythia-70m

Brief Details: A 70M parameter language model from EleutherAI's Pythia suite, designed for research and interpretability studies. Built on GPT-NeoX architecture.

PyTorch

TheBloke

Mistral-7B-Instruct-v0.1-GGUF

Brief-details: An efficient 7B parameter instruction-tuned LLM using GGUF format, offering multiple quantization options for CPU/GPU inference with a context length of 4096.

Text Generation

nvidia

bigvgan_v2_22khz_80band_256x

Brief Details: A universal neural vocoder for high-quality audio generation, supporting 22kHz sampling rate with 80 mel bands and 256x upsampling, built by NVIDIA.

Audio-to-Audio

eenzeenee

t5-base-korean-summarization

Brief Details: T5-based Korean text summarization model with 276M params, trained on academic papers, books & reports. Strong ROUGE-2 precision scores >90%.

Summarization

microsoft

wavlm-base-plus-sv

Brief-details: WavLM base model optimized for speaker verification, trained on 94k hours of speech data with utterance mixing and gated relative position bias.

Transformers

LanguageBind

LanguageBind_Image

Brief-details: LanguageBind_Image is a multimodal AI model that enables zero-shot image classification by aligning visual content with language descriptions through semantic binding.

Zero-Shot Image Classification

distilbert

distilbert-base-uncased-distilled-squad

Brief-details: A compact Question Answering model with 66.4M parameters, achieving 86.9 F1 score on SQuAD v1.1. Distilled version of BERT that's 40% smaller and 60% faster.

Question Answering

facebook

mms-1b-all

Brief-details: Massively multilingual ASR model with 965M parameters supporting 1162 languages, based on Wav2Vec2 architecture with adapter models for transcription.

Automatic Speech Recognition

Orenguteng

Llama-3.1-8B-Lexi-Uncensored-V2-GGUF

Brief Details: Uncensored 8B parameter LLaMA 3.1-based model optimized for compliance and text generation, with strong IFEval performance at 77.92% accuracy

GGUF

dicta-il

dictalm2.0-instruct

Brief Details: DictaLM 2.0 Instruct: A 7.25B parameter bilingual (Hebrew-English) instruction-tuned LLM based on Mistral, optimized for conversation

Text Generation

neuralmagic

Meta-Llama-3.1-8B-Instruct-FP8

Brief-details: 8B parameter FP8-quantized LLaMA 3.1 model optimized for efficient inference, supporting 8 languages with 99.52% performance retention

Text Generation

flair

ner-english-ontonotes-large

Brief-details: Large-scale English Named Entity Recognition model based on FLERT architecture, achieving 90.93% F1-score on Ontonotes with 18 entity classes

Token Classification

CodeLlama-34B-GGUF

rubert-base-cased-nli-threeway

tapas-large-finetuned-wtq

mobilebert-uncased

Phi-3-vision-128k-instruct

Mistral-7B-Instruct-v0.2-GGUF

dreamshaper-xl-1-0

deberta-xlarge-mnli

convnext_xxlarge.clip_laion2b_soup_ft_in1k

pythia-70m

Mistral-7B-Instruct-v0.1-GGUF

bigvgan_v2_22khz_80band_256x

t5-base-korean-summarization

wavlm-base-plus-sv

LanguageBind_Image

distilbert-base-uncased-distilled-squad

mms-1b-all

Llama-3.1-8B-Lexi-Uncensored-V2-GGUF

dictalm2.0-instruct

Meta-Llama-3.1-8B-Instruct-FP8

ner-english-ontonotes-large

The first platform built for prompt engineering