Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

chronos-t5-small

BRIEF DETAILS: Chronos-T5-Small: A 46M parameter time series forecasting model based on T5 architecture. Enables probabilistic forecasts through token-based sequence modeling.

Time Series Forecasting

google-bert

bert-base-multilingual-cased

BRIEF DETAILS: BERT multilingual model supporting 104 languages with 179M parameters. Pre-trained on Wikipedia data using masked language modeling. Apache 2.0 licensed.

Fill-Mask

allenai

longformer-base-4096

Brief-details: A BERT-like transformer model optimized for long documents up to 4,096 tokens, featuring sliding window attention and global attention mechanisms.

Transformers

facebook

opt-125m

Brief Details: OPT-125M is Meta AI's smallest open-source GPT-style language model with 125M parameters, designed for text generation and research accessibility.

Text Generation

sentence-transformers

paraphrase-MiniLM-L6-v2

Brief-details: Efficient sentence embedding model with 22.7M params, maps text to 384D vectors. Popular choice with 5.9M+ downloads. Apache 2.0 licensed.

Sentence Similarity

albert

albert-base-v2

Brief Details: ALBERT Base v2 - Lightweight BERT variant with 11.8M params, sharing layer weights. Trained on BookCorpus & Wikipedia for MLM tasks.

Fill-Mask

google-t5

t5-small

Brief-details: T5-small is a compact 60M parameter text-to-text transformer model that can handle multiple NLP tasks like translation, summarization and QA through a unified text-based approach.

Translation

sentence-transformers

all-MiniLM-L12-v2

Brief Details: Efficient sentence embedding model with 33.4M params, trained on 1B+ sentence pairs. Maps text to 384D vectors for similarity tasks.

Sentence Similarity

google-bert

bert-base-cased

Brief Details: BERT base cased model (109M params) - Pretrained transformer for masked language modeling and next sentence prediction on English text.

Fill-Mask

facebook

dinov2-base

Brief-details: DINOv2 base model - Self-supervised Vision Transformer for robust visual feature extraction. 86.6M params, Apache 2.0 licensed.

Image Feature Extraction

google

electra-base-discriminator

Brief-details: ELECTRA base discriminator model from Google - pre-trained transformer that learns by detecting real vs fake tokens, with 9.2M+ downloads and Apache 2.0 license

Transformers

princeton-nlp

sup-simcse-roberta-large

Brief-details: Supervised SimCSE model built on RoBERTa-large, specialized in sentence embeddings and feature extraction. Trained on MNLI/SNLI datasets for enhanced semantic similarity tasks.

Feature Extraction

distilbert

distilbert-base-uncased-finetuned-sst-2-english

Brief-details: DistilBERT model fine-tuned on SST-2 dataset for sentiment classification, achieving 91% accuracy. Lightweight with 67M parameters, ideal for production deployment.

Text Classification

bartowski

Meta-Llama-3.1-8B-Instruct-GGUF

BRIEF-DETAILS: 8B parameter LLaMA 3.1 model optimized for instruction-following, available in multiple GGUF quantizations for efficient deployment on various hardware configurations.

Text Generation

FacebookAI

xlm-roberta-base

Brief-details: XLM-RoBERTa base model: Multilingual transformer with 279M parameters, trained on 2.5TB CommonCrawl data covering 94 languages. Specializes in masked language modeling and cross-lingual tasks.

Fill-Mask

sentence-transformers

paraphrase-multilingual-MiniLM-L12-v2

Brief Details: Multilingual sentence embedding model supporting 50+ languages, maps text to 384D vectors, 118M parameters, ideal for semantic search & clustering.

Sentence Similarity

openai

whisper-small

Brief-details: Whisper-small is a 244M parameter speech recognition model trained on 680k hours of data, supporting 99 languages with strong transcription and translation capabilities.

Automatic Speech Recognition

M-CLIP

XLM-Roberta-Large-Vit-B-32

Brief-details: Multilingual CLIP model extending OpenAI's vision-language capabilities to 48 languages, using XLM-RoBERTa architecture with ViT-B/32 visual backbone. Popular with 12M+ downloads.

Transformers

bigscience

bloomz-560m

Brief-details: A 560M parameter multilingual language model fine-tuned on xP3 dataset, capable of following instructions in 46 languages with strong zero-shot learning abilities.

Text Generation

timm

resnet50.a1_in1k

Brief-details: ResNet-50 A1 model with 25.6M params, trained on ImageNet-1k using LAMB optimizer and cosine LR schedule. Achieves 81.22% top-1 accuracy.

Image Classification

openai-community

gpt2

Brief-details: GPT-2 (124M params) - OpenAI's transformer-based language model for text generation. Popular base model with 17M+ downloads. MIT licensed.

Text Generation

chronos-t5-small

bert-base-multilingual-cased

longformer-base-4096

opt-125m

paraphrase-MiniLM-L6-v2

albert-base-v2

t5-small

all-MiniLM-L12-v2

bert-base-cased

dinov2-base

electra-base-discriminator

sup-simcse-roberta-large

distilbert-base-uncased-finetuned-sst-2-english

Meta-Llama-3.1-8B-Instruct-GGUF

xlm-roberta-base

paraphrase-multilingual-MiniLM-L12-v2

whisper-small

XLM-Roberta-Large-Vit-B-32

bloomz-560m

resnet50.a1_in1k

gpt2

The first platform built for prompt engineering