Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

bert-base-multilingual-uncased

Brief Details: BERT multilingual base model supporting 102 languages, 168M parameters, uncased tokenization, ideal for masked language modeling and sequence tasks.

Fill-Mask

jonatasgrosman

wav2vec2-large-xlsr-53-russian

Brief Details: A fine-tuned XLSR-53 model for Russian speech recognition, achieving 13.3% WER on Common Voice, with 3.6M+ downloads and Apache 2.0 license.

Automatic Speech Recognition

google

vit-base-patch16-224

Brief-details: Vision Transformer model with 86.6M params for image classification, pre-trained on ImageNet-21k and fine-tuned on ImageNet-1k. Popular with 3.7M+ downloads.

Image Classification

facebook

wav2vec2-xls-r-300m

Brief-details: A powerful multilingual speech model with 300M parameters, supporting 126 languages. Pre-trained on 436K hours of audio data using wav2vec 2.0 architecture.

Transformers

emilyalsentzer

Bio_ClinicalBERT

BRIEF DETAILS: Clinical BERT model trained on MIMIC III healthcare data, combining BioBERT initialization with clinical note training for specialized medical NLP tasks.

Fill-Mask

Falconsai

nsfw_image_detection

Brief-details: A fine-tuned Vision Transformer (ViT) model with 85.8M parameters for NSFW image classification, achieving 98% accuracy using an 80k image dataset.

Image Classification

mattmdjaga

segformer_b2_clothes

Brief-details: A transformer-based semantic segmentation model fine-tuned for clothes and human parsing, offering 27.4M parameters with strong accuracy (80% mean) across 18 clothing categories.

Image Segmentation

papluca

xlm-roberta-base-language-detection

Brief-details: A powerful multilingual language detection model supporting 20 languages with 99.6% accuracy, based on XLM-RoBERTa, featuring 278M parameters.

Text Classification

sentence-transformers

multi-qa-MiniLM-L6-cos-v1

BRIEF DETAILS: Compact 22.7M parameter sentence embedding model optimized for semantic search, trained on 215M question-answer pairs with 384-dimensional output vectors.

Sentence Similarity

sentence-transformers

bert-base-nli-mean-tokens

BRIEF DETAILS: BERT-based sentence embedding model with 109M parameters. Maps sentences to 768D vectors. Deprecated due to low quality - newer alternatives recommended.

Sentence Similarity

stable-diffusion-v1-5

stable-diffusion-inpainting

Brief-details: A specialized latent diffusion model for image inpainting, based on Stable Diffusion v1.5. Enables high-quality image editing and completion with text prompts.

Text-to-Image

laion

CLIP-ViT-B-16-laion2B-s34B-b88K

Brief-details: CLIP ViT-B/16 model trained on LAION-2B dataset, achieving 70.2% ImageNet accuracy. Specialized in zero-shot image classification and retrieval.

Zero-Shot Image Classification

stable-diffusion-v1-5

Brief Details: Popular text-to-image model trained on LAION-2B dataset. Features 595k training steps at 512x512 resolution with improved classifier-free guidance sampling.

Text-to-Image

adsabs

astroBERT

Brief Details: astroBERT is a 110M-parameter BERT-based language model specialized for astrophysics research, featuring masked language modeling and named entity recognition capabilities.

Fill-Mask

facebook

fasttext-language-identification

Brief-details: FastText language identification model by Facebook, capable of detecting 217 languages with efficient word representation learning and quick CPU-based processing

Text Classification

cardiffnlp

twitter-roberta-base-sentiment-latest

Brief Details: A RoBERTa-based sentiment analysis model trained on 124M tweets (2018-2021), offering 3-class classification with high accuracy and Twitter-specific preprocessing.

Text Classification

microsoft

deberta-v3-large

Brief-details: Advanced NLP model from Microsoft with 304M parameters, achieving SOTA on NLU tasks. Features disentangled attention and enhanced mask decoder.

Fill-Mask

distributed

optimized-gpt2-1b

Brief Details: A 1.01B parameter GPT-2 variant optimized for efficient text generation, featuring F32 tensor type and custom optimizations for improved performance.

Text Generation

microsoft

deberta-base

Brief-details: Microsoft's DeBERTa base model featuring disentangled attention mechanism, achieving SOTA results on NLU tasks with 88.8% MNLI-m accuracy.

Fill-Mask

facebook

bart-large-cnn

BRIEF DETAILS: BART-large-CNN: 406M parameter transformer-based summarization model fine-tuned on CNN Daily Mail dataset. Achieves ROUGE-1: 42.95, ROUGE-2: 20.81.

Summarization