Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

vit_large_patch14_clip_224.openai_ft_in12k_in1k

Brief Details: Large Vision Transformer (ViT) with 304M params, CLIP-pretrained on WIT-400M, fine-tuned on ImageNet-12k & ImageNet-1k. Excellent for image classification.

Image Classification

carlosdanielhernandezmena

wav2vec2-large-xlsr-53-faroese-100h

Brief-details: Faroese speech recognition model achieving 7.6% WER on test data, fine-tuned from wav2vec2-large-xlsr-53 using 100 hours of Faroese audio data.

Automatic Speech Recognition

helinivan

multilingual-sarcasm-detector

Brief-details: Multilingual BERT-based sarcasm detector for news headlines in English, Dutch, and Italian. Achieves 87.23% F1 score with strong cross-language performance.

Text Classification

nguyenvulebinh

wav2vec2-large-vi

Brief-details: Large-scale Vietnamese speech model (317M params) trained on 13k hours of YouTube audio for self-supervised learning using wav2vec2 architecture.

Transformers

thu-coai

roberta-base-cold

Brief Details: A Chinese offensive language detection model based on RoBERTa, achieving 82.75% accuracy. Fine-tuned on COLDataset with 102M parameters for text classification.

Text Classification

Mingguksky

PyTorch-StudioGAN

BRIEF-DETAILS: PyTorch-based GAN library offering comprehensive implementations of conditional/unconditional image generation models with benchmarking capabilities and extensive documentation.

Text Generation

bigscience

mt0-xxl-mt

Brief-details: A powerful 13.9B parameter multilingual text-to-text model capable of following instructions in 101 languages, fine-tuned on xP3mt dataset.

Text2Text Generation

consciousAI

question-answering-generative-t5-v1-base-s-q-c

T5-based generative Q&A model with 248M parameters, achieving 0.8022 RougeL score. Fine-tuned for question answering with strong context comprehension capabilities.

Text2Text Generation

kehanlu

mandarin-wav2vec2-aishell1

Brief Details: Mandarin speech recognition model using wav2vec2.0, fine-tuned on AISHELL-1 dataset achieving 5.13% CER on test set. Pre-trained on 1000h AISHELL-2.

Automatic Speech Recognition

bigscience

mt0-large

Brief-details: A multilingual text-to-text model with 1.23B parameters, trained on xP3 dataset, supporting 101 languages and optimized for instruction following.

Text2Text Generation

google

switch-base-8

Brief-details: Switch Transformer Base-8 is a Mixture of Experts model with 8 experts, trained on MLM tasks. Offers 4x speedup over T5-XXL with efficient sparsity approach.

Text2Text Generation

padmalcom

tts-tacotron2-german

Brief Details: German Text-to-Speech Tacotron2 model trained for 39 epochs, supporting natural German speech synthesis using SpeechBrain framework

Text-to-Speech

IDEA-CCNL

Randeng-DELLA-CVAE-226M-NER-Chinese

Brief Details: A 226M parameter Chinese CVAE model for controlled text generation, specialized in NER tasks. Built on GPT-2 architecture, generates contextual sentences containing specified named entities.

Text Generation

mrm8488

bert-tiny-finetuned-enron-spam-detection

Brief-details: A lightweight BERT-Tiny model fine-tuned for spam detection, achieving 98.6% accuracy with only 4.39M parameters. Excellent for email filtering.

Text Classification

google

maxim-s2-enhancement-lol

Brief-details: MAXIM is a pre-trained image enhancement model using multi-axis MLP architecture, specialized for low-light image processing with PSNR of 23.43 and SSIM of 0.863.

Image-to-Image

Vsevolod

company-names-similarity-sentence-transformer

Brief-details: Sentence transformer model optimized for company name similarity matching, maps text to 384-dimensional vectors, built on BERT architecture

Sentence Similarity

Twitter

twhin-bert-large

Brief Details: A large-scale multilingual BERT model trained on 7B tweets across 89 languages, leveraging social engagement data for enhanced tweet representations.

Fill-Mask

marcop

musika_ae

Brief-details: Musika_ae is a hierarchical autoencoder for music generation, capable of 4096x compression of 44.1kHz audio, trained on SXSW and VCTK datasets with MIT license.

Keras

google

maxim-s3-deblurring-reds

Brief-details: MAXIM pre-trained model for image deblurring tasks achieving PSNR of 28.93. Uses MLP-based architecture for high-quality blur removal from images. Apache 2.0 licensed.

Image-to-Image

knkarthick

Action_Items

BRIEF-DETAILS: DistilBERT-based text classifier for identifying action items in text, with binary classification capabilities and Apache 2.0 license

Text Classification

Twitter

twhin-bert-base

BRIEF-DETAILS: Multilingual BERT model trained on 7B tweets across 89 languages, featuring social engagement learning and 279M parameters. Optimized for Twitter content analysis.

Fill-Mask

vit_large_patch14_clip_224.openai_ft_in12k_in1k

wav2vec2-large-xlsr-53-faroese-100h

multilingual-sarcasm-detector

wav2vec2-large-vi

roberta-base-cold

PyTorch-StudioGAN

mt0-xxl-mt

question-answering-generative-t5-v1-base-s-q-c

mandarin-wav2vec2-aishell1

mt0-large

switch-base-8

tts-tacotron2-german

Randeng-DELLA-CVAE-226M-NER-Chinese

bert-tiny-finetuned-enron-spam-detection

maxim-s2-enhancement-lol

company-names-similarity-sentence-transformer

twhin-bert-large

musika_ae

maxim-s3-deblurring-reds

Action_Items

twhin-bert-base

The first platform built for prompt engineering