Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

dpn107.mx_in1k

Brief Details: DPN107 is a dual-path network with 87.1M parameters for ImageNet classification, combining ResNet and DenseNet architectures for optimal feature reuse.

Image Classification

MIT

ast-finetuned-speech-commands-v2

Brief-details: AST model fine-tuned on Speech Commands v2 dataset, achieving 98.12% accuracy. Based on Vision Transformer architecture for audio classification. 85.4M parameters.

Audio Classification

bartowski

WhiteRabbitNeo-2.5-Qwen-2.5-Coder-7B-GGUF

Brief-details: A highly-optimized GGUF quantized version of WhiteRabbitNeo-2.5-Qwen-2.5-Coder-7B, offering multiple compression levels for different hardware requirements. Specialized for code generation and text tasks.

Text Generation

TinyLlama

TinyLlama_v1.1

BRIEF DETAILS: A compact 1.1B parameter LLM trained on SlimPajama dataset with Llama 2 architecture, optimized for general text generation with strong performance on various benchmarks.

Text Generation

tutikentuti

whisper-tiny-quiztest

BRIEF-DETAILS: A fine-tuned version of Whisper-tiny for speech recognition, featuring 37.8M parameters with Apache 2.0 license. Achieves 55.05 WER on quiztest dataset.

Automatic Speech Recognition

timm

dla102.in1k

BRIEF DETAILS: DLA102 is a 33.3M parameter Deep Layer Aggregation model trained on ImageNet-1k, offering efficient image classification with 7.2 GMACs compute complexity.

Image Classification

rinna

japanese-clip-vit-b-16

Brief Details: Japanese CLIP model with ViT-B/16 architecture (197M params) for image-text understanding. Trained on CC12M dataset with Japanese captions.

Feature Extraction

distil-whisper

distil-large-v2

Brief-details: A 756M parameter speech recognition model that's 6x faster than Whisper large-v2 while maintaining comparable accuracy within 1% WER. Optimized for English ASR.

Automatic Speech Recognition

google

vivit-b-16x2

Brief Details: ViViT - A Video Vision Transformer model extending ViT capabilities to video processing, with MIT license and strong PyTorch integration

Video Classification

timm

resnest101e.in1k

Brief Details: ResNeSt-based image classification model with split-attention networks, 48.4M params, trained on ImageNet-1k. Optimized for 256x256 images.

Image Classification

pysentimiento

bertweet-pt-sentiment

Brief Details: A Portuguese sentiment analysis model based on BERTabaporu, featuring 135M parameters for analyzing tweet sentiment with POS/NEG/NEU labels.

PyTorch

imvladikon

wav2vec2-xls-r-300m-hebrew

Brief Details: A fine-tuned wav2vec2 model for Hebrew ASR with 315M parameters, achieving 23.18% WER. Trained on combined datasets totaling 97 hours of audio.

Automatic Speech Recognition

stablediffusionapi

juggernaut-reborn

Brief-details: Juggernaut Reborn is a powerful text-to-image model optimized for ultra-realistic image generation, particularly excelling in portrait creation with cyberpunk and modern aesthetics.

Text-to-Image

timm

cspdarknet53.ra_in1k

Brief-details: CSPDarkNet53 is a 27.7M parameter CNN backbone trained on ImageNet-1k using RandAugment, optimized for enhanced learning capability and feature extraction.

Image Classification

multimodalart

Florence-2-large-no-flash-attn

Brief-details: Florence-2 variant optimized without flash attention - advanced vision foundation model for caption, detection & segmentation tasks at 0.77B params

Image-Text-to-Text

claudios

VulBERTa-MLP-Devign

Brief-details: A specialized transformer model for detecting code vulnerabilities in C/C++, based on RoBERTa architecture with 125M parameters and MLP classification head.

Text Classification

sentence-transformers

gtr-t5-base

BRIEF-DETAILS: A 110M parameter T5-based model that maps sentences to 768-dimensional vectors, optimized for semantic search with FP16 precision

Sentence Similarity

XLabs-AI

flux-ip-adapter

BRIEF DETAILS: IP-Adapter for FLUX.1-dev model enabling image-to-image generation, trained on 512x512 and 1024x1024 resolutions. Supports ComfyUI integration with non-commercial license.

Text-to-Image

Helsinki-NLP

opus-mt-tc-big-en-pt

Brief-details: Neural machine translation model (233M params) for English to Portuguese translation, achieving 50.4 BLEU score on flores101-devtest benchmark.

Translation

bartowski

gemma-2-27b-it-GGUF

BRIEF-DETAILS: A comprehensive GGUF quantization of Google's Gemma 2 27B instruction-tuned model, offering various compression options from 108GB to 9.4GB with different quality-performance tradeoffs.

Text Generation

timm

pit_b_224.in1k

Brief Details: PiT-B: A 73.8M parameter Pooling-based Vision Transformer model trained on ImageNet-1K, optimized for 224x224 images with 12.4 GMACs efficiency.

Image Classification

dpn107.mx_in1k

ast-finetuned-speech-commands-v2

WhiteRabbitNeo-2.5-Qwen-2.5-Coder-7B-GGUF

TinyLlama_v1.1

whisper-tiny-quiztest

dla102.in1k

japanese-clip-vit-b-16

distil-large-v2

vivit-b-16x2

resnest101e.in1k

bertweet-pt-sentiment

wav2vec2-xls-r-300m-hebrew

juggernaut-reborn

cspdarknet53.ra_in1k

Florence-2-large-no-flash-attn

VulBERTa-MLP-Devign

gtr-t5-base

flux-ip-adapter

opus-mt-tc-big-en-pt

gemma-2-27b-it-GGUF

pit_b_224.in1k

The first platform built for prompt engineering