Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

yolov5m-smoke

Brief Details: YOLOv5m-based smoke detection model achieving 99.47% mAP@0.5, optimized for real-time smoke detection with PyTorch implementation

Object Detection

remzicam

privacy_intent

Brief-details: Privacy policy intent classifier achieving 88% F1-score, fine-tuned on PolicyIE dataset with 5 distinct privacy-related categories

Text Classification

cadaeic

v2_dreamink

BRIEF DETAILS: Stable Diffusion v2 embedding model for creating striking silhouetted landscapes with colorful backgrounds, trained on Inkpunk and Dreamlike Diffusion merger

stable-diffusion

microsoft

git-large-vatex

Brief Details: GIT-large-vatex is a generative image-to-text Transformer model fine-tuned on VATEX, specializing in video captioning and visual tasks.

Image-Text-to-Text

microsoft

git-base-vatex

BRIEF DETAILS: GIT-base-vatex is a 177M parameter vision-language model fine-tuned on VATEX, specialized in video captioning and visual question answering using CLIP image tokens.

Image-Text-to-Text

nickmuchi

finbert-tone-finetuned-fintwitter-classification

Brief Details: Financial sentiment analysis model fine-tuned on Twitter data. 110M params, achieves 88.4% accuracy for classifying financial tweets as bullish/bearish/neutral.

Text Classification

keremberke

yolov5m-license-plate

Brief Details: YOLOv5m model specialized for license plate detection with 98.8% mAP@0.5 accuracy. Built on PyTorch, supports real-time inference and custom training.

Object Detection

keremberke

yolov5m-forklift

Brief Details: YOLOv5m-based object detection model specialized for forklift detection, achieving 85.15% mAP@0.5 on validation data. Popular with 1000+ downloads.

Object Detection

Sygil

Sygil-Diffusion

BRIEF DETAILS: Multilingual text-to-image model fine-tuned on Stable Diffusion, featuring unique namespace control system and support for 4 languages. Optimized for diverse image generation.

Text-to-Image

keremberke

yolov5m-construction-safety

Brief-details: YOLOv5m model fine-tuned for construction safety object detection, achieving 0.37 mAP@0.5 on validation. Supports real-time safety monitoring.

Object Detection

keremberke

yolov5n-construction-safety

Brief Details: YOLOv5n model specialized for construction safety object detection, achieving 0.37 mAP@0.5 on validation. Popular with 1100+ downloads.

Object Detection

arpanghoshal

EkmanClassifier

Brief Details: EkmanClassifier is a BERT-based emotion classification model that identifies six universal emotions (happiness, sadness, anger, fear, disgust, surprise) in text.

Text Classification

q3fer

distilbert-base-fallacy-classification

Brief-details: A DistilBERT-based model fine-tuned for logical fallacy classification across 14 categories, achieving high accuracy in identifying reasoning flaws.

Text Classification

nonmetal

gslm-japanese

BRIEF-DETAILS: Japanese implementation of Facebook's Generative Spoken Language Model (GSLM) for textless NLP, featuring speech-to-unit and unit-to-speech conversion capabilities.

Japanese

Basunat

Cinematic-Diffusion

BRIEF DETAILS: Specialized cinematic image generation model based on SD 1.5, optimized for 16:9 ratio, requires "syberart" keyword trigger. Best for movie-style scenes & portraits.

Text-to-Image

admruul

anything-v3.0

Brief-details: Anime-focused text-to-image model with 123M parameters, optimized for high-quality anime art generation using Stable Diffusion. Supports danbooru tags and detailed prompting.

Text-to-Image

abdalrahmanshahrour

auto-arabic-summarization

Brief Details: Arabic text summarization model built on BERT architecture, optimized for MSA content with 23.9g CO2 emissions and Rouge-L score of 1.137

Summarization

timm

vit_small_patch32_224.augreg_in21k_ft_in1k

Brief-details: A Vision Transformer (ViT) model with 22.9M parameters for image classification, pre-trained on ImageNet-21k and fine-tuned on ImageNet-1k with augmentation.

Image Classification

timm

vit_small_patch16_224.augreg_in1k

Brief-details: Vision Transformer (ViT) model with 22.1M params, trained on ImageNet-1k. Features 224x224 input, 16x16 patches, augmentation-enhanced training.

Image Classification

timm

vit_base_patch32_224.augreg_in21k

Brief-details: Vision Transformer (ViT) model trained on ImageNet-21k, featuring 104M params, patch size 32, and advanced augmentation techniques for superior image classification.

Image Classification

vasista22

whisper-tamil-medium

Brief-details: A fine-tuned Whisper ASR model specialized for Tamil language, achieving 6.5% WER on Common Voice test set, trained on multiple Tamil ASR corpuses.

Automatic Speech Recognition

yolov5m-smoke

privacy_intent

v2_dreamink

git-large-vatex

git-base-vatex

finbert-tone-finetuned-fintwitter-classification

yolov5m-license-plate

yolov5m-forklift

Sygil-Diffusion

yolov5m-construction-safety

yolov5n-construction-safety

EkmanClassifier

distilbert-base-fallacy-classification

gslm-japanese

Cinematic-Diffusion

anything-v3.0

auto-arabic-summarization

vit_small_patch32_224.augreg_in21k_ft_in1k

vit_small_patch16_224.augreg_in1k

vit_base_patch32_224.augreg_in21k

whisper-tamil-medium

The first platform built for prompt engineering