Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

ozen-Lora

Brief-details: An anime-style LoRA model trained for generating Ozen character (Made in Abyss) images, featuring two versions - soft and hard, with "ozensama" trigger token

anime

uisikdag

hardhat_detect_yolov5

Brief-details: A YOLOv5-based object detection model specialized in hard hat detection, achieving 92.8% mAP@0.5, with easy deployment via PyTorch and comprehensive documentation.

Object Detection

lucadiliello

BLEURT-20

Brief-details: BLEURT-20 is a PyTorch-based text classification model for evaluating text similarity with high accuracy, reaching scores of up to 0.999 in comparisons

Text Classification

Mizuiro-sakura

luke-japanese-base-finetuned-ner

BRIEF DETAILS: Japanese NER model based on LUKE, fine-tuned on Wikipedia data. 279M parameters, achieves 0.84 F1-score for entity recognition across 8 categories.

Token Classification

tuman

vit-rugpt2-image-captioning

BRIEF-DETAILS: Russian image captioning model combining ViT encoder and ruGPT2 decoder, trained on translated COCO2014 dataset. First of its kind for Russian language.

Image-to-Text

artyomboyko

whisper-base-fine_tuned-ru

Brief-details: A Russian-optimized Whisper ASR model fine-tuned on Common Voice 11.0, achieving 41.22% WER. Features 72.6M parameters and uses F32 tensors.

Automatic Speech Recognition

skrl

OmniIsaacGymEnvs-Crazyflie-PPO

Brief-details: PPO-based reinforcement learning model for Crazyflie drone control in NVIDIA's Isaac Gym, achieving mean rewards of 1106.75 ±63.75 with optimized hyperparameters.

Reinforcement Learning

vumichien

AV-HuBERT

Brief-details: AV-HuBERT is a multimodal speech recognition model combining audio and visual inputs to enhance speech understanding through lip movement analysis.

Automatic Speech Recognition

pruas

BENT-PubMedBERT-NER-Gene

Brief Details: A specialized NER model built on PubMedBERT for identifying gene and protein entities in biomedical text, trained on 19+ datasets with Apache 2.0 license.

Token Classification

wdcqc

starcraft-terrain-64x64

Brief Details: A specialized Stable Diffusion model fine-tuned for generating Starcraft terrain maps, supporting 8 different tilesets with 64x64 resolution terrain generation.

Text-to-Image

deutsche-telekom

gbert-large-paraphrase-euclidean

Brief Details: German BERT large model optimized for sentence similarity, using euclidean distance metrics. 1024-dimensional embeddings, MIT licensed, ideal for few-shot classification.

Sentence Similarity

PooryaPiroozfar

Flair-Persian-NER

Brief Details: Flair-based Persian Named Entity Recognition model achieving 90.33% F1-score on NSURL-2019, supporting 7 entity types including person, location, and organization names.

Token Classification

bofenghuang

whisper-large-v2-french

Brief Details: Powerful French ASR model fine-tuned from Whisper Large V2, achieving WER 4.03-8.66% across major benchmarks, trained on 2200+ hours of French speech.

Automatic Speech Recognition

Xpitfire

segformer-finetuned-segments-cmp-facade

BRIEF DETAILS: A semantic segmentation model based on SegFormer architecture, specifically trained for facade analysis with 12 distinct building element classes.

Image Segmentation

oshizo

sbert-jsnli-luke-japanese-base-lite

Brief-details: Japanese sentence embedding model based on LUKE, trained on JSNLI dataset. Generates 768-dimensional vectors for semantic search and clustering. Apache 2.0 licensed.

Sentence Similarity

sander-wood

tunesformer

Brief Details: TunesFormer - Transformer-based dual-decoder model for Irish tune generation with control codes. Built for melody composition with form control.

Text Generation

sd-concepts-library

adolf-hitler

Brief-details: A Stable Diffusion textual inversion model trained to generate Adolf Hitler-style imagery, built with MIT license and available through the SD-concepts-library.

Text Generation

aka7774

fp16_safetensors

Brief-details: A specialized Japanese-focused model conversion utility that transforms various AI models to fp16 format with safetensors, optimizing storage and compatibility

Safetensors

camenduru

one-shot-talking-face

Brief-Details: One-shot talking face generation model that creates realistic facial animations from single reference image and audio, based on audio-visual correlation learning. Published at AAAI 2022.

Text Generation

PaddlePaddle

uie-base-en

Brief-details: UIE-base-en is an English information extraction model by PaddlePaddle, using ERNIE 3.0 for universal IE tasks including entity, relation, event, and sentiment extraction.

paddlenlp

facebook

mask2former-swin-large-ade-semantic

BRIEF DETAILS: Advanced semantic segmentation model with 216M parameters using Swin Transformer backbone, optimized for ADE20k dataset with masked attention mechanism

Image Segmentation

ozen-Lora

hardhat_detect_yolov5

BLEURT-20

luke-japanese-base-finetuned-ner

vit-rugpt2-image-captioning

whisper-base-fine_tuned-ru

OmniIsaacGymEnvs-Crazyflie-PPO

AV-HuBERT

BENT-PubMedBERT-NER-Gene

starcraft-terrain-64x64

gbert-large-paraphrase-euclidean

Flair-Persian-NER

whisper-large-v2-french

segformer-finetuned-segments-cmp-facade

sbert-jsnli-luke-japanese-base-lite

tunesformer

adolf-hitler

fp16_safetensors

one-shot-talking-face

uie-base-en

mask2former-swin-large-ade-semantic

The first platform built for prompt engineering