Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

Top_CivitAI_models

Brief-details: A curated collection of popular CivitAI models optimized for Google Colab usage, featuring 15 high-quality models including Hassan blends, Dreamlike, and specialized artistic mixes.

Text Generation

robowaifudev

megatron-gpt2-345m

Brief-details: Megatron GPT-2 345M: NVIDIA's transformer model with 380M params, trained on diverse text data. Strong perplexity scores on WikiText benchmarks.

Text Generation

SkyworkAIGC

SkyPaint

Brief Details: A bilingual Chinese-English text-to-image model combining CLIP and diffusion technology, optimized for high-quality artistic image generation with modern style capabilities.

Text-to-Image

steja

whisper-large-persian

Brief Details: A Persian speech recognition model fine-tuned from Whisper-large-v2, achieving 26.37% WER on Common Voice 11.0, optimized for Persian language ASR tasks.

Automatic Speech Recognition

CultureBERT

roberta-large-dominant-culture

BRIEF DETAILS: RoBERTa-large fine-tuned model for corporate culture analysis, classifying text into four culture dimensions based on the Competing Values Framework.

Text Classification

vasista22

whisper-telugu-large-v2

Brief Details: A fine-tuned Whisper Large-v2 model specialized for Telugu ASR, achieving 9.65 WER on FLEURS test set. Trained on multiple Telugu speech corpora.

Automatic Speech Recognition

anuragshas

whisper-large-v2-ha

BRIEF DETAILS: A fine-tuned Whisper Large-v2 model optimized for Hausa language ASR, achieving 37.41% WER on Common Voice 11.0, trained with linear learning rate scheduling across 1000 steps.

Automatic Speech Recognition

nadanainone

mememixes

Brief-details: A creative experimental AI model combining multiple Stable Diffusion checkpoints, specializing in traditional media rendering and image fixing capabilities, with three distinct mixing variations.

Text-to-Image

pyf98

librispeech_100_e_branchformer

Brief-details: ESPnet-based ASR model trained on LibriSpeech-100 using E-Branchformer architecture, achieving 94.4% accuracy on test-clean with parallel MLP-attention design

Automatic Speech Recognition

anuragshas

whisper-large-v2-bg

Brief Details: A fine-tuned Whisper Large-v2 model for Bulgarian ASR, achieving 13.4% WER on Common Voice, trained with linear learning rate scheduling over 1000 steps.

Automatic Speech Recognition

xmzhu

whisper-tiny-zh

BRIEF DETAILS: A Chinese speech recognition model based on Whisper-tiny architecture, fine-tuned on Common Voice 11.0, achieving 91.09% WER with Apache 2.0 license.

Automatic Speech Recognition

ai-forever

ruElectra-medium

Brief Details: ruElectra-medium is a Russian language transformer model developed by ai-forever, optimized for embeddings with MIT license and research-backed architecture.

Transformers

pierreguillou

whisper-medium-portuguese

Brief Details: Portuguese-optimized Whisper ASR model achieving 6.59% WER on Common Voice 11.0, outperforming original Whisper Medium for Portuguese transcription.

Automatic Speech Recognition

bofenghuang

whisper-large-v2-cv11-german

Brief Details: German ASR model fine-tuned from Whisper-large-v2, achieving 5.76 WER on Common Voice 11.0, optimized for 16kHz audio with 1.55B parameters.

Automatic Speech Recognition

ai-forever

ruElectra-small

Brief-details: Small-scale ELECTRA model for Russian language embeddings, MIT-licensed, optimized for mean token embeddings with PyTorch/TensorFlow support

Transformers

stale2000

sd-dnditem

Brief Details: A specialized Stable Diffusion model for generating D&D-style magic item images with custom prompting system and specific item types/styles support

Text-to-Image

pruas

BENT-PubMedBERT-NER-Disease

Brief-details: A specialized biomedical NER model based on PubMedBERT, fine-tuned on multiple disease-related datasets for accurate disease entity recognition in medical texts.

Token Classification

ZinengTang

tvlt-base

BRIEF-DETAILS: TVLT is a textless vision-language transformer that extends MAE for audio-visual pre-training, designed for multimodal learning tasks.

Transformers

abdalrahmanshahrour

arabartsummarization

Brief Details: A specialized Arabic text summarization model built on mBART architecture, capable of generating concise summaries and news headlines from Arabic text

Summarization

SebLih

whisper-SV

Brief-details: A Swedish speech recognition model based on Whisper-small, fine-tuned on Common Voice 11.0 dataset with PyTorch, offering automated speech recognition capabilities.

Automatic Speech Recognition

Norm

ERNIE-Layout-Pytorch

Brief Details: ERNIE-Layout-Pytorch is a PyTorch implementation of the ERNIE-Layout model for document understanding, supporting visual question answering with integrated layout analysis.

Transformers

Top_CivitAI_models

megatron-gpt2-345m

SkyPaint

whisper-large-persian

roberta-large-dominant-culture

whisper-telugu-large-v2

whisper-large-v2-ha

mememixes

librispeech_100_e_branchformer

whisper-large-v2-bg

whisper-tiny-zh

ruElectra-medium

whisper-medium-portuguese

whisper-large-v2-cv11-german

ruElectra-small

sd-dnditem

BENT-PubMedBERT-NER-Disease

tvlt-base

arabartsummarization

whisper-SV

ERNIE-Layout-Pytorch

The first platform built for prompt engineering