Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

cde-small-v1

BRIEF-DETAILS: State-of-the-art small embedding model (281M params) achieving 65.0 MTEB score through innovative contextual document embedding approach

Feature Extraction

HuggingFaceH4

starchat-beta

Brief-details: StarChat-β is a 15.5B parameter coding assistant model fine-tuned from StarCoderPlus, optimized for programming tasks and chat interactions across 80+ programming languages.

Text Generation

UnfilteredAI

NSFW-gen-v2

Brief Details: NSFW-gen-v2 is an advanced text-to-image generator by UnfilteredAI, featuring 3D rendering capabilities and FP16 optimization, designed for explicit content generation.

Text-to-Image

chavinlo

alpaca-native

Brief Details: A natively fine-tuned version of Stanford's Alpaca model trained on 4xA100s, achieving 41.96 avg score on OpenLLM benchmark. Built on LLaMA architecture.

Text Generation

DiscoResearch

mixtral-7b-8expert

Brief-details: Mixtral-7B-8Expert is a multilingual MoE (Mixture of Experts) model supporting 5 languages, built on Mistral architecture with strong performance across multiple benchmarks

Text Generation

Groq

Llama-3-Groq-8B-Tool-Use

Brief Details: Llama-3 8B parameter model optimized for tool use and function calling. Features 89.06% BFCL accuracy. Built on Meta's base model.

Text Generation

BlinkDL

rwkv-5-world

Brief Details: RWKV-5 World is a multilingual language model trained on 1.12T tokens across 12 languages, optimized for text generation and coding tasks with PyTorch implementation.

Text Generation

allenai

Molmo-72B-0924

BRIEF DETAILS: Advanced 73.3B parameter multimodal AI model from Allen AI that excels at image-text tasks, achieving top academic benchmark scores and near GPT-4 performance.

Image-Text-to-Text

swl-models

chilloutmix

BRIEF-DETAILS: AI model optimized for realistic Asian-style image generation, based on merged Basilmix. Uses vae-ft-mse-840000 and includes Ulzzang-6500 embeddings.

Not-For-All-Audiences

fb700

chatglm-fitness-RLHF

Brief-details: ChatGLM-6B RLHF-enhanced model trained on 700k+ high-quality data samples, optimized for Chinese/English dialogue with unlimited context length and improved summarization capabilities.

PEFT

sshleifer

distilbart-cnn-12-6

Brief-details: A distilled BART model trained on CNN/DailyMail dataset for text summarization, offering 1.24x speedup with comparable ROUGE scores to BART-large-cnn

Summarization

KwaiVGI

LivePortrait

Brief-details: LivePortrait is an efficient portrait animation model that enables high-quality face reenactment with stitching and retargeting control mechanisms, supporting both image and video inputs.

LivePortrait

FlagAlpha

Llama2-Chinese-13b-Chat

Brief-details: Llama2-Chinese-13b-Chat is a specialized Chinese-optimized version of Meta's Llama-2 model, fine-tuned using LoRA for enhanced Chinese language capabilities while maintaining English proficiency

Question Answering

codellama

CodeLlama-34b-Instruct-hf

Brief-details: A 34B parameter instruction-tuned Code Llama model optimized for code generation and understanding, featuring chat capabilities and Meta's advanced architecture.

Text Generation

OpenAssistant

oasst-sft-1-pythia-12b

BRIEF-DETAILS: Open-Assistant's 12B parameter English language model, fine-tuned on 22k human demonstrations. Built for assistant-style conversations with strong text generation capabilities.

Text Generation

google

switch-c-2048

BRIEF DETAILS: Massive 1.6T parameter Mixture-of-Experts model trained on C4 dataset for text generation, featuring 2048 experts and 4x speedup over T5-XXL.

Text2Text Generation

dallinmackay

Van-Gogh-diffusion

Brief Details: Fine-tuned Stable Diffusion model trained on "Loving Vincent" film screenshots, creating Van Gogh-style images using 'lvngvncnt' token.

Text-to-Image

stabilityai

stablecode-completion-alpha-3b-4k

Brief Details: 3B parameter code completion model with 4k context window, trained on diverse programming languages. Achieves 17.68% pass@1 on HumanEval.

Text Generation

deepseek-ai

DeepSeek-V2

Brief Details: DeepSeek-V2 is a 236B parameter MoE model with 21B active parameters per token, offering exceptional efficiency and 128k context length

Text Generation

OuteAI

OuteTTS-0.1-350M

BRIEF-DETAILS: A 350M parameter text-to-speech model built on LLaMa architecture, offering voice cloning capabilities and pure language modeling approach without external adapters.

Text-to-Speech

cognitivecomputations

Wizard-Vicuna-13B-Uncensored

Brief-details: An uncensored 13B parameter LLaMA-based model trained on filtered Wizard-Vicuna data, designed for unrestricted text generation with strong performance on various benchmarks.

Text Generation

cde-small-v1

starchat-beta

NSFW-gen-v2

alpaca-native

mixtral-7b-8expert

Llama-3-Groq-8B-Tool-Use

rwkv-5-world

Molmo-72B-0924

chilloutmix

chatglm-fitness-RLHF

distilbart-cnn-12-6

LivePortrait

Llama2-Chinese-13b-Chat

CodeLlama-34b-Instruct-hf

oasst-sft-1-pythia-12b

switch-c-2048

Van-Gogh-diffusion

stablecode-completion-alpha-3b-4k

DeepSeek-V2

OuteTTS-0.1-350M

Wizard-Vicuna-13B-Uncensored

The first platform built for prompt engineering