Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

dolphin-2.0-mistral-7B-GPTQ

Brief-details: Advanced 7B parameter GPTQ-quantized Mistral model optimized for helpful, compliant responses with multiple quantization options and ChatML format support

Text Generation

CofeAI

FLM-2-52B-Instruct-2407

Brief Details: A powerful 52B parameter language model with strong Chinese language capabilities, featuring innovative fine-tuning and superior performance across multiple domains.

Text Generation

jordiclive

flan-t5-3b-summarizer

Brief-details: Fine-tuned 3B parameter FLAN-T5-XL model specialized in multi-purpose text summarization, supporting various summary types through prompt engineering

Summarization

google

electra-large-discriminator

Brief-details: ELECTRA large discriminator model by Google - powerful transformer-based language model trained to detect real vs fake tokens, optimized for efficiency and performance.

Transformers

google

pix2struct-large

Brief Details: Pix2struct-large: 1.34B parameter image-to-text model specialized in visual language understanding across multiple domains. Supports 5 languages.

Image-to-Text

royweiss1

T5_MiddleSentences

BRIEF DETAILS: T5-Large fine-tuned model for deciphering ChatGPT's encrypted responses through token length analysis, part of USENIX Security '24 research.

Text2Text Generation

malteos

scincl

Brief-details: BERT-based scientific document embedding model trained on citation graphs, optimized for research paper similarity with 110M parameters and SOTA performance on SciDocs benchmarks.

Feature Extraction

flax-sentence-embeddings

st-codesearch-distilroberta-base

Brief-details: A specialized sentence embedding model based on DistilRoBERTa, designed for code search applications with 768-dimensional vectors, trained on code_search_net dataset.

Sentence Similarity

google

mt5-small

Brief-details: Multilingual T5 model supporting 101 languages, pre-trained on mC4 dataset. Small variant ideal for text-to-text generation tasks requiring lower compute resources.

Text2Text Generation

NeuML

pubmedbert-base-embeddings

Brief Details: A specialized BERT-based embedding model fine-tuned on PubMed data, producing 768-dimensional vectors for medical text similarity tasks with SOTA performance.

Sentence Similarity

BAAI

bge-multilingual-gemma2

Brief-details: A powerful multilingual embedding model (9.24B params) based on Gemma-2 that achieves SOTA results across multiple languages and benchmarks for text embedding tasks

Feature Extraction

Helsinki-NLP

opus-mt-en-it

Brief-details: Neural machine translation model for English to Italian conversion, developed by Helsinki-NLP with BLEU scores up to 48.2 on Tatoeba dataset.

Translation

tiiuae

falcon-7b

Brief-details: A powerful 7B parameter language model trained on 1.5T tokens, featuring FlashAttention and multiquery architecture. Apache 2.0 licensed.

Text Generation

unsloth

mistral-7b-instruct-v0.3-bnb-4bit

Brief-details: 4-bit quantized Mistral-7B Instruct v0.3 optimized for efficient inference with Unsloth, offering 2.2x faster performance and 62% less memory usage.

Text Generation

Michau

t5-base-en-generate-headline

BRIEF DETAILS: T5-based headline generation model trained on 500k articles. Specialized in creating one-line headlines from article text. Popular with 122k+ downloads.

Text2Text Generation

hugging-quants

Meta-Llama-3.1-405B-Instruct-AWQ-INT4

Brief Details: Quantized version of Meta's 405B parameter LLM, optimized for 8 languages. Uses 4-bit AWQ quantization, reducing model size while maintaining performance.

Text Generation

pysentimiento

robertuito-emotion-analysis

Brief-details: Spanish emotion analysis model for tweets, based on RoBERTuito architecture. Detects 6 Ekman emotions + neutral class. Strong performance with 0.560 F1 score.

PyTorch

sentence-transformers

msmarco-bert-base-dot-v5

Brief-details: BERT-based semantic search model with 768-dimensional embeddings, trained on 500K MS MARCO query-answer pairs. Optimized for dot-product similarity scoring.

Sentence Similarity

TheBloke

Llama-2-7B-Chat-GPTQ

Brief-details: A 7B parameter GPTQ-quantized chat model based on Meta's Llama 2, optimized for dialogue with 4-bit precision and multiple grouping size options.

Text Generation

baichuan-inc

Baichuan2-13B-Chat

Brief Details: Baichuan2-13B-Chat is a powerful bilingual LLM trained on 2.6T tokens, optimized for both Chinese and English tasks with state-of-the-art performance.

Text Generation

microsoft

phi-1_5

Brief Details: Phi-1.5: Microsoft's 1.3B parameter language model excelling in code, text & reasoning. MIT-licensed, trained on 150B tokens without RLHF.

Text Generation

dolphin-2.0-mistral-7B-GPTQ

FLM-2-52B-Instruct-2407

flan-t5-3b-summarizer

electra-large-discriminator

pix2struct-large

T5_MiddleSentences

scincl

st-codesearch-distilroberta-base

mt5-small

pubmedbert-base-embeddings

bge-multilingual-gemma2

opus-mt-en-it

falcon-7b

mistral-7b-instruct-v0.3-bnb-4bit

t5-base-en-generate-headline

Meta-Llama-3.1-405B-Instruct-AWQ-INT4

robertuito-emotion-analysis

msmarco-bert-base-dot-v5

Llama-2-7B-Chat-GPTQ

Baichuan2-13B-Chat

phi-1_5

The first platform built for prompt engineering