Models

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

opus-mt-zh-vi

BRIEF-DETAILS: Neural machine translation model for Chinese to Vietnamese translation, achieving BLEU score of 20.0 and chrF of 0.385. Built by Helsinki-NLP using transformer-align architecture.

Helsinki-NLP

opus-mt-ja-hu

Brief Details: Japanese to Hungarian neural MT model by Helsinki-NLP, trained on OPUS data. BLEU: 12.2, chrF: 0.364. Uses transformer-align architecture.

Helsinki-NLP

opus-mt-fr-es

Brief-details: A French-to-Spanish neural machine translation model based on the transformer-align architecture, achieving BLEU scores of 31.6-53.2 across various test sets

Helsinki-NLP

opus-mt-en-sv

Brief-details: English to Swedish neural machine translation model by Helsinki-NLP, achieving 60.1 BLEU score on Tatoeba test set, based on transformer architecture

Helsinki-NLP

opus-mt-en-sq

BRIEF DETAILS: English to Albanian neural machine translation model by Helsinki-NLP, achieving 46.5 BLEU score on Tatoeba test set using transformer architecture

Helsinki-NLP

opus-mt-en-ro

Brief-details: Helsinki-NLP's English-to-Romanian neural MT model based on transformer architecture, achieving BLEU 30.8 on newsdev2016 benchmark

Helsinki-NLP

opus-mt-en-mul

Brief-details: Multilingual translation model supporting English to 300+ languages, trained on OPUS data. Features SentencePiece tokenization and achieves strong BLEU scores for major languages.

Helsinki-NLP

opus-mt-en-iir

Brief-details: English to Indo-Iranian languages translation model supporting 30+ target languages, based on transformer architecture with BLEU 13.7 and chrF 0.392.

Helsinki-NLP

opus-mt-en-ht

Brief-details: English to Haitian Creole neural machine translation model based on OPUS dataset, achieving BLEU 38.3 on JW300 and 45.2 on Tatoeba test sets.

laion

mscoco_finetuned_CoCa-ViT-L-14-laion2B-s13B-b90k

Brief-details: A MSCOCO-finetuned version of CoCa-ViT-L-14, built on LAION-2B dataset, combining vision-language capabilities for enhanced image understanding and description generation

lorahub

flan_t5_large-quarel_do_not_use

Brief-details: A specialized FLAN-T5 Large model fine-tuned on QuaRel dataset. As indicated by name, this appears to be a development version not intended for production use.

timm

mixer_b16_224.goog_in21k_ft_in1k

Brief-details: MLP-Mixer vision model (59.9M params) pretrained on ImageNet-21k and fine-tuned on ImageNet-1k, achieving efficient image classification at 224x224 resolution

laion

CLIP-ViT-B-32-xlm-roberta-base-laion5B-s13B-b90k

Brief Details: Multilingual CLIP model combining ViT-B/32 vision encoder with XLM-RoBERTa text encoder, trained on LAION-5B dataset for zero-shot image classification and retrieval.

katuni4ka

tiny-random-exaone

Brief-details: A compact experimental model by katuni4ka hosted on HuggingFace, likely a smaller variant of the ExaOne architecture focused on efficient processing.

hugging-quants

Llama-3.2-1B-Instruct-Q4_K_M-GGUF

Brief-details: A 1B parameter Llama model optimized for instruction-following tasks, quantized to 4-bit (Q4) format using GGUF for efficient deployment via llama.cpp framework.

crystina-z

monoELECTRA_LCE_nneg31

Brief-details: A specialized ELECTRA-based model likely focused on language understanding tasks, developed by crystina-z and hosted on HuggingFace.

ilsilfverskiold

tech-keywords-extractor

Brief Details: BART-based tech keyword extraction model, fine-tuned for identifying technical terms, tools, and company names from text. Loss: 0.8795.

SciMaker

TaiwanPro-Llama-3.1-8B

Brief Details: An 8B parameter LLaMA-based model optimized for Traditional Chinese & Taiwan-specific content, featuring enhanced instruction following & educational capabilities.

stabilityai

japanese-stable-diffusion-xl

BRIEF DETAILS: Japanese Stable Diffusion XL - A specialized image generation model by Stability AI optimized for Japanese-style content creation, building on SDXL architecture.

xiaozhangMJXXZ

Style-lora-all

Brief Details: A comprehensive collection of LoRA models for various art styles and clothing, organized specifically for Chinese users with translated names and trigger tags.

havenhq

mamba-chat

Brief Details: First chat model using state-space architecture instead of transformers. Based on Mamba-2.8B, uses Zephyr prompt format for efficient dialogue.

opus-mt-zh-vi

opus-mt-ja-hu

opus-mt-fr-es

opus-mt-en-sv

opus-mt-en-sq

opus-mt-en-ro

opus-mt-en-mul

opus-mt-en-iir

opus-mt-en-ht

mscoco_finetuned_CoCa-ViT-L-14-laion2B-s13B-b90k

flan_t5_large-quarel_do_not_use

mixer_b16_224.goog_in21k_ft_in1k

CLIP-ViT-B-32-xlm-roberta-base-laion5B-s13B-b90k

tiny-random-exaone

Llama-3.2-1B-Instruct-Q4_K_M-GGUF

monoELECTRA_LCE_nneg31

tech-keywords-extractor

TaiwanPro-Llama-3.1-8B

japanese-stable-diffusion-xl

Style-lora-all

mamba-chat

The first platform built for prompt engineering