| Model de Referència (SOTA) | Benchmarks Clau i Context | Alternativa Gratis / OSS | Benchmarks de l'Alternativa | 
|---|---|---|---|
| Raonament Profund i Conversa | |||
| OpenAI GPT-5 (SOTA en Raonament General) Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Agost 2025 | GPQA: 89.3 MMLU-Pro: 88.1 MATH: 78.2 Arena Elo: 1495 Context: 256k | DeepSeek V3 Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ (Llicència pròpia) Anunciat: Juliol 2025 | GPQA: 85.5 MMLU-Pro: 86.0 MATH: 72.1 Arena Elo: 1460 Context: 128k | 
| Gemini 2.5 Pro (SOTA en Context Llarg) Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Maig 2025 | GPQA: 86.4 MMLU-Pro: 86.2 MATH: 75.3 Arena Elo: 1474 Context: 2.1M | Llama 3.1 (1M) Ús Gratuït: ✔️ (Models) | OSS: ✔️ (Llama Lic) Anunciat: Juliol 2024 | GPQA: "58.2" MMLU: 86.1 MATH: "60.1" NIAH (1M): ~99.2% Context: 1M | 
| Claude 3.5 Opus (SOTA en Fiabilitat Empresarial) Ús Gratuït: ❌ | OSS: ❌ Anunciat: Juliol 2025 | GPQA: 86.8 MMLU: 87.2 HumanEval: 93.5 Arena Elo: ~1455 Context: 200k | Mistral-Next 8x22B Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ Anunciat: Juliol 2025 | GPQA: "81.2" MMLU-Pro: 83.5 HumanEval: "90.8" Arena Elo: 1405 Context: 128k | 
| Grok-4 (SOTA en Raonament Matemàtic) Ús Gratuït: ❌ | OSS: ❌ Anunciat: Juny 2025 | MATH: 82.5 GPQA: 87.5 MMLU-Pro: 86.6 Arena Elo: 1443 Context: 128k | Qwen3-235B Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ Anunciat: Juny 2025 | MATH: "68.3" GPQA: "80.1" MMLU-Pro: 82.8 Arena Elo: 1392 Context: 128k | 
| GPT-OSS (Community Model) (SOTA en Transparència i Desenvolupament Obert) Ús Gratuït: ✔️ | OSS: ✔️ Anunciat: 2024 | Filosofia: 100% Obert (Dades i Codi) MMLU: ~81.5 MATH: ~48.2 Arena Elo: ~1300 Context: 128k | Llama 3.1 405B (Corporate OSS) Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ Anunciat: Juliol 2024 | Filosofia: Corporatiu ("Open Innovation") MMLU: 86.1 MATH: 60.1 GPQA: 58.2 Context: 128k | 
| Phi-3.5-Vision (SOTA en Eficiència / SLMs) Ús Gratuït: ✔️ (API/Models) | OSS: ✔️ Anunciat: Juliol 2025 | Paràmetres: ~14B MMLU: 80.5 MATH: 55.1 Capacitats: Multimodal (Text, Imatge) Context: 128k | Google Gemma 2 9B Ús Gratuït: ✔️ (Models) | OSS: ✔️ Anunciat: Juny 2024 | Paràmetres: 9B MMLU: 74.3 MATH: 52.1 Rendiment/Mida: SOTA (OSS) Context: 8k | 
| Claude 3.5 Sonnet (SOTA en Accés Gratuït d'Alt Rendiment) Ús Gratuït: ✔️ (Web UI) | OSS: ❌ Anunciat: Juny 2024 | GPQA: 85.1 MMLU: 85.0 MATH: 65.2 Arena Elo: ~1380 Context: 200k | Llama 3.1 70B Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ Anunciat: Juliol 2024 | GPQA: "45.1" MMLU: 82.0 MATH: 50.4 Arena Elo: 1320 Context: 128k | 
| Funcionalitat Agèntica i Presa de Decisions | |||
| OpenAI GPT-5 (Agent) (SOTA en Agents Generalistes) Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Agost 2025 | GAIA: 75.5% Operator-Bench: 79.1 Capacitat de Planificació: Molt Alta Ús d'Eines: Natiu Context: 256k | CrewAI + DeepSeek V3 Ús Gratuït: ✔️ | OSS: ✔️ (Framework + Model 2025) | GAIA: ~68% (Estimat) Rendiment del LLM: SOTA (OSS) Flexibilitat: Molt Alta Control: Total (Auto-allotjat) Context: 128k | 
| Google Gemini 2.5 Pro (Agent) (SOTA en Agents Multimodals) Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Maig 2025 | Ús d'Eines: Natiu (Function Calling) Raonament: Nivell SOTA Multimodalitat: Nivell SOTA GAIA: ~74% (Estimat) Context: 2.1M | NexusRaven-V2 Ús Gratuït: ✔️ (Models) | OSS: ✔️ (Apache 2.0) Llançament: Gen 2024 | Ús d'Eines: SOTA (OSS) Precisió de Crida a Funció: Molt Alta Mida: 13B Eficiència: Molt Alta Context: 32k | 
| Claude 3.5 Opus (Agent) (SOTA en Accés Gratuït d'Alt Rendiment) Ús Gratuït: ✔️ (Via Sonnet) | OSS: ❌ Anunciat: Juliol 2025 | GAIA: ~71% (Estimat) Fiabilitat: Molt Alta Ús d'Eines: Sí (Artifacts) Nivell Gratuït (Sonnet): Molt Generós Context: 200k | Manus Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Anunciat: Març 2025 | GAIA: 70.1% Operator-Bench: 75.3 Ús d'Eines: Fort Nivell Gratuït: Viable (crèdits) Context: 1M | 
| Cognition Labs Devin (SOTA en Agents de Codi Autònoms) Ús Gratuït: ❌ (Accés limitat) | OSS: ❌ Anunciat: Març 2024 | SWE-Bench (Agèntic): "13.86%" Autonomia: Completa Capacitats: Depuració, Desplegament Accés a Eines: Shell, Editor, Navegador Defineix la categoria d'agents de programari autònoms. | OpenDevin Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Versió estable: Abril 2025 | SWE-Bench (Agèntic): ~5% Autonomia: Parcial Capacitats: En desenvolupament actiu Comunitat: Molt Activa L'esforç OSS més important per a l'enginyeria de programari autònoma. | 
| Cursor (SOTA en IDEs Agèntics) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Integració IA: Nativa Funcions Clau: Code-gen, "Auto-Fix", Xat Coneixement del Repositori: Sí Eficiència del Programador: Molt Alta La millor experiència per programar directament amb un agent. | Aider Ús Gratuït: ✔️ | OSS: ✔️ (Apache 2.0) Actualitzat: Contínuament | Integració IA: Línia de Comandes Funcions Clau: Edició agèntica de codi Coneixement del Repositori: Sí Control: Total per a desenvolupadors L'alternativa OSS més potent per a la programació agèntica. | 
| Zapier (SOTA en Automatització No-Code) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Nº d'Integracions: +6,000 Facilitat d'Ús: Molt Alta Funcions IA: "Zapier Tables", "AI Actions" Fiabilitat: SOTA L'estàndard de la indústria per connectar aplicacions sense codi. | n8n Make Ús Gratuït: ✔️ | OSS: ✔️ (n8n) | Nº d'Integracions: +1,200 (Make), +400 (n8n) Flexibilitat: Molt Alta (n8n) Pla Gratuït: Generós (Make) Auto-allotjament: Sí (n8n) Excel·lents alternatives amb més control per a desenvolupadors o millors plans gratuïts. | 
| Mixture of Agents (MoA) (SOTA en Arquitectures d'Investigació) Ús Gratuït: (Concepte) | OSS: (Arquitectura) Publicat: Maig 2024 | Millora sobre GPT-4o: "+2.5% en AlpacaEval 2.0" Concepte: Múltiples LLMs com a "experts" Procés: Col·laboratiu i Iteratiu Cost Computacional: Alt El futur de com els sistemes d'IA podrien resoldre problemes complexos. | MetaGPT Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Actualitzat: Contínuament | Framework: Multi-Agent Paradigma: Simulació d'Empresa Generació: Codi, Documentació, Diagrames Complexitat: Alta Una implementació pràctica i OSS del concepte de col·laboració entre agents. | 
| LangChain (SOTA en Frameworks de Desenvolupament) Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Actualitzat: Contínuament | Abstracció: Alta Ecosistema: Enorme Components: Cadenes, Agents, Memòria Flexibilitat: Màxima La "navalla suïssa" per a desenvolupadors que construeixen amb LLMs. | CrewAI Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Versió estable: Feb 2025 | Abstracció: Molt Alta Enfocament: Col·laboració Multi-Agent Facilitat d'Ús: Molt Alta Concepte: Rols, Tasques, Eines El millor per definir i executar equips d'agents especialitzats. | 
| Programació (Coding) | |||
| OpenAI GPT-5 Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Agost 2025 | SWE-Bench: 75.2 Aider Polyglot: 85.1 HumanEval: 95.3 MBPP: 91.5 MATH: 78.2 | DeepSeek Coder V2 Ús Gratuït: ✔️ (Web/API) | OSS: ✔️ (Llicència pròpia) Anunciat: Maig 2024 | HumanEval: "90.2" MBPP: "84.5" GSM8K: "92.5" MultiPL-E: "78.1" Aider Polyglot: "71.6" | 
| Magic AI Assistant Ús Gratuït: ❌ (Privat) | OSS: ❌ Anunciat: Juny 2025 | SWE-Bench: 78.3 Aider Polyglot: 75.1 HumanEval: 92.8 MBPP: 88.4 MATH: 70.5 | Qwen2-72B-Code Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ (Apache 2.0) Anunciat: Juny 2025 | HumanEval: "85.4" MBPP: "80.8" GSM8K: "89.2" MMLU: "80.1" SWE-Bench: "45.3" | 
| Grok-4 Ús Gratuït: ❌ | OSS: ❌ Anunciat: Juny 2025 | SWE-Bench: 70.1 Aider Polyglot: 79.5 HumanEval: 90.1 MBPP: 85.3 MATH: 82.5 | Llama 3.1 405B Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ (Llama 3.1 Lic) Anunciat: Juliol 2024 | MMLU: "86.1" HumanEval: "87.2" MBPP: "83.7" MATH: "60.1" GPQA: "58.2" | 
| Gemini 2.5 Pro Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Maig 2025 | SWE-Bench: 68.5 Aider Polyglot: 82.2 HumanEval: 93.1 MBPP: 89.0 MATH: 75.3 | CodeLlama 2 70B Ús Gratuït: ✔️ (Models) | OSS: ✔️ (Llama Lic) Anunciat: Gener 2025 | HumanEval: "88.2" MBPP: "82.1" MMLU: "75.8" MATH: "55.3" Aider Polyglot: "65.5" | 
| Claude 3.5 Sonnet Ús Gratuït: ✔️ (Web UI) | OSS: ❌ Anunciat: Juny 2024 | SWE-Bench: 73.0 Aider Polyglot: 62.1 HumanEval: 92.0 MBPP: 88.1 MATH: 68.9 | StarCoder 2 Ús Gratuït: ✔️ (Models) | OSS: ✔️ (BigCode Lic) Anunciat: Febrer 2024 | HumanEval: "82.3" MBPP: "75.4" MMLU: "68.5" MATH: "42.1" Tool-Bench: "60.3" | 
| Ajuda en Recerca | |||
| Claude 3.5 Opus Ús Gratuït: ❌ | OSS: ❌ Anunciat: Juliol 2025 | NIAH (200k): 99.8% FEVER: 96.5% GPQA: 86.8% QASPER: 85.1% Líder per analitzar i extreure informació fidel de PDFs i documents llargs. | Kimi (Moonshot AI) Ús Gratuït: ✔️ (Web UI) | OSS: ❌ Actualitzat: Maig 2025 | NIAH (200k): ~98.5% QASPER: ~78.2% Anàlisi de Fitxers: Multi-format La millor alternativa gratuïta per a anàlisi de context llarg amb alta fiabilitat. | 
| Gemini 2.5 Pro Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Maig 2025 | NIAH (1M tokens): 99.7% MMMU: SOTA (Propietari) GPQA: 86.4% QASPER: 84.5% Insuperable per a anàlisi a gran escala de repositoris o bases de dades multimodals. | Llama 3.1 (1M) Ús Gratuït: ✔️ (Models) | OSS: ✔️ (Llama Lic) Anunciat: Juliol 2024 | NIAH (1M tokens): ~99.2% GPQA: "58.2" QASPER: ~75.3% La millor opció OSS per a tasques que requereixen una finestra de context massiva. | 
| Perplexity Pro Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Plataforma actualitzada: Agost 2025 | Qualitat de RAG: SOTA Precisió de Citacions: 98% Cobertura de Fonts: Molt Àmplia Latència (Velocitat): Molt Baixa El millor per a respostes ràpides i verificades amb fonts directes de la web. | Brave Search Summarizer Ús Gratuït: ✔️ | OSS: ❌ Actualitzat: Juliol 2025 | Qualitat de RAG: Bona Precisió de Citacions: ~90% Latència: Baixa Integrat directament en els resultats de cerca per a resums ràpids. | 
| OpenAI GPT-5 Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Anunciat: Agost 2025 | FEVER: 97.2% GPQA: 89.3% NIAH (256k): 99.5% QASPER: 86.0% Potent per a investigació conversacional, síntesi d'idees i generació d'hipòtesis. | Phind Ús Gratuït: ✔️ | OSS: ❌ Actualitzat: Juny 2025 | Qualitat de RAG: Enfocada en Codi Precisió de Citacions: Molt Alta Base de Coneixement: Stack Overflow, etc. Optimitzat per a respostes tècniques precises amb exemples de codi. | 
| Elicit Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Actualitzat: Juliol 2025 | Funció Principal: Revisió de Literatura Mètrica Clau: Extracció Estructurada Base de Dades: +200M Papers Automatització: Alta Busca en papers i extreu la informació clau en taules estructurades. | SciSpace Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Actualitzat: Juny 2025 | Funció Principal: Comprensió de Papers Mètrica Clau: Anàlisi Conversacional Integracions: Zotero, Mendeley Permet "preguntar" als documents per entendre conceptes difíciles. | 
| Consensus Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Actualitzat: Juliol 2025 | Funció Principal: Extracció de Troballes Mètrica Clau: Síntesi d'Evidència Base de Dades: +200M Papers Precisió: Molt Alta Sintetitza les respostes a preguntes basant-se únicament en estudis científics. | Scite.ai Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Actualitzat: Juliol 2025 | Funció Principal: Verificació de Citacions Mètrica Clau: "Smart Citations" Base de Dades: +1.2B Citacions Avalua la fiabilitat de la investigació analitzant el context de les seves citacions. | 
| Generació d'Imatges | |||
| Midjourney v7 (Qualitat Artística SOTA) Ús Gratuït: ❌ | OSS: ❌ Cost: Des de ~$10/mes Llançament: Juny 2025 | Coherència Artística: SOTA Adherència al Prompt: Molt Alta Personatges Consistents: Sí ("--cref") L'estàndard d'or per a art digital, fotorealisme i composicions complexes. | Stable Diffusion 3 Ús Gratuït: ✔️ (Models) | OSS: ✔️ (STBL Lic) Llançament: Febrer 2024 | Qualitat OSS: SOTA Renderitzat de Text: Molt Bo Fine-tuning: Total La base per a la majoria d'eines i la comunitat open source. | 
| Ideogram 2.0 (Text i Il·lustració SOTA) Ús Gratuït: ✔️ (Crèdits diaris) | OSS: ❌ Llançament: Juliol 2025 | Renderitzat de Tipografia: SOTA Generació de Logos: Excel·lent Estil Il·lustratiu: Molt Fort Insuperable per a qualsevol imatge que requereixi text llegible i estilitzat. | Microsoft Designer Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Actualitzat: Contínuament | Renderitzat de Tipografia: Molt Bo Integració: Suite de Disseny Combina la generació d'imatges amb eines de disseny gràfic. | 
| DALL-E 3 (a GPT-5) (Facilitat d'Ús SOTA) Ús Gratuït: ✔️ (Limitat/a Copilot) | OSS: ❌ Cost: Inclòs a ChatGPT Plus (~$20/mes) Actualitzat: Agost 2025 | Refinament Conversacional: Sí Adherència al Prompt: Molt Alta Censura: Forta Ideal per a principiants i per a la creació ràpida de conceptes visuals. | Playground v2.5 Ús Gratuït: ✔️ (100 img/dia) | OSS: ❌ Llançament: Gen 2024 | Pla Gratuït: Molt Generós Qualitat Estètica: Alta Comunitat: Activa Una de les millors opcions gratuïtes pel seu equilibri de qualitat i quantitat. | 
| Leonardo AI (Plataforma SOTA) Ús Gratuït: ✔️ (Crèdits diaris) | OSS: ❌ Actualitzat: Contínuament | Accés a Models: Múltiples (incl. SD3) Entrenament Propi: Sí Edició (Inpainting/Outpainting): Sí La plataforma més completa per a usuaris avançats que volen controlar tot el procés. | Civitai Ús Gratuït: ✔️ | OSS: ✔️ (Hub) Actualitzat: Contínuament | Accés a Models: Milers (OSS) Suport de LoRA: Extensiu Comunitat: Molt Activa Essencial per a qualsevol que treballi amb Stable Diffusion de forma local. | 
| Freepik AI (Edició i Màrqueting SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Juliol 2025 | Estil: Foto de Stock / Comercial Generació de Vectors: Sí Integració amb Editor: Sí Perfecte per crear actius de màrqueting, icones i contingut per a xarxes socials. | Pixelcut Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Actualitzat: Juny 2025 | Estil: Fotografia de Producte Eliminació de Fons: SOTA Generació d'Escenes: Sí La millor eina per a e-commerce i fotos de producte. | 
| SeaArt.ai (Comunitats Especialitzades) Ús Gratuït: ✔️ (Crèdits diaris) | OSS: ❌ Actualitzat: Contínuament | Estil Principal: Anime / Fantasia Suport de LoRA: Sí Pla Gratuït: Generós La plataforma de referència per a la creació d'art d'estil anime. | OpenArt Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Actualitzat: Contínuament | Estil Principal: Versàtil Entrenament d'Estils: Fàcil Models Comunitaris: +100 Excel·lent per experimentar amb diferents estils de la comunitat. | 
| Generació de Vídeo | |||
| OpenAI Sora (Qualitat Cinematogràfica SOTA) Ús Gratuït: ❌ (Accés limitat) | OSS: ❌ Anunciat: Febrer 2024 | Durada Màxima: +60 segons Resolució: Fins a 1080p Coherència Temporal: SOTA Física del Món: Realista El referent en qualitat, encara que no disponible públicament. | Stable Video Diffusion Ús Gratuït: ✔️ (Models) | OSS: ✔️ (STBL Lic) Llançament: Nov 2023 | Durada Màxima: 2-4 segons Resolució: 576x1024 Modalitats: Img-a-Vídeo, Txt-a-Vídeo El pilar open source per a la generació de clips curts. | 
| Runway Gen-3 (Plataformes Creatives SOTA) Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Llançament: Juny 2024 | Control de Moviment: Sí (Motion Brush) Consistència de Personatges: Sí Durada: Fins a 10 segons Modalitats: Txt-Vid, Img-Vid, Vid-Vid La millor opció per a creatius que busquen un control artístic detallat. | Pika Labs Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Llançament 1.0: Des 2023 | Control de Moviment: Bàsic Edició: Sí (Expandir, Canviar Regió) Durada: 3-5 segons Excel·lent per la seva facilitat d'ús i el seu generós pla gratuït. | 
| Synthesia (Avatars d'IA SOTA) Ús Gratuït: ❌ (Demo disponible) | OSS: ❌ Cost: Des de ~$22/mes | Qualitat de l'Avatar: SOTA Nº de Veus / Idiomes: +120 Clonació de Veu: Sí Avatars Personalitzats: Sí L'estàndard per a vídeos de comunicació i formació professional. | HeyGen Ús Gratuït: ✔️ (1 Crèdit) | OSS: ❌ Actualitzat: Contínuament | Qualitat de l'Avatar: Molt Alta Nº de Veus / Idiomes: +40 Doblatge de Vídeo: Sí (SOTA) Destaca per la seva funció de traduir i sincronitzar els llavis d'un vídeo existent. | 
| Fliki (Text a Vídeo (Màrqueting) SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Qualitat de Veus IA: SOTA Biblioteca de Mitjans: Milions (Stock) Automatització: Alta Casos d'Ús: Xarxes Socials, Blogs El millor per crear contingut de vídeo a partir de text de forma ràpida i amb veus d'alta qualitat. | Pictory.ai Ús Gratuït: ✔️ (Prova) | OSS: ❌ Actualitzat: Contínuament | Qualitat de Veus IA: Bona Biblioteca de Mitjans: Àmplia Automatització: Molt Alta Especialment bo per reutilitzar contingut llarg en clips curts. | 
| VEED.io (Edició Assistida per IA SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Eines IA Clau: Subtítols autom., Neteja d'Àudio, Contacte Visual, Eliminació de Fons. Plataforma: En línia (Navegador) Facilitat d'Ús: Molt Alta Ideal per a creadors de contingut que volen editar més ràpid. | Filmora Ús Gratuït: ✔️ (amb marca d'aigua) | OSS: ❌ Actualitzat: Contínuament | Eines IA Clau: Edició per Text, Música IA, Eliminació de Soroll, Màscares IA. Plataforma: Escriptori (Win/Mac) Efectes Visuals: Extensos Una alternativa d'escriptori més tradicional amb potents ajudes d'IA. | 
| Kling (Kuaishou) (Tecnologia Emergent SOTA) Ús Gratuït: ❌ (Beta a la Xina) | OSS: ❌ Llançament Beta: Juny 2024 | Durada Màxima: 2 minuts Resolució: 1080p / 30fps Física del Món: Molt Realista Accés: Limitat (Beta a la Xina) Promet superar Sora en durada i realisme, però encara no és accessible. | Luma Dream Machine Ús Gratuït: ✔️ (Crèdits diaris) | OSS: ❌ Llançament: Juny 2024 | Durada Màxima: 5 segons Resolució: ~720p Qualitat de Moviment: Molt Alta La millor opció gratuïta i accessible per a clips d'alta qualitat. | 
| Traducció | |||
| DeepL Pro (Qualitat i Naturalitat SOTA) Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Cost: Des de ~$8.74/mes Actualitzat: Contínuament | COMET-22: SOTA (Propietari) Precisió (Idiomes Complexos): Molt Alta Formalitat / To: Ajustable La referència per a traduccions professionals i d'alta fidelitat. | Google Translate (Gemini) Ús Gratuït: ✔️ | OSS: ❌ Actualitzat: Contínuament | COMET-22: Nivell SOTA Nº d'Idiomes: +130 Traducció de Documents: Sí El servei gratuït més potent i versàtil. | 
| Gemini 2.5 Pro (Potència Bruta SOTA) Ús Gratuït: ✔️ (Nivell limitat) | OSS: ❌ Anunciat: Maig 2025 | WMT23 (En-De): SOTA COMET-22: Molt Alt Raonament Multilingüe: Excel·lent El model generalista amb el millor rendiment tècnic en traducció. | DeepSeek V3 Ús Gratuït: ✔️ (API Tier) | OSS: ✔️ (Llicència pròpia) Anunciat: Juliol 2025 | WMT23 (En-De): Nivell SOTA (OSS) COMET-22: Molt Alt (OSS) Rendiment Multilingüe: Fort L'alternativa OSS més potent per a traducció d'alta qualitat. | 
| AI TransPDF (Traducció de Documents SOTA) Ús Gratuït: ✔️ (Prova) | OSS: ❌ Actualitzat: Juny 2025 | Preservació de Format: SOTA Suport de Formats: PDF, DOCX, PPTX, etc. OCR Integrat: Sí La millor opció per traduir documents complexos sense perdre el disseny. | Claude 3.5 Sonnet Ús Gratuït: ✔️ (Web UI) | OSS: ❌ Anunciat: Juny 2024 | Coherència Contextual: Molt Alta Llargada del Document: Fins a 200k tokens Preservació de Format: No (Només text) Ideal per traduir el contingut textual de fitxers molt llargs. | 
| Meta Seamless Communication (Traducció de Veu SOTA) Ús Gratuït: ✔️ (Models) | OSS: ✔️ (CC BY-NC 4.0) Llançament: Juny 2024 | Modalitats: Veu-a-Veu, Veu-a-Txt, etc. Latència: Baixa (Gairebé temps real) Preservació d'Emoció: Sí El projecte d'investigació més avançat per a la traducció parlada. | Helsinki-NLP Opus Models Ús Gratuït: ✔️ (Models) | OSS: ✔️ (Apache 2.0) Actualitzat: Contínuament | Eficiència: Molt Alta Nº de Parells d'Idiomes: +1000 Mida del Model: Petita La millor opció OSS per desplegar traducció en aplicacions amb recursos limitats. | 
| Reconeixement de Veu (Speech-to-Text) | |||
| OpenAI Whisper v4 (Precisió i Robustesa SOTA) Ús Gratuït: ✔️ (API/OSS) | OSS: ✔️ (MIT) Llançament: Juny 2025 | WER (Librispeech): 1.7% WER (Common Voice): 4.9% Robustesa (soroll/accents): SOTA Nº d'Idiomes: ~100 El nou estàndard d'or en precisió de transcripció pura. | Faster-Whisper (v4 arch) Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Actualitzat: Contínuament | Velocitat vs Whisper: Fins a 4x Ús de Memòria: Reduït Precisió: Pràcticament idèntica L'opció OSS preferida per a una implementació local eficient. | 
| Gladia Audio Transcription (Velocitat i Temps Real SOTA) Ús Gratuït: ✔️ (API Tier) | OSS: ❌ Llançament v2: Maig 2025 | Latència (Temps Real): < 250ms WER (comparatiu): "Millor que Whisper v3" Traducció d'Àudio: Sí (en viu) Cost per Hora: Competitiu Considerat el líder per a aplicacions de transcripció en viu de baixa latència. | Whisper.cpp Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Actualitzat: Contínuament | Eficiència: SOTA (CPU / On-Device) Compatibilitat Maquinari: Molt Àmplia Dependències: Mínimes Perfecte per executar transcripció d'alta qualitat en local o en dispositius. | 
| Fireflies.ai (Intel·ligència de Reunions SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Precisió de Resums: SOTA Detecció de Tasques: Sí Precisió de Diarització: Molt Alta Integracions: Zoom, Meet, Teams El líder en extreure valor i intel·ligència de les reunions. | Otter.ai Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Precisió de Resums: Bona Diarització: Molt Bona Vocabulari Personalitzat: Sí Una alternativa molt sòlida i popular per a la transcripció de reunions. | 
| TurboScribe (Transcripció Massiva SOTA) Ús Gratuït: ✔️ (3 transcripcions/dia) | OSS: ❌ Cost: ~$10/mes (il·limitat) | Límit de Transcripció: Il·limitat (pla de pagament) Durada Màxima Fitxer: 10 hores WER (basat en Whisper): Molt Baix Exportació: Múltiples formats Insuperable en cost-efectivitat per a grans volums d'àudio. | Whisper v3 (a Replicate) Ús Gratuït: ❌ (Pagament per ús) | OSS: ✔️ (Model) Cost: ~$0.0055/minut | Límit de Transcripció: Flexible Cost-Efectivitat: Molt Alta Implementació: Fàcil (API) Una de les formes més barates d'accedir a la potència de Whisper. | 
| ELSA Speak (Entrenament de Pronunciació SOTA) Ús Gratuït: ✔️ (Limitat) | OSS: ❌ Actualitzat: Contínuament | Precisió de Feedback: Nivell de Fonema Puntuació de Pronunciació: "95% de precisió" Mètriques: Entonació, Fluïdesa, Ritme La millor eina per millorar activament la pronunciació en un idioma. | Speechace API Ús Gratuït: ✔️ (API Tier) | OSS: ❌ Actualitzat: Contínuament | Precisió de Feedback: Nivell de Fonema Puntuació de Pronunciació: Estàndard de la indústria Implementació: API per a desenvolupadors L'alternativa estàndard per integrar avaluació de pronunciació en apps. | 
| Deepgram Aura (Personalització i API SOTA) Ús Gratuït: ✔️ (API Tier) | OSS: ❌ Llançament: Febrer 2025 | Entrenament Personalitzat: Sí Models Especialitzats: Sí (Telefonia, etc.) Redacció de PII: Sí Control d'API: Extensiu La millor opció per a empreses que necessiten adaptar l'ASR a les seves dades. | SpeechBrain Toolkit Ús Gratuït: ✔️ | OSS: ✔️ (Apache 2.0) Actualitzat: Contínuament | Entrenament Personalitzat: Total Models Pre-entrenats: Sí Flexibilitat: Molt Alta La millor opció OSS per construir sistemes de veu a mida. | 
| Generació de Veu i Música | |||
| ElevenLabs V3 (Veu Realista i Clonació SOTA) Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Llançament: Maig 2025 | MOS (Naturalitat): >4.5 Mida Mostra Clonació: ~5 segons Rang Emocional: Molt Alt Latència: Baixa (API en temps real) L'estàndard de la indústria per a veus d'alta qualitat. | Coqui XTTS-v2 Ús Gratuït: ✔️ | OSS: ✔️ (Coqui Public Lic) Llançament: Set 2023 | MOS (Naturalitat): ~4.2 Mida Mostra Clonació: ~3 segons Clonació Cross-Language: Sí La millor opció OSS per a clonació de veu d'alta qualitat. | 
| Suno AI v4 (Generació de Cançons SOTA) Ús Gratuït: ✔️ (Crèdits diaris) | OSS: ❌ Llançament: Juliol 2025 | Qualitat Vocal: SOTA Coherència Instrumental: Molt Alta Control d'Estructura: Sí (vers, tornada) Durada: Fins a 4 minuts El líder per a la creació de cançons completes a partir de text. | Udio Ús Gratuït: ✔️ (Crèdits) | OSS: ❌ Actualitzat: Contínuament | Qualitat Vocal: Molt Alta Coherència Instrumental: Alta Funcions Comunitàries: Fortes Durada: Fins a 2 minuts (extensible) La principal alternativa a Suno, preferida per molts pel seu estil. | 
| Resemble AI (Conversió de Veu i Doblatge SOTA) Ús Gratuït: ❌ (Prova) | OSS: ❌ Actualitzat: Contínuament | Latència (Temps Real): < 300ms Doblatge de Vídeo (Lip-Sync): Sí Edició d'Àudio (Speech-to-Speech): Sí Integració API: Extensiva La millor opció per a aplicacions de veu en viu i doblatge professional. | StyleTTS 2 Ús Gratuït: ✔️ | OSS: ✔️ (MIT) Llançament: Nov 2023 | Control d'Estil: SOTA (OSS) Velocitat d'Inferència: Molt Ràpida Qualitat de Veu: Alta Excel·lent per generar veu amb un estil específic de forma eficient. | 
| Speechify (Productivitat i Accessibilitat SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Qualitat de Veus (Lectura): SOTA Velocitat de Lectura: Fins a 900 WPM OCR (Escaneig): Sí Integracions: Navegador, iOS, Android La millor eina per escoltar contingut escrit. | NaturalReader Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Qualitat de Veus (Lectura): Molt Alta Veus Premium: Disponibles OCR (Escaneig): Sí Una alternativa molt sòlida per a la lectura de documents. | 
| CapCut (Funcions de Veu) (Editor de Vídeo amb Veu IA SOTA) Ús Gratuït: ✔️ | OSS: ❌ Actualitzat: Contínuament | Integració amb Edició: Nativa Veus de Personatges: Sí Clonació de Veu: Sí (Bàsica) Facilitat d'Ús: Molt Alta El millor per a creadors que necessiten afegir veu als seus vídeos ràpidament. | Descript (Overdub) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Edició per Text: Sí Qualitat de Clonació: Molt Bona Cas d'Ús: Podcasting, Correccions Ideal per editar àudio gravat com si fos un document de text. | 
| Soundful (Música Instrumental SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Paràmetres de Control: Gènere, Mood, BPM Qualitat de Producció: Professional Llicència: Lliure de Drets Integració (Plugins): Sí La millor opció per crear música de fons a mida per a vídeos i podcasts. | Meta MusicGen Ús Gratuït: ✔️ (Models) | OSS: ✔️ (CC BY-NC 4.0) Llançament: Juny 2023 | Control: Text i Melodia Qualitat de Producció: Bona Durada: ~12-30 segons La base OSS més sòlida per a la generació de música instrumental. | 
| UntitledPen (Flux de Treball (Workflow) SOTA) Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Llançament: 2025 | Flux de Treball: Escriptura + Veu Qualitat de Veus: Molt Alta Control de Personatges: Sí Cas d'Ús: Guionistes, Autors La millor eina per a creadors que treballen amb guions i narratives. | Play.ht Ús Gratuït: ✔️ (Pla gratuït) | OSS: ❌ Actualitzat: Contínuament | Qualitat de Veus: Molt Alta API per a Desenvolupadors: Forta Clonació de Veu: Sí Una alternativa molt flexible per integrar TTS d'alta qualitat en productes. | 
| Google SoundStorm V2 (Efectes de So SOTA) Ús Gratuït: ❌ (En productes Google) | OSS: ❌ Llançament: Maig 2025 | Velocitat de Generació: SOTA Coherència de l'Àudio: Molt Alta Tipus d'Àudio: SFX, Diàlegs curts Qualitat: Professional Tecnologia líder per a la generació ultraràpida d'àudio curt. | Stable Audio Open Ús Gratuït: ✔️ (Models) | OSS: ✔️ (STBL Lic) Llançament: Abr 2024 | Durada Màxima: 47 segons Tipus d'Àudio: SFX, Stems, Loops Qualitat: 44.1kHz Estèreo La millor opció OSS per generar efectes de so i samples d'àudio. |