¿Cuál es el mejor modelo de IA?

6/8/2024

•

7 min

miren agirregomezkorta

ChatGPT 4o vs. Gemini vs. Claude vs. Copilot

Uno de los comentarios más habituales entre la gente que acude a mis clases de iniciación a la IA es: “Miren, hay tantas herramientas de IA que no sé ni por dónde empezar”. Otra variante, también habitual, es: “Si fuera a pagar por un solo modelo de IA, ¿cuál me recomendarías?”

Y, honestamente, comprendo perfectamente esta preocupación. Día a día, salen nuevas aplicaciones con inteligencia artificial que prometen facilitarnos la vida, pero, en realidad, solo contribuyen a la confusión y a la parálisis por análisis.

Así pues, en este artículo voy a comparar los 4 titanes, ChatGPT 4o, Gemini, Claude y Copilot, para evaluar cuál de estas opciones es la más potente en una variedad de tareas. En concreto, vamos a valorar el rendimiento de estos modelos para la búsqueda de información, la escritura creativa y la asistencia en decisiones estratégicas.

1. El mejor modelo para buscar información

Sabemos que uno de los grandes problemas de los LLM son las alucinaciones, es decir, las respuestas factualmente incorrectas que surgen cuando los modelos no tienen información suficiente sobre la pregunta. Por eso, proporcionar información fidedigna es una buena forma de medir la calidad de una herramienta de IA.

Para esta primera prueba, utilizaremos el mismo prompt en los cuatro modelos, pidiéndole que busque información sobre Imanol Pradales, lehendakari o presidente del Gobierno Vasco. Estas son las principales diferencias y características:

ChatGPT 4o: ofrece una respuesta bien organizada y completa. Las fuentes de información que selecciona son diversas, aunque no justifica la procedencia de cada una de sus afirmaciones.
Gemini: admite que no puede realizar la tarea. Gemini se encuentra muy limitado a la hora de buscar información en internet y redirige a sus usuarios a una búsqueda en Google, probablemente para preservar su modelo de negocio y sus ingresos.
Claude: proporciona una respuesta exhaustiva y comparable en calidad a la de ChatGPT 4o. Sin embargo, los links de las fuentes no son clicables, y reconoce que Claude no tiene acceso en tiempo real a internet, por lo que su respuesta podría no ser precisa o estar actualizada. Minipunto por mostrar sus limitaciones.
Copilot: su respuesta también es de alto nivel y precisión, y cita la fuente para cada una de las afirmaciones. Se apoya en la Wikipedia como fuente principal y recurre puntualmente a webs secundarias.

Por tanto, en mi opinión, la mejor herramienta de IA para buscar información es Copilot, seguida de cerca por ChatGPT 4o.

2. El mejor modelo para la escritura creativa

Para este segundo ejercicio, vamos a poner a prueba a nuestros cuatro modelos y les pediremos que nos ayuden a escribir la próxima edición de mi newsletter (a la que, por supuesto, te puedes apuntar para recibir artículos semanales sobre IA aplicada al marketing 😉). El prompt incluye un esquema de mi artículo, además de una pequeña guía con mi estilo lingüístico personal.

ChatGPT: aunque capta de forma bastante acertada el tono que busco, su artículo es muy fragmentado y no está bien cohesionado. Se podrían aprovechar algunas partes, pero requiere un gran trabajo de edición.
Gemini: abusa de los emoticonos y no lo utilizaría como asistente de redacción.
Claude: inventa metáforas interesantes y hace un esfuerzo por enriquecer mi esquema para que sea más comprensible para el lector. Aun así, también abusa de los emoticonos.
Copilot: ha sido mi asistente de redacción más fiable en los últimos meses, pero en este ejemplo en concreto, ha acortado y simplificado demasiado el esquema, produciendo un resultado pobre.

Así pues, mi modelo de IA favorito para la escritura creativa es Claude, afirmación con la que parecen estar de acuerdo muchos internautas. Eso sí: nunca publicaría estos borradores tal cual están; requieren un gran trabajo de edición y estilo.

3. El mejor modelo para tomar decisiones estratégicas

Para el tercer y último ejercicio, vamos a evaluar la capacidad de los modelos de IA para ayudarnos a tomar decisiones estratégicas. Antes de seguir, una advertencia: siempre que nos enfrentemos a un problema crítico, podemos usar la IA como un asistente, pero la responsabilidad de la decisión que tomemos es exclusivamente nuestra.

‍

Dicho esto, tomaremos el ejemplo de una empresa con sede en España que quiere expandirse a nuevos mercados internacionales. Le pediremos a las herramientas de IA que actúen como los CEOs de esta empresa, y que expliquen el proceso que seguirían para tomar esta decisión. A continuación, cada modelo deberá seguir su proceso y decidir a qué países se expandirá la empresa.

ChatGPT: ofrece una estrategia pormenorizada para tomar una decisión bien informada. Incluye técnicas específicas, como el análisis PESTEL, y cuestiones de responsabilidad social corporativa.
Gemini: su respuesta también es muy detallada y completa, y considera aspectos como el porqué de este deseo de expansión y la capacidad de la empresa de asumirla.
Claude: al igual que los dos modelos previos, establece un proceso riguroso para tomar esta decisión, y argumenta de forma efectiva a qué mercados se expandiría.
Copilot: proporciona la respuesta más vaga y simple, aunque cita las fuentes para sus afirmaciones. Sus propuestas no son muy accionables, y no aportan la claridad esperada.

Curiosamente, 3 de 4 modelos han seleccionado Alemania como el país prioritario para la expansión, seguido de México, Estados Unidos y Japón. En este caso, considero que ChatGPT, Gemini y Claude son igualmente valiosos para la toma de decisiones estratégicas, con Copilot a un nivel notablemente inferior.

Una comparativa más general

Visto lo visto, ¿qué herramienta recomiendo para empezar? Sin duda, ChatGPT. Es la opción más completa y versátil, tanto en su versión gratuita como de pago. Mi consejo es que domines primero este modelo, y que empieces a explorar los otros cuando ya tengas cierta soltura y dominio de la IA.

Con estos ejercicios, he puesto a prueba tres de los usos más habituales de los grandes modelos de lenguaje. Sin embargo, he dejado muchas otras herramientas fuera del análisis (como Perplexity, Copy.ai, Meta AI, etc.) y, por supuesto, no he considerado todos los casos de uso.

Si te ha interesado esta comparación, puedes seguir profundizando con este artículo de Zapier, que analiza los mejores modelos de IA para multitud de tareas. Y, en cualquier caso, mi consejo es que, una vez hayas identificado las tareas recurrentes que haces con la IA, dediques tiempo a determinar cuál es la mejor herramienta para ellas.

¡Por cierto! Si quieres seguir aprendiendo cómo usar la IA en tareas de comunicación y marketing, tengo una newsletter en la que publico un artículo semanal con guías paso a paso y actualizaciones de las mejores herramientas. ¡Apúntate ahora para seguir aprendiendo!

‍

Miren Agirregomezkorta Iza

Soluciones de IA para el marketing y la comunicación

10/010
1
/../
0
00
1-0

Suscríbete a nuestra Newsletter

Recibe los últimos artículos directamente en tu bandeja de entrada.