Los nuevos modelos de IA de Google: 5 cosas que puedes hacer con Gemini 1.5 Pro y Flash

14 mayo, 2024 | 14:00 | Alfredo Narváez | Google

El evento Google I/O 2024 fue el marco del anuncio de Gemini 1.5 Flash, así como de la tangible evolución de Gemini 1.5 Pro. En Unotv.com te decimos qué puedes hacer con cada una de estas herramientas de inteligencia artificial generativa que compiten con ChatGPT de OpenAI.

[TE RECOMENDAMOS: Chat GPT-4o, un nuevo modelo de IA que puede razonar a través de audio y texto: ¿cuándo estará disponible?]

¡Evoluciona Gemini 1.5 Pro y debuta Gemini 1.5 Flash!

Gemini 1.5 Pro presentó una serie de mejoras de calidad en casos de uso clave, como traducción, codificación, razonamiento y más, según se anunció en Google I/O 2024.

“Verá estas actualizaciones en el modelo a partir de hoy (14 de mayo de 2024), lo que debería ayudarle a abordar tareas aún más amplias y complejas”, escribió Google a través de un comunicado.

Por su parte, Gemini 1.5 Flash es un modelo más pequeño y optimizado para tareas más estrechas o de alta frecuencia donde la velocidad del tiempo de respuesta del modelo es lo más importante, según la empresa.

Ambos modelos están disponibles hoy en más de 200 países, incluyendo México según Google, y territorios en versión preliminar y estarán disponibles de forma general en junio.

Tanto 1.5 Pro como 1.5 Flash vienen con una ventana de contexto de 1 millón de tokens y permiten intercalar texto, imágenes, audio y video como entradas.

Para obtener acceso a 1.5 Pro con una ventana de contexto de 2 millones de tokens, únase a la lista de espera en Google AI Studio o en Vertex AI para clientes de Google Cloud.

[TE PODRÍA INTERESAR: Google I/O 2024: todas las novedades de Gemini y nuevas generadoras de imagen, video y música por IA]

5 cosas que puedes hacer con Gemini 1.5 Pro

Gemini 1.5 Pro presenta una innovadora ventana de contexto de hasta dos millones de tokens: la ventana de contexto más larga de cualquier modelo de base a gran escala hasta el momento. Estas son 5 cosas que se puede hacer con este modelo:

Asistente de investigación
- Te ayuda a entender los principales atributos de una investigación
Cuidado de plantas
- Pregúntale cómo puedes cuidar de tus plantas de la mejor forma
Pide ideas para desarrollar un personaje de videojuegos
- Diseña un personaje creativamente
Ayuda en cocina
- Pide recetas basado en la imagen de un platillo
Crea un menú de barista
- Desarrolla toda una serie de bebidas y platillos para un restaurante

Fuente: Google

Este modelo logra una recuperación casi perfecta en tareas de recuperación de contexto prolongado en todas las modalidades, desbloqueando la capacidad de procesar con precisión documentos a gran escala, miles de líneas de código, horas de audio, video y más.

5 cosas que puedes hacer con Gemini 1.5 Flash

Gemini 1.5 Flash es la última incorporación a la familia de modelos Gemini y el modelo más rápido que se ofrece a través de la API.

Resúmenes
Aplicaciones de chat
Subtitulado de imágenes y vídeos
Extracción de datos de documentos largos
Tablas

Fuente: Google

Está optimizado para tareas de gran volumen y frecuencia a escala, tiene un costo de servicio más eficiente e incluye nuestra innovadora ventana de contexto larga.

Aunque es un modelo más ligero que Gemini 1.5 Pro, es altamente capaz de hacer razonamientos multimodales a través de grandes cantidades de información y ofrece una calidad impresionante para su tamaño.

Este modelo se destaca en resúmenes, aplicaciones de chat, subtitulado de imágenes y vídeos, extracción de datos de documentos largos y tablas, y mucho más.

Esto se debe a que ha sido entrenado por Gemini 1.5 Pro mediante un proceso denominado “destilación”, en el que los conocimientos y habilidades más esenciales de un modelo más grande se transfieren a un modelo más pequeño y eficaz.