La Inteligencia Visual puede ser la característica más poderosa de Apple Intelligence. Aquí te explicaremos qué es, cómo funciona y veremos varios ejemplos del mundo real.
Apple añadió la Inteligencia Visual con iOS 18.2 y necesitarás un iPhone 16 o iPhone 16 Pro para utilizarlo. Lo siento, usuarios de iPhone 15 Pro.
Esta característica se encuentra bajo el paraguas de las funciones de Apple Intelligence. Es una de las pocas características de Apple Intelligence que son exclusivas de la familia iPhone 16.
Esta función de IA utiliza la cámara de tu iPhone para escanear el entorno y proporcionar información. Si esto te parece un poco abstracto, no te preocupes, vamos a mostrarte una variedad de demos dentro y fuera de nuestro estudio para mostrarte cómo puede ayudarte.
Cómo usar la Inteligencia Visual
Para activar la Inteligencia Visual, presiona y mantén presionado el control de la cámara en el lado inferior derecho de tu iPhone. Esto se compara con un breve toque que abre la aplicación de la Cámara.
Tu teléfono vibrará al abrir la cámara con una animación elegante y colorida. Verás una nueva interfaz que muestra una vista en vivo de la cámara con un botón de “preguntar”, un botón de “buscar” y un botón de captura en el centro.
Comencemos con los usos más básicos. Abre la Inteligencia Visual, apúntala a algo y captura.
La Inteligencia Visual puede ayudar a identificar cables. Luego puedes obtener información de chatGPT sobre lo que estás viendo o puedes hacer una búsqueda de imágenes en Google para obtener más información.
Por ejemplo, podemos hacer una foto de todos estos diferentes cables que tenemos en el estudio. Cada vez, la Inteligencia Visual es capaz de identificar cuáles son y proporcionar alguna información básica sobre ellos.
Incluso puedes hacer preguntas de seguimiento para obtener más información sobre los cables que escaneaste. Si te encuentras con un cable del que no sabes mucho, puedes hacer una pregunta de seguimiento para obtener más información. Como este desglose detallado de lo que puede hacer un cable DisplayPort.
También tenemos este antiguo GameBoy Color por ahí. Con un rápido escaneo con la Inteligencia Visual, podemos preguntar en qué año se lanzó.
Ambos te dan información a través de ChatGPT. Alternativamente, puedes usar una búsqueda de imágenes.
Después de escanear un controlador DualSense, obtuvimos resultados sobre dónde comprarlo. Cuando escaneamos un controlador DualSense de Playstation 5, pudimos ver esta combinación de colores específica. Luego pudimos ir directamente a la aplicación de Walmart para comprarlo.
Usar la Inteligencia Visual con texto
Fuera de hacer preguntas o buscar fotos, también puede ayudar con texto y números.
Cuando apuntas a un bloque de texto, aparecen nuevos botones que son conscientes del contexto. Puedes generar un resumen de IA o hacer que tu teléfono lo lea en voz alta.
Si estás viajando y detecta texto en otro idioma, aparecerá un botón de traducción. Al tocarlo, se hace una foto y se reemplaza el texto en la imagen por tu idioma predeterminado.
Probamos traduciendo un menú de restaurante en inglés. Es genial porque no es necesario utilizar ninguna otra aplicación y funcionó automáticamente.
Por último, con texto y números, está la resolución de ecuaciones. Algo que habría sido genial cuando estábamos en la escuela.
Ni siquiera necesitas escribirlo, solo escanéalo con la inteligencia visual y pídele que lo resuelva por ti. Incluso desglosó todos los pasos diferentes para nosotros en nuestra ecuación de ejemplo.
Escaneando alimentos
Aunque no fue totalmente específico, la Inteligencia Visual también ayudó con la recopilación de macros de tu comida. Como en las otras demos, solo apuntamos a nuestro plato y identificó los alimentos y nos dio rangos aproximados de lo que estábamos comiendo.
Es solo una estimación aproximada, pero la Inteligencia Visual nos dio información nutricional sobre nuestra palomitas de maíz. Tuvimos un pequeño puñado de palomitas de maíz y le preguntamos a la Inteligencia Visual cuántas calorías tenía. Nos dijo que un puñado como ese tenía un rango de calorías, basado en el tipo y cómo se cocinaba.
Si combinas ese rango con lo que sabes de las palomitas de maíz (SmartPop, de aire, estilo cine, etc.), puedes tener una idea decente del valor real.
Identificar plantas y animales
Con iOS 18.3, Apple añadió algunas nuevas características a la Inteligencia Visual. Ahora la Inteligencia Visual puede identificar plantas y animales automáticamente.
Cuando la apuntamos a una planta en nuestra cocina, apareció una burbuja en la parte superior con el nombre de la planta tan pronto como la reconoció. Si tocas la burbuja, te muestra información adicional de Wikipedia.
También funciona con animales, aunque por supuesto, si escaneas un perro, tiene que ser más o menos de raza pura. Ninguna IA será capaz de deducir con precisión la genealogía de un perro solo basándose en una foto.
Nuestra perrita, Brooklyn, fue etiquetada como una flat coat retriever. Aunque puede tener algo de retriever en ella, no es un flat coat puro en absoluto.
Otros animales más genéricos probablemente serían más adecuados para esto. O al menos una identificación general.
Programar citas
También llegó en iOS 18.3 la programación de citas. Esto funciona con todo, desde carteles iluminados, carteles o notas escritas a mano.
Mientras estábamos en Nueva York, pudimos escanear la fachada de un teatro para añadir el día de estreno de un espectáculo a nuestro calendario. Cuando volvimos a casa, también pudimos escanear una nota para una cita nocturna pegada en nuestra nevera.
¡Noche de cita! Añadida al calendario rápidamente con la Inteligencia Visual. Tienes la oportunidad de editar la cita en el calendario antes de guardarla. Lo mejor de todo es que, cuando la veas en la aplicación del Calendario, la foto de origen también estará adjunta para referencia.
Restaurantes y negocios
Nuestra característica favorita de la Inteligencia Visual es usarla con edificios, negocios y restaurantes. Hay una amplia gama de características, dependiendo del negocio.
Los puntos de referencia se identifican fácilmente con la Inteligencia Visual. Puedes ver su nombre, cuándo se construyó y más datos útiles.
Si ves un negocio, puedes apuntar tu teléfono para obtener toda la información relevante del negocio. Puede mostrar el horario de la tienda, el sitio web, el número de teléfono y más.
Probamos en un pequeño pueblo y descubrimos que podíamos obtener el horario en la cafetería local mientras que el lugar de pizzas nos permitió ver el menú y realizar un pedido para llevar.
La Inteligencia Visual solo va a ser mejorando
Apple Intelligence en su conjunto ha tenido un poco de un despliegue lento, pero Apple claramente cree en ello. Se han añadido más y más funciones, como lo que vimos aquí con la Inteligencia Visual.
Ha costado un poco acostumbrarse, con el nuevo botón y todo, pero una vez que comenzamos a usarlo, se ha vuelto muy útil.
Probablemente veremos surgir más casos de uso a medida que Apple continúe iterando en Apple Intelligence.