Cloud Vision

Extrae información valiosa a partir de imágenes con nuestros potentes modelos de API ya preparados o prepara modelos de visión personalizados de forma sencilla con AutoML Vision^BETA

Consulta la documentación de este producto.

Potente análisis de imágenes

La API Cloud Vision utiliza modelos ya preparados y permite crear modelos personalizados y flexibles que se adaptan a cada caso práctico a través de AutoML Vision.

La API Cloud Vision permite que los desarrolladores comprendan el contenido de una imagen mediante el encapsulado de potentes modelos de aprendizaje automático en una API REST fácil de usar. Esta API clasifica las imágenes rápidamente en miles de categorías (por ejemplo, "barco de vela"), detecta objetos y caras determinados dentro de dichas imágenes y es capaz de leer las palabras impresas que contengan. De este modo, puedes crear metadatos en tu catálogo de imágenes, moderar el contenido ofensivo o habilitar nuevas situaciones de marketing mediante el análisis de opinión en imágenes.

Gracias a la versión beta de AutoML Vision, los desarrolladores con una experiencia limitada en el ámbito del aprendizaje automático pueden preparar modelos personalizados de alta calidad. Una vez subidas y etiquetadas las imágenes, AutoML Vision prepara un modelo que puede escalarse según sea necesario para adaptarse a necesidades específicas. AutoML Vision ahorra tiempo a la hora de crear modelos que, además de ofrecer una mayor precisión, estén listos para la fase de producción.

Información valiosa a partir de imágenes

Detecta amplios conjuntos de objetos en tus imágenes de forma sencilla, como flores, animales, medios de transporte o miles de otras categorías de objetos habituales. La API Cloud Vision mejora a medida que añadimos conceptos nuevos y aumentamos la precisión. Con AutoML Vision, puedes crear modelos personalizados que realcen conceptos determinados de tus imágenes. Además, permite realizar acciones muy variadas: desde categorizar las imágenes de los productos hasta diagnosticar enfermedades.

Extracción de texto

El reconocimiento óptico de caracteres (OCR) te permite detectar texto en las imágenes y es compatible con la identificación automática de idiomas. Además, la API Vision es compatible con un amplio abanico de idiomas.

El poder de la Web

La API Cloud Vision utiliza la tecnología de la Búsqueda de imágenes de Google para encontrar entidades pertenecientes a una temática determinada, como personas famosas, logotipos o noticias. Esta API es compatible con millones de entidades, así que puedes tener la certeza de que las imágenes más recientes y relevantes siempre estarán disponibles. Además, puedes combinarla con la búsqueda de imágenes visualmente similares para encontrar imágenes parecidas en Internet.

Moderación de contenido

Gracias a la tecnología Búsqueda Segura de Google, podrás moderar fácilmente el contenido de las imágenes obtenidas con las aportaciones de otros usuarios y detectar el contenido inapropiado. Con la API Cloud Vision, podrás detectar diferentes tipos de contenido inapropiado, desde temas violentos hasta contenido para adultos.

"La tecnología de Cloud AutoML nos ayuda a crear modelos de visión para anotar y asignar categorías, personajes y colores de Disney a nuestros productos. Estamos integrando esas anotaciones en nuestro buscador para mejorar la experiencia de los usuarios mostrando resultados más relevantes, propiciando un descubrimiento más rápido y ofreciendo recomendaciones de productos en shopDisney".

— Mike White, director de tecnología y vicepresidente sénior de Productos de Consumo y Medios Interactivos de Disney

"ZSL es una organización benéfica internacional que promueve la protección de la fauna y la conservación de sus hábitats en todo el mundo. Para cumplir este objetivo, es imprescindible hacer un seguimiento de las poblaciones de vida silvestre para conocer a fondo tanto su distribución como los efectos de los seres humanos en dichas especies. Por ello, ZSL ha desplegado cámaras ocultas en la selva que se activan por calor o movimiento y toman fotos de los animales cuando pasan por su lado. A continuación, los millones de imágenes captadas por dichos dispositivos se analizan y anotan manualmente con las especies relevantes (como elefantes, leones o jirafas); se trata de un proceso caro y laborioso. Nuestra unidad tecnológica dedicada a la conservación ha mantenido una estrecha colaboración con el equipo de Cloud ML de Google para contribuir al desarrollo de esta fascinante tecnología, con la que pretendemos automatizar el etiquetado de las imágenes. Sería la manera perfecta de rebajar costes, poder realizar despliegues a mayor escala y profundizar nuestros conocimientos para descubrir métodos eficaces para conservar la fauna mundial".

— Sophie Maxwell, líder de Tecnología de Conservación de ZSL

"En Urban Outfitters no dejamos de buscar nuevas maneras de mejorar la experiencia de compra de los clientes. Para ofrecerles recomendaciones de productos relevantes, resultados de búsqueda precisos y filtros de productos útiles, es fundamental crear y mantener un conjunto completo de atributos de productos, pero hacerlo manualmente es una tarea lenta y ardua. Nuestro equipo ha estado evaluando Cloud AutoML con el objetivo de automatizar el proceso de atribución de productos mediante el reconocimiento de características particulares, como patrones y estilos de cuello o escote. Cloud AutoML tiene un gran potencial para mejorar los procesos de descubrimiento y recomendación y la experiencia de búsqueda de los clientes".

— Alan Rosenwinkel, doctor y científico de datos de URBN

Casos prácticos de Cloud Vision

Búsqueda de imágenes

Utiliza la API Vision y la API AutoML Vision para que las imágenes se puedan buscar por un amplio abanico de temas y situaciones, incluidas las categorías personalizadas. Más información sobre esta solución

Clasificación de documentos

Consulta la información de forma eficaz mediante las API Vision y Natural Language para transcribir y clasificar documentos.

Búsqueda de productos

Encuentra productos que te interesen en las imágenes y busca catálogos de productos de forma visual con la API Cloud Vision.

Características de la API Cloud Vision

Extrae información valiosa de las imágenes con nuestra potente API Cloud Vision

Detección de etiquetas: Detecta amplios conjuntos de categorías en una imagen, desde medios de transporte hasta animales.
Detección web: Busca imágenes similares en Internet.
Reconocimiento óptico de caracteres: Detecta y extrae texto de una imagen. Esta función es compatible con un gran número de idiomas y con la identificación automática de idiomas. Puedes subir archivos PDF y TIFF e imágenes, como archivos PNG y GIF. Consulta la lista completa de archivos compatibles.
Reconocimiento de escritura a mano^beta: Con la API Vision, además del texto impreso de forma mecánica, puedes reconocer textos escritos a mano.
Detección de logotipos: Detecta logotipos de productos muy conocidos dentro de una imagen.
Localizador de objetos^beta: Con la API Vision, además de identificar un objeto en una imagen, podrás identificar en qué parte de la imagen se encuentra dicho objeto y cuántos objetos de ese tipo hay en la imagen.
API REST integrada: Accede a la API Cloud Vision mediante la API REST para solicitar uno o varios tipos de anotación por imagen. Las imágenes pueden subirse en la solicitud o integrarse en Google Cloud Storage.

Detección de puntos de referencia: Detecta estructuras artificiales y naturales famosas dentro de una imagen.
Detección de caras: Detecta varias caras en una imagen, además de sus atributos faciales clave, como el estado emocional o las prendas que lleva en la cabeza. No admite el reconocimiento facial.
Moderación de contenido: Detecta contenido explícito, como el dirigido a adultos o el de carácter violento.
Integración del kit de aprendizaje automático: Integra tu dispositivo con el kit de aprendizaje automático, un SDK móvil que facilita la aplicación de la tecnología de aprendizaje automático de Google a las aplicaciones de Android e iOS en un paquete potente y fácil de usar.
Búsqueda de productos: Reconoce los productos de tu catálogo en fotos de móviles y la Web, e incorpora funciones de búsqueda visual para que tus aplicaciones reconozcan productos en las imágenes.
Atributos de imagen: Detecta los atributos generales de la imagen, como el color dominante, y ofrece sugerencias de recorte pertinentes.

Funcionamiento de AutoML Vision^beta

Características de AutoML Vision^beta

Prepara modelos de visión personalizados de alta calidad de forma sencilla con AutoML Vision

Modelos personalizados: Prepara modelos de aprendizaje automático personalizados sin apenas esfuerzo ni conocimientos sobre este ámbito.
Rendimiento vanguardista: La precisión de predicción de los modelos de AutoML es líder en el sector, superando incluso a bases de datos como ImageNet.
Integración con el etiquetado humano: Si tienes imágenes pero ninguna etiqueta, nuestro equipo interno se encargará de revisar tus instrucciones particulares y de clasificar las imágenes en consonancia. De este modo, obtendrás datos de preparación con la misma calidad y el mismo rendimiento que aportamos a nuestros productos y, a la vez, mantendrás la privacidad de tus datos. Los datos del etiquetado humano sirven para preparar modelos personalizados sin contratiempos.

Tecnología de AutoML y del aprendizaje por transferencia de Google: Aprovecha la vanguardista tecnología de AutoML y del aprendizaje por transferencia de Google para generar modelos de alta calidad.
Totalmente integrado: El núcleo de Cloud AutoML se integra completamente con otros servicios de Google Cloud, por lo que proporciona a los clientes un método uniforme de acceso a toda su línea de servicios. Además, puedes almacenar tus datos de preparación en Google Cloud Storage. Para generar una predicción en el modelo que hayas preparado, consulta la API REST de AutoML.

Precios de la API Cloud Vision

Para obtener información más detallada, consulta la guía de precios.

	Precio por 1000 unidades, uso mensual
Función	1-1000 unidades al mes	1001-5.000.000 unidades al mes	5.000.001-20.000.000 unidades al mes
Detección de etiquetas	Gratis	1,50 USD	1,00 USD
Detección de texto	Gratis	1,50 USD	0,60 USD
Detección de Búsqueda Segura (contenido explícito)	Gratis	Gratis con la detección de etiquetas, o bien 1,50 USD	Gratis con la detección de etiquetas, o bien 0,60 USD
Detección facial	Gratis	1,50 USD	0,60 USD
Detección de puntos de referencia	Gratis	1,50 USD	0,60 USD
Detección de logotipos	Gratis	1,50 USD	0,60 USD
Propiedades de la imagen	Gratis	1,50 USD	0,60 USD
Sugerencias de recorte	Gratis	Gratis con propiedades de la imagen, o bien 1,50 USD	Gratis con propiedades de la imagen, o bien 0,60 USD
Detección web	Gratis	3,50 USD	Ponte en contacto con nosotros para obtener más información
Detección de texto en documentos	Gratis	1,50 USD	0,60 USD
Localizador de objetos	Gratis	2,25 USD	1,50 USD

Predicción de la búsqueda de productos

1-100 unidades al día	Más de 100 unidades al día
Gratis	Ponte en contacto con nosotros

Almacenamiento de la búsqueda de productos

0,10 USD por 1000 imágenes

Ejemplo: si aplicas la detección de caras y la de etiquetas a una misma imagen, cada función se factura por separado. Es decir, pagarías una unidad de detección de etiquetas y otra de detección de caras, cada una al precio determinado por tu volumen mensual de unidades.

Límites: si crees que vas a necesitar más de 20 millones de unidades al mes para tu proyecto, ponte en contacto con un representante de ventas para negociar una posible tarifa con descuento.

Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.

Precios de AutoML Vision^beta

Los precios de AutoML Vision se basan en la preparación y la predicción. La precisión del modelo depende normalmente de cuánto tiempo dedicas a la preparación, así como de la calidad de tu conjunto de datos de preparación. Solo pagas por el tiempo de procesamiento que utilices.

Preparación
Cada mes, obtendrás una hora de preparación gratuita por modelo para los 10 primeros modelos. Las siguientes horas de preparación tienen un precio de 20 USD por hora. Muchos clientes consideran que una hora es suficiente para crear un modelo experimental y utilizan más horas de preparación para aumentar la precisión a nivel de producción.

Predicción
1-1000 imágenes	Gratis
1001-5.000.000 imágenes*	3 USD por 1000 imágenes

* Ponte en contacto con nosotros para consultar los precios de predicción para más de 5.000.000 de imágenes.

Pruébalo gratis

Los productos o las funciones mencionados en esta página están en fase beta. Más información sobre nuestras fases de lanzamiento