Cloud Vision
Extrae información valiosa a partir de imágenes con nuestros potentes modelos de API ya preparados o prepara modelos de visión personalizados de forma sencilla con AutoML VisionBETA
Pruébalo gratisPotente análisis de imágenes
La API Cloud Vision utiliza modelos ya preparados y permite crear modelos personalizados y flexibles que se adaptan a cada caso práctico a través de AutoML Vision.
La API Cloud Vision permite que los desarrolladores comprendan el contenido de una imagen mediante el encapsulado de potentes modelos de aprendizaje automático en una API REST fácil de usar. Esta API clasifica las imágenes rápidamente en miles de categorías (por ejemplo, "barco de vela"), detecta objetos y caras determinados dentro de dichas imágenes y es capaz de leer las palabras impresas que contengan. De este modo, puedes crear metadatos en tu catálogo de imágenes, moderar el contenido ofensivo o habilitar nuevas situaciones de marketing mediante el análisis de opinión en imágenes.
Gracias a la versión beta de AutoML Vision, los desarrolladores con una experiencia limitada en el ámbito del aprendizaje automático pueden preparar modelos personalizados de alta calidad. Una vez subidas y etiquetadas las imágenes, AutoML Vision prepara un modelo que puede escalarse según sea necesario para adaptarse a necesidades específicas. AutoML Vision ahorra tiempo a la hora de crear modelos que, además de ofrecer una mayor precisión, estén listos para la fase de producción.
Información valiosa a partir de imágenes
Detecta amplios conjuntos de objetos en tus imágenes de forma sencilla, como flores, animales, medios de transporte o miles de otras categorías de objetos habituales. La API Cloud Vision mejora a medida que añadimos conceptos nuevos y aumentamos la precisión. Con AutoML Vision, puedes crear modelos personalizados que realcen conceptos determinados de tus imágenes. Además, permite realizar acciones muy variadas: desde categorizar las imágenes de los productos hasta diagnosticar enfermedades.
Extracción de texto
El reconocimiento óptico de caracteres (OCR) te permite detectar texto en las imágenes y es compatible con la identificación automática de idiomas. Además, la API Vision es compatible con un amplio abanico de idiomas.
El poder de la Web
La API Cloud Vision utiliza la tecnología de la Búsqueda de imágenes de Google para encontrar entidades pertenecientes a una temática determinada, como personas famosas, logotipos o noticias. Esta API es compatible con millones de entidades, así que puedes tener la certeza de que las imágenes más recientes y relevantes siempre estarán disponibles. Además, puedes combinarla con la búsqueda de imágenes visualmente similares para encontrar imágenes parecidas en Internet.
Moderación de contenido
Gracias a la tecnología Búsqueda Segura de Google, podrás moderar fácilmente el contenido de las imágenes obtenidas con las aportaciones de otros usuarios y detectar el contenido inapropiado. Con la API Cloud Vision, podrás detectar diferentes tipos de contenido inapropiado, desde temas violentos hasta contenido para adultos.
Casos prácticos de Cloud Vision
Búsqueda de imágenes
Utiliza la API Vision y la API AutoML Vision para que las imágenes se puedan buscar por un amplio abanico de temas y situaciones, incluidas las categorías personalizadas. Más información sobre esta solución
Clasificación de documentos
Consulta la información de forma eficaz mediante las API Vision y Natural Language para transcribir y clasificar documentos.
Búsqueda de productos
Encuentra productos que te interesen en las imágenes y busca catálogos de productos de forma visual con la API Cloud Vision.
Características de la API Cloud Vision
Extrae información valiosa de las imágenes con nuestra potente API Cloud Vision
- Detección de etiquetas
- Detecta amplios conjuntos de categorías en una imagen, desde medios de transporte hasta animales.
- Detección web
- Busca imágenes similares en Internet.
- Reconocimiento óptico de caracteres
- Detecta y extrae texto de una imagen. Esta función es compatible con un gran número de idiomas y con la identificación automática de idiomas. Puedes subir archivos PDF y TIFF e imágenes, como archivos PNG y GIF. Consulta la lista completa de archivos compatibles.
- Reconocimiento de escritura a manobeta
- Con la API Vision, además del texto impreso de forma mecánica, puedes reconocer textos escritos a mano.
- Detección de logotipos
- Detecta logotipos de productos muy conocidos dentro de una imagen.
- Localizador de objetosbeta
- Con la API Vision, además de identificar un objeto en una imagen, podrás identificar en qué parte de la imagen se encuentra dicho objeto y cuántos objetos de ese tipo hay en la imagen.
- API REST integrada
- Accede a la API Cloud Vision mediante la API REST para solicitar uno o varios tipos de anotación por imagen. Las imágenes pueden subirse en la solicitud o integrarse en Google Cloud Storage.
- Detección de puntos de referencia
- Detecta estructuras artificiales y naturales famosas dentro de una imagen.
- Detección de caras
- Detecta varias caras en una imagen, además de sus atributos faciales clave, como el estado emocional o las prendas que lleva en la cabeza. No admite el reconocimiento facial.
- Moderación de contenido
- Detecta contenido explícito, como el dirigido a adultos o el de carácter violento.
- Integración del kit de aprendizaje automático
- Integra tu dispositivo con el kit de aprendizaje automático, un SDK móvil que facilita la aplicación de la tecnología de aprendizaje automático de Google a las aplicaciones de Android e iOS en un paquete potente y fácil de usar.
- Búsqueda de productos
- Reconoce los productos de tu catálogo en fotos de móviles y la Web, e incorpora funciones de búsqueda visual para que tus aplicaciones reconozcan productos en las imágenes.
- Atributos de imagen
- Detecta los atributos generales de la imagen, como el color dominante, y ofrece sugerencias de recorte pertinentes.
Funcionamiento de AutoML Visionbeta
Características de AutoML Visionbeta
Prepara modelos de visión personalizados de alta calidad de forma sencilla con AutoML Vision
- Modelos personalizados
- Prepara modelos de aprendizaje automático personalizados sin apenas esfuerzo ni conocimientos sobre este ámbito.
- Rendimiento vanguardista
- La precisión de predicción de los modelos de AutoML es líder en el sector, superando incluso a bases de datos como ImageNet.
- Integración con el etiquetado humano
- Si tienes imágenes pero ninguna etiqueta, nuestro equipo interno se encargará de revisar tus instrucciones particulares y de clasificar las imágenes en consonancia. De este modo, obtendrás datos de preparación con la misma calidad y el mismo rendimiento que aportamos a nuestros productos y, a la vez, mantendrás la privacidad de tus datos. Los datos del etiquetado humano sirven para preparar modelos personalizados sin contratiempos.
- Tecnología de AutoML y del aprendizaje por transferencia de Google
- Aprovecha la vanguardista tecnología de AutoML y del aprendizaje por transferencia de Google para generar modelos de alta calidad.
- Totalmente integrado
- El núcleo de Cloud AutoML se integra completamente con otros servicios de Google Cloud, por lo que proporciona a los clientes un método uniforme de acceso a toda su línea de servicios. Además, puedes almacenar tus datos de preparación en Google Cloud Storage. Para generar una predicción en el modelo que hayas preparado, consulta la API REST de AutoML.
Precios de la API Cloud Vision
Para obtener información más detallada, consulta la guía de precios.
| Precio por 1000 unidades, uso mensual | |||
|---|---|---|---|
| Función | 1-1000 unidades al mes | 1001-5.000.000 unidades al mes | 5.000.001-20.000.000 unidades al mes |
| Detección de etiquetas | Gratis | 1,50 USD | 1,00 USD |
| Detección de texto | Gratis | 1,50 USD | 0,60 USD |
| Detección de Búsqueda Segura (contenido explícito) | Gratis | Gratis con la detección de etiquetas, o bien 1,50 USD | Gratis con la detección de etiquetas, o bien 0,60 USD |
| Detección facial | Gratis | 1,50 USD | 0,60 USD |
| Detección de puntos de referencia | Gratis | 1,50 USD | 0,60 USD |
| Detección de logotipos | Gratis | 1,50 USD | 0,60 USD |
| Propiedades de la imagen | Gratis | 1,50 USD | 0,60 USD |
| Sugerencias de recorte | Gratis | Gratis con propiedades de la imagen, o bien 1,50 USD | Gratis con propiedades de la imagen, o bien 0,60 USD |
| Detección web | Gratis | 3,50 USD | Ponte en contacto con nosotros para obtener más información |
| Detección de texto en documentos | Gratis | 1,50 USD | 0,60 USD |
| Localizador de objetos | Gratis | 2,25 USD | 1,50 USD |
Predicción de la búsqueda de productos
| 1-100 unidades al día | Más de 100 unidades al día |
|---|---|
| Gratis | Ponte en contacto con nosotros |
Almacenamiento de la búsqueda de productos
| 0,10 USD por 1000 imágenes |
Ejemplo: si aplicas la detección de caras y la de etiquetas a una misma imagen, cada función se factura por separado. Es decir, pagarías una unidad de detección de etiquetas y otra de detección de caras, cada una al precio determinado por tu volumen mensual de unidades.
Límites: si crees que vas a necesitar más de 20 millones de unidades al mes para tu proyecto, ponte en contacto con un representante de ventas para negociar una posible tarifa con descuento.
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
Precios de AutoML Visionbeta
Los precios de AutoML Vision se basan en la preparación y la predicción. La precisión del modelo depende normalmente de cuánto tiempo dedicas a la preparación, así como de la calidad de tu conjunto de datos de preparación. Solo pagas por el tiempo de procesamiento que utilices.
| Preparación | |
|---|---|
| Cada mes, obtendrás una hora de preparación gratuita por modelo para los 10 primeros modelos. Las siguientes horas de preparación tienen un precio de 20 USD por hora. Muchos clientes consideran que una hora es suficiente para crear un modelo experimental y utilizan más horas de preparación para aumentar la precisión a nivel de producción. |
| Predicción | |
|---|---|
| 1-1000 imágenes | Gratis |
| 1001-5.000.000 imágenes* | 3 USD por 1000 imágenes |
* Ponte en contacto con nosotros para consultar los precios de predicción para más de 5.000.000 de imágenes.
Los productos o las funciones mencionados en esta página están en fase beta. Más información sobre nuestras fases de lanzamiento