Red neuronal Google DeepMind ha aprendido a convertir 2D imágenes en objetos tridimensionales

En cuanto a la foto, cualquiera puede imaginar fácilmente lo que se representa en ella como una imagen tridimensional. Y aunque algunas cosas detrás de las escenas (por ejemplo, sólo vemos la parte delantera del respaldo de la silla, pero no vio a la parte posterior), que no son difíciles de adivinar cómo aparecerá el objeto en el reverso. Para AI es esos trucos son complejos, pero recientemente el grupo DeepMind ingenieros de diseño no sólo enseña artificial prodelyvat inteligencia descrito anteriormente, sino también para traducir la imagen 2D en 3D.

Red neuronal Google DeepMind ha aprendido a convertir 2D imágenes en objetos tridimensionales

El nuevo sistema se llama "las peticiones de red Generación" (consulta de red generativo - GQN). Para enseñar la inteligencia artificial para analizar la escena de dos dimensiones, el equipo de investigación le mostró imágenes de la misma escena desde diferentes puntos de vista. La cadena de imagen de AI utilizar para comprender cómo cambian los objetos cuando se cambia el ángulo. Por otra parte, este enfoque nos permitió aprender a predecir lo que va a parecerse a una escena desde un ángulo diferente, teniendo en cuenta no sólo la posición de los objetos, sino también la luz. Como uno de los autores de Ali Eslami,

"Imagínese que usted está buscando en el monte Everest y se mueve alrededor de un metro. Gore no cambia su tamaño que le dará información sobre la distancia a la misma y su tamaño. Y si nos fijamos en la taza y hacer lo mismo - que va a cambiar. Aproximadamente lo que nuestra tecnología funciona ".

Red neuronal Google DeepMind ha aprendido a convertir 2D imágenes en objetos tridimensionales

"Por otra parte, el algoritmo está entrenado en la misma forma que una persona. Al ver el mismo objeto varias veces, el AI analiza su rendimiento, tiendas y luego utiliza durante la segunda interacción. Ahora la inteligencia artificial puede volver a crear un laberinto mediante el escaneo de un par de fotos tomadas desde el interior ".

Red neuronal Google DeepMind ha aprendido a convertir 2D imágenes en objetos tridimensionales