{"id":2408,"date":"2026-04-21T05:02:28","date_gmt":"2026-04-21T05:02:28","guid":{"rendered":"https:\/\/deepinsightai.io\/?p=2408"},"modified":"2026-04-21T05:02:30","modified_gmt":"2026-04-21T05:02:30","slug":"lingbot-map-3d-mapping","status":"publish","type":"post","link":"https:\/\/deepinsightai.io\/es\/lingbot-map-3d-mapping\/","title":{"rendered":"LingBot-Map construye un mapa 3D completo con una sola c\u00e1mara barata - 10.000 fotogramas, cero accidentes"},"content":{"rendered":"<p>Un equipo chino puso en marcha LingBot-Map y, con s\u00f3lo una c\u00e1mara normal, consigui\u00f3 una reconstrucci\u00f3n en 3D de 10.000 fotogramas, que atrajo a 1,2 millones de espectadores en Internet.<\/p>\n\n\n\n<p>Una c\u00e1mara que cuesta s\u00f3lo unas decenas de yuanes supera a sistemas LiDAR que valen decenas de miles.<\/p>\n\n\n\n<p>Inesperadamente, el LingBot-Map de c\u00f3digo abierto del equipo chino encendi\u00f3 directamente la comunidad rob\u00f3tica mundial.<\/p>\n\n\n\n<p>Se trata de un modelo de cimentaci\u00f3n de reconstrucci\u00f3n 3D en streaming. Con una sola c\u00e1mara RGB -sin LiDAR ni sensor de profundidad- construye un mapa 3D completo en tiempo real a 20 FPS.<\/p>\n\n\n\n<figure data-spectra-id=\"spectra-mo85bwbv-kgicdd\" class=\"wp-block-image aligncenter size-full\"><img fetchpriority=\"high\" decoding=\"async\" width=\"960\" height=\"540\" src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Long-Sequence-Spatial-Memory.gif\" alt=\"lingbot mapa secuencia larga memoria espacial\" class=\"wp-image-2412\"\/><\/figure>\n\n\n\n<p>Lo m\u00e1s sorprendente: incluso despu\u00e9s de funcionar continuamente durante 10.000 fotogramas, la precisi\u00f3n apenas disminuye.<\/p>\n\n\n\n<p>Un investigador de IA de Agility Robotics dijo: \u201cLlevo demasiado tiempo esperando este d\u00eda\u201d.\u201d<\/p>\n\n\n\n<figure data-spectra-id=\"spectra-mo85dcmm-okkxnz\" class=\"wp-block-image aligncenter size-full\"><img decoding=\"async\" width=\"589\" height=\"65\" data-src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-9.png\" alt=\"Un investigador de IA de Agility Robotics dijo: \u201cLlevo demasiado tiempo esperando este d\u00eda\u201d.\u201d\" class=\"wp-image-2413 lazyload\" data-srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-9.png 589w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-9-300x33.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-9-18x2.png 18w\" data-sizes=\"(max-width: 589px) 100vw, 589px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 589px; --smush-placeholder-aspect-ratio: 589\/65;\" \/><\/figure>\n\n\n\n<p>Incluso Andrew Davison intervino personalmente para elogiarlo:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Parece que se ha invertido mucho tiempo en el SLAM. Enhorabuena por los resultados.<\/p>\n<\/blockquote>\n\n\n\n<p>Davison casi nunca comenta p\u00fablicamente proyectos de ingenier\u00eda concretos. Cuando vuelve a publicar algo activamente y utiliza la palabra \u201cimpresionante\u201d, la gente del sector le echa un vistazo m\u00e1s de cerca.<\/p>\n\n\n\n<figure data-spectra-id=\"spectra-mo85dxt2-06s6nz\" class=\"wp-block-image aligncenter size-full\"><img decoding=\"async\" width=\"651\" height=\"81\" data-src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-10.png\" alt=\"imagen\" class=\"wp-image-2414 lazyload\" data-srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-10.png 651w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-10-300x37.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-10-18x2.png 18w\" data-sizes=\"(max-width: 651px) 100vw, 651px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 651px; --smush-placeholder-aspect-ratio: 651\/81;\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">LingBot-Map enciende el mundo del SLAM: los l\u00edderes del sector dicen \u201cpor fin\u201d<\/h2>\n\n\n\n<p>LingBot-Map hace que los robots \u201centiendan\u201d de verdad el mundo entero. Su lanzamiento en c\u00f3digo abierto atrajo a 1,2 millones de espectadores.<\/p>\n\n\n\n<p>Muchos de los principales l\u00edderes de opini\u00f3n lo reenviaron y les gust\u00f3, con lo que obtuvo un gran reconocimiento en todo el sector.<\/p>\n\n\n\n<p>\u00bfQu\u00e9 aspecto tiene en la pr\u00e1ctica LingBot-Map, elogiado por un pionero del SLAM y largamente esperado por los investigadores?<\/p>\n\n\n\n<p>Las pruebas reales publicadas por el equipo dan la respuesta.<\/p>\n\n\n\n<p>En una escena a\u00e9rea, la c\u00e1mara escanea toda una manzana desde arriba. LingBot-Map reconstruye las fachadas de los edificios, las estructuras de los tejados, las calles y los \u00e1rboles de los bordes de las carreteras en una nube de puntos 3D completa en tiempo real.<\/p>\n\n\n\n<p>En un escenario de navegaci\u00f3n en interiores, la c\u00e1mara se desplaza de la cocina al sal\u00f3n y a trav\u00e9s de un pasillo. La iluminaci\u00f3n y la estructura cambian constantemente, pero el mapa 3D reconstruido de varias habitaciones se alinea estrictamente en el espacio, sin desalineaciones ni im\u00e1genes fantasma entre las habitaciones.<\/p>\n\n\n\n<p>Un pasillo con poca luz se convierte en una prueba extrema. La c\u00e1mara se desplaza por un estrecho pasillo casi a oscuras. Los m\u00e9todos de visi\u00f3n tradicionales suelen fallar en este caso, pero LingBot-Map sigue mostrando una estructura de pasillo coherente y una trayectoria estable.<\/p>\n\n\n\n<p>Y lo que es a\u00fan m\u00e1s interesante, el equipo introdujo v\u00eddeos de dibujos animados generados por LingBot-World en LingBot-Map, y \u00e9ste complet\u00f3 una reconstrucci\u00f3n 3D estable.<\/p>\n\n\n\n<p>La entrada es una calle japonesa virtual generada por IA. El resultado es una nube de puntos 3D con coordenadas espaciales precisas. La compatibilidad entre ambos modelos conecta directamente la tuber\u00eda de \u201cmundo virtual \u2192 comprensi\u00f3n espacial 3D\u201d.\u201d<\/p>\n\n\n\n<p>La comparaci\u00f3n de trayectorias lo hace a\u00fan m\u00e1s claro.<\/p>\n\n\n\n<p>En los conjuntos de datos Oxford Spires y Tanks &amp; Temples, la trayectoria prevista por LingBot-Map (naranja) coincide casi por completo con la realidad sobre el terreno (azul), mientras que los m\u00e9todos competidores TTT3R y WinT3R muestran una desviaci\u00f3n importante.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Dentro de LingBot-Map - Un sistema de \u201cmemoria selectiva<\/h2>\n\n\n\n<p>La dificultad central de la reconstrucci\u00f3n 3D en streaming es una sola: c\u00f3mo dejar que el modelo \u201cconstruya viendo\u201d, sin olvidar el pasado ni agotar la memoria.<\/p>\n\n\n\n<p>La reconstrucci\u00f3n 3D tradicional es \u201ccapturar primero, procesar despu\u00e9s\u201d.\u201d<\/p>\n\n\n\n<p>La reconstrucci\u00f3n de secuencias requiere que el sistema localice y mapee continuamente mientras recibe nuevos fotogramas, todo ello controlando estrictamente los costes de computaci\u00f3n y memoria.<\/p>\n\n\n\n<p>Las soluciones anteriores se atascaban en los compromisos.<\/p>\n\n\n\n<p>Algunos comprim\u00edan de forma demasiado agresiva y olvidaban gradualmente las observaciones anteriores. Algunos almacenaban en cach\u00e9 todos los fotogramas hist\u00f3ricos, lo que hac\u00eda que la memoria creciera linealmente con la longitud de la secuencia. Otros combinaban modelos de aprendizaje profundo con backends SLAM tradicionales, con resultados decentes, pero que requer\u00edan un ajuste manual y carec\u00edan de rendimiento en tiempo real.<\/p>\n\n\n\n<p>LingBot-Map toma prestada una idea estructural del SLAM cl\u00e1sico.<\/p>\n\n\n\n<p>Para construir mapas mientras se mueven en entornos desconocidos, los robots necesitan mantener la memoria espacial en m\u00faltiples granularidades. El SLAM tradicional utiliza restricciones geom\u00e9tricas hechas a mano para gestionar esto, lo que limita la flexibilidad.<\/p>\n\n\n\n<p>LingBot-Map internaliza esta estructura en el mecanismo de atenci\u00f3n Transformer, lo que permite al modelo aprender qu\u00e9 recordar y qu\u00e9 olvidar.<\/p>\n\n\n\n<p>Este mecanismo se denomina Atenci\u00f3n Contextual Geom\u00e9trica (ACG) y mantiene tres capas de memoria.<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Ancla: recuerda \u201cd\u00f3nde empec\u00e9\u201d.\u201d<br>Los primeros fotogramas act\u00faan como fotogramas de anclaje, fijando el sistema de coordenadas y la l\u00ednea de base de la escala, como las estaciones base GPS. Incluso en el fotograma 10.000, el modelo sigue sabiendo d\u00f3nde est\u00e1 el fotograma 1.<\/li>\n\n\n\n<li>Ventana pose-referencia: recuerda \u201clo que hay a mi alrededor\u201d.\u201d<br>Conserva las docenas de fotogramas m\u00e1s recientes con informaci\u00f3n visual completa, capturando densos detalles geom\u00e9tricos cerca de la posici\u00f3n actual, como la vista a trav\u00e9s del parabrisas de un coche.<\/li>\n\n\n\n<li>Memoria de trayectoria: recordar \u201cd\u00f3nde he estado\u201d.\u201d<br>Los fotogramas distantes no conservan todo el detalle visual. Cada fotograma se comprime en s\u00f3lo 6 fichas compactas, que almacenan informaci\u00f3n geom\u00e9trica clave de toda la trayectoria. Es como un espejo retrovisor: no ves todos los n\u00fameros de las calles, pero sabes de d\u00f3nde vienes.<\/li>\n<\/ol>\n\n\n\n<p>Tres capas de memoria suena complejo, pero en la pr\u00e1ctica son extremadamente eficientes.<\/p>\n\n\n\n<p>Para un v\u00eddeo de 10.000 fotogramas, la atenci\u00f3n causal est\u00e1ndar almacena en cach\u00e9 unos 5 millones de tokens, mientras que GCA s\u00f3lo utiliza unos 70.000. Cada nuevo fotograma a\u00f1ade unos 500 tokens en los m\u00e9todos est\u00e1ndar, pero s\u00f3lo 6 tokens en GCA. El crecimiento de la memoria se reduce en aproximadamente 80 veces.<\/p>\n\n\n\n<p>Por eso LingBot-Map puede procesar v\u00eddeos ultralargos con memoria constante, mientras que otros se bloquean tras unos pocos miles de fotogramas.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Estrategia de formaci\u00f3n de LingBot-Map y resultados de las pruebas comparativas<\/h2>\n\n\n\n<figure data-spectra-id=\"spectra-mo85lf3d-ggvj8i\" class=\"wp-block-image aligncenter size-full\"><img decoding=\"async\" width=\"660\" height=\"329\" data-src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-11.png\" alt=\"Figura 1. Comparaci\u00f3n de LingBot-Map Comparaci\u00f3n de LingBot-Map con los m\u00e9todos m\u00e1s avanzados de reconstrucci\u00f3n de secuencias.\" class=\"wp-image-2415 lazyload\" data-srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-11.png 660w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-11-300x150.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-11-18x9.png 18w\" data-sizes=\"(max-width: 660px) 100vw, 660px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 660px; --smush-placeholder-aspect-ratio: 660\/329;\" \/><\/figure>\n\n\n\n<p>El equipo utiliz\u00f3 una estrategia de formaci\u00f3n en dos fases.<\/p>\n\n\n\n<p>En la primera fase, entrenaron un modelo base en 29 conjuntos de datos que abarcaban escenas de interior, exterior, sint\u00e9ticas y del mundo real, construyendo una comprensi\u00f3n geom\u00e9trica general.<\/p>\n\n\n\n<p>En la segunda fase, introdujeron GCA y aumentaron gradualmente el n\u00famero de vistas de 24 a 320, lo que permiti\u00f3 al modelo aprender primero secuencias cortas y luego trayectorias largas.<\/p>\n\n\n\n<p>En la evaluaci\u00f3n, el documento presenta los resultados de cinco puntos de referencia.<\/p>\n\n\n\n<p>En Oxford Spires (trayectorias mixtas de interior y exterior a gran escala en la Universidad de Oxford), LingBot-Map logra un error ATE de 6,42 metros, frente a los 18,16 metros del segundo clasificado, casi 3 veces mejor.<\/p>\n\n\n\n<p>Cabe destacar que esta precisi\u00f3n supera incluso a los m\u00e9todos offline que procesan todos los fotogramas a la vez (12,87) y a los m\u00e9todos tradicionales de optimizaci\u00f3n iterativa (10,52).<\/p>\n\n\n\n<p>Al pasar de 320 fotogramas a 3.840 fotogramas, la ATE s\u00f3lo aumenta de 6,42 a 7,11, lo que muestra una degradaci\u00f3n casi nula con la longitud de la secuencia.<\/p>\n\n\n\n<p>En ETH3D (con verdad sobre el terreno escaneada por l\u00e1ser), la reconstrucci\u00f3n F1 alcanza el 98,98, mejorando al segundo clasificado (77,28) en m\u00e1s de 21 puntos porcentuales.<\/p>\n\n\n\n<p>En Tanques y Templos (grandes estructuras exteriores), la ATE es de 0,20 metros, frente a los 0,76 metros del segundo puesto.<\/p>\n\n\n\n<p>En 7-Scenes (RGB-D de interior), ATE es de 0,08 metros, el mejor resultado.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Qu\u00e9 significa LingBot-Map para la rob\u00f3tica<\/h2>\n\n\n\n<p>El mundo acad\u00e9mico se fija en ATE y F1, pero las empresas de rob\u00f3tica calculan una ecuaci\u00f3n diferente.<\/p>\n\n\n\n<p>El primero es el coste del hardware.<\/p>\n\n\n\n<p>Un LiDAR industrial cuesta entre miles y decenas de miles de d\u00f3lares. Si a\u00f1adimos las IMU, las cadenas de herramientas de calibraci\u00f3n y la adaptaci\u00f3n del software, la percepci\u00f3n por s\u00ed sola puede suponer un tercio del coste total del robot.<\/p>\n\n\n\n<p>LingBot-Map s\u00f3lo necesita una c\u00e1mara que cuesta unas decenas de yuanes.<\/p>\n\n\n\n<p>Para categor\u00edas como los robots de servicio dom\u00e9stico y los veh\u00edculos de reparto de baja velocidad, donde la sensibilidad al precio es extrema, eliminar el LiDAR importa mucho m\u00e1s que a\u00f1adir otro chip.<\/p>\n\n\n\n<p>El segundo es la navegaci\u00f3n aut\u00f3noma de larga duraci\u00f3n.<\/p>\n\n\n\n<p>Los robots que operan en grandes centros log\u00edsticos o entornos urbanos deben funcionar durante horas de forma continua. Los sistemas tradicionales se topan con l\u00edmites de memoria en secuencias largas.<\/p>\n\n\n\n<p>La capacidad de LingBot-Map para procesar m\u00e1s de 10.000 fotogramas con memoria constante hace factible la autonom\u00eda de larga duraci\u00f3n en grandes espacios.<\/p>\n\n\n\n<p>Otro aspecto es la manipulaci\u00f3n con destreza.<\/p>\n\n\n\n<p>Esto conecta con LingBot-Depth, de c\u00f3digo abierto.<\/p>\n\n\n\n<p>Cuando los robots intentan agarrar recipientes de cristal transparente o metal reflectante, las c\u00e1maras de profundidad tradicionales est\u00e1n casi \u201cciegas\u201d. Estos materiales no reflejan se\u00f1ales fiables, lo que provoca grandes agujeros en los mapas de profundidad.<\/p>\n\n\n\n<p>LingBot-Depth utiliza el modelado de profundidad enmascarado (MDM) para resolver este problema.<\/p>\n\n\n\n<p>Durante el entrenamiento, se enmascaran intencionadamente partes del mapa de profundidad, obligando al modelo a inferir distancias a partir de texturas y contornos RGB.<\/p>\n\n\n\n<p>Como resultado, alcanza un rendimiento de vanguardia en pruebas como NYUv2 y ETH3D, con una precisi\u00f3n de profundidad que supera incluso a la de las c\u00e1maras de profundidad industriales.<\/p>\n\n\n\n<p>El modelo ha sido certificado por el laboratorio de visi\u00f3n de profundidad de Orbbec, y ambas partes han formado una alianza estrat\u00e9gica para desarrollar c\u00e1maras de profundidad de nueva generaci\u00f3n. En pruebas reales, alcanz\u00f3 una tasa de acierto de 50% en cajas de almacenamiento transparentes.<\/p>\n\n\n\n<p>LingBot-Depth se encarga de \u201cver a qu\u00e9 distancia est\u00e1 cada p\u00edxel\u201d, mientras que LingBot-Map se ocupa de \u201ccomprender la escena 3D completa en tiempo real\u201d.\u201d<\/p>\n\n\n\n<p>Juntos, cierran el c\u00edrculo de la percepci\u00f3n espacial para robots.<\/p>\n\n\n\n<p>Los brazos rob\u00f3ticos que se enfrentan a vasos de cristal en las cocinas, tubos de ensayo en los laboratorios o contenedores met\u00e1licos reflectantes en los almacenes disponen ahora de referencias espaciales 3D fiables.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">LingBot-Map completa el rompecabezas de la IA incorporada<\/h2>\n\n\n\n<figure data-spectra-id=\"spectra-mo85mwzq-f5cszr\" class=\"wp-block-image aligncenter size-full\"><img decoding=\"async\" width=\"665\" height=\"253\" data-src=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-12.png\" alt=\"LingBot-Map completa el rompecabezas de la IA incorporada\" class=\"wp-image-2416 lazyload\" data-srcset=\"https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-12.png 665w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-12-300x114.png 300w, https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/image-12-18x7.png 18w\" data-sizes=\"(max-width: 665px) 100vw, 665px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 665px; --smush-placeholder-aspect-ratio: 665\/253;\" \/><\/figure>\n\n\n\n<p>Desde una perspectiva m\u00e1s amplia, la apertura de LingBot-Map no es un hecho aislado, sino un hito clave en una clara hoja de ruta de la IA incorporada.<\/p>\n\n\n\n<p>En enero, el equipo puso a disposici\u00f3n p\u00fablica cuatro modelos durante su \u201cSemana de la Evoluci\u00f3n de la Inteligencia Corporal\u201d.\u201d<\/p>\n\n\n\n<p>LingBot-Depth se encarga de la percepci\u00f3n de la profundidad.<\/p>\n\n\n\n<p>LingBot-VLA es un gran modelo encarnado que ha alcanzado tasas de \u00e9xito r\u00e9cord en el mundo real en la prueba de referencia GM-100 de la Universidad Jiao Tong de Shanghai.<\/p>\n\n\n\n<p>LingBot-World se dirige a Google Genie 3, permitiendo la interacci\u00f3n en tiempo real a 16 FPS.<\/p>\n\n\n\n<p>LingBot-VA introdujo el modelado conjunto autorregresivo del v\u00eddeo y las acciones, mejorando las tasas de \u00e9xito de las tareas en el mundo real en 20% con respecto a Pi0.5.<\/p>\n\n\n\n<p>Pero faltaba algo.<\/p>\n\n\n\n<p>La estimaci\u00f3n de la profundidad proporciona \u201cpuntos\u201d a nivel de fotograma, mientras que la cartograf\u00eda 3D proporciona \u201csuperficies\u201d continuas. La capa intermedia -comprensi\u00f3n espacial en tiempo real- estaba ausente.<\/p>\n\n\n\n<p>LingBot-Map llena ese vac\u00edo con precisi\u00f3n.<\/p>\n\n\n\n<p>Ahora, toda la pila de IA encarnada forma un bucle cerrado:<\/p>\n\n\n\n<p>Ver el mundo (Profundidad) \u2192 Comprender el espacio (Mapa) \u2192 Simular la f\u00edsica (Mundo) \u2192 Decidir y actuar (VLA\/VA)<\/p>\n\n\n\n<p>Todos los componentes de esta cadena son de c\u00f3digo abierto bajo licencia Apache 2.0, y el c\u00f3digo, las ponderaciones y los informes t\u00e9cnicos se publican en plataformas como Hugging Face y ModelScope.<\/p>\n\n\n\n<p>A escala mundial, este nivel de apertura es poco frecuente.<\/p>\n\n\n\n<p>Para la industria rob\u00f3tica, lo que puede hacer una sola c\u00e1mara acaba de ampliarse.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Referencias<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>LingBot-Map. Repositorio Hugging Face (huggingface.co\/robbyant\/lingbot-map)<\/li>\n\n\n\n<li>LingBot-Map. P\u00e1gina de modelos de ModelScope (modelscope.cn\/models\/Robbyant\/lingbot-map)<\/li>\n\n\n\n<li>Mapa LingBot. Repositorio GitHub (github.com\/Robbyant\/lingbot-map)<\/li>\n\n\n\n<li>LingBot-Map: Streaming 3D Reconstruction with Geometric Context Attention. arXiv Preprint (arxiv.org\/abs\/2604.14141)<\/li>\n\n\n\n<li>P\u00e1gina oficial de LingBot-Map (technology.robbyant.com\/lingbot-map)<\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>A Chinese team open-sourced LingBot-Map, and with only an ordinary camera, it achieved 10,000-frame streaming 3D reconstruction, drawing 1.2 million viewers across the internet. A camera that costs just dozens of yuan beats LiDAR systems worth tens of thousands. Unexpectedly, the open-sourced LingBot-Map from the Chinese team directly ignited the global robotics community. This is [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":2411,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"none","_seopress_titles_title":"%%post_title%%","_seopress_titles_desc":"LingBot-Map enables real-time 3D mapping using just a single cheap RGB camera. Achieve 10,000 frames with zero crashes, no LiDAR, and stable high-precision reconstruction.","_seopress_robots_index":"","_uag_custom_page_level_css":"","site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"set","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[2,6],"tags":[],"class_list":["post-2408","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-news","category-robots"],"uagb_featured_image_src":{"full":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes.webp",2528,1696,false],"thumbnail":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-150x150.webp",150,150,true],"medium":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-300x201.webp",300,201,true],"medium_large":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-768x515.webp",768,515,true],"large":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-1024x687.webp",1024,687,true],"1536x1536":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-1536x1030.webp",1536,1030,true],"2048x2048":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-2048x1374.webp",2048,1374,true],"trp-custom-language-flag":["https:\/\/deepinsightai.io\/wp-content\/uploads\/2026\/04\/LingBot-Map-Builds-a-Full-3D-Map-with-Just-One-Cheap-Camera-\u2014-10000-Frames-Zero-Crashes-18x12.webp",18,12,true]},"uagb_author_info":{"display_name":"Claude Carter","author_link":"https:\/\/deepinsightai.io\/es\/author\/cloud-han03gmail-com\/"},"uagb_comment_info":0,"uagb_excerpt":"A Chinese team open-sourced LingBot-Map, and with only an ordinary camera, it achieved 10,000-frame streaming 3D reconstruction, drawing 1.2 million viewers across the internet. A camera that costs just dozens of yuan beats LiDAR systems worth tens of thousands. Unexpectedly, the open-sourced LingBot-Map from the Chinese team directly ignited the global robotics community. This is&hellip;","_links":{"self":[{"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/posts\/2408","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/comments?post=2408"}],"version-history":[{"count":1,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/posts\/2408\/revisions"}],"predecessor-version":[{"id":2417,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/posts\/2408\/revisions\/2417"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/media\/2411"}],"wp:attachment":[{"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/media?parent=2408"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/categories?post=2408"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/deepinsightai.io\/es\/wp-json\/wp\/v2\/tags?post=2408"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}