ЛингБот-Ворлд: Новата генерација на светскиот модел на Робјант и визијата за интеракција во реално време
АнГрупата, кинеската компанија за вештачка интелигенција Robbyant, ја нуди новата генерација на светски модел како open source: LingBot-World. Овој модел има за цел да обезбеди висока точност дигитален симулациски простор за системите за вештачка интелигенција, кој нуди реално време контролиран експеримент. Недавно се појавува како конкурент на Google Project Genie. LingBot-World се истакнува во области како физички вештачка интелигенција, автономна возење и развој на игри, со висок квалитет на визуелите, динамичка точност, долгорочна стабилност и моментална интеракција.
Со фокус на минимизирање на проблемите што се чести во продукцијата на видеа, наречени “long-term drift”, тој се стреми да ги намали ситуации како пропаѓање на сцената, деформација или губење на објектите со текот на времето. Robbyant со помош на повеќестепен процес на тренирање и паралелни техниките за забрзување, наведува дека LingBot-World може да произведува приближно 10 минути непрекинато и стабилно видео. Некогаш ова време беше само неколку секунди или минути; сега, стабилноста на пристапот значително се подобри.
Дури и ако камерските движења трајно се менуваат, при враќање на сцената, ја одржува структурната целосност на објектите, што се смета за една од клучните особини на LingBot-World. Моделот има околу 16 FPS производствена брзина и под 1 секунда за доцнење при целосна интеракција, што го стави во рамките на основните перформанси. Корисниците можат во реално време да ја контролираат карактерите и аглите на камерата со тастатура и глушец, а возможни се и интервенции како промена на временските услови, стилизирање или активирање на одредени сценарија. Исто така, со zero-shot генеричка способност за генерална адаптација, LingBot-World може да произведува импресивен видео ток со еден сликен од реалниот свет или екран од игра без потреба од дополнителна обука или собирање податоци за поединечни сценарија.
Со цел да се постигне пофусирана симулација, Robbyant воведува хибридна стратегија за собирање податоци за да ги зголеми висококвалитетните интерактивни податоци. Собира широк видео архив од реалниот свет и синтетички податоци добиени од игри чиј мотор е Unreal Engine, со цел да се разјасни каузалната врска помеѓу дејствата и промените во опкружувањето. На страна од моторот за игри, чистите кадри се добиваат од слојот за рендерирање, додека дејствата и положбите на камерата се истовремено запишуваат. Овој пристап овозможува моделот да учи висок степен на точност за врската помеѓу дејствата и промените во опкружувањето.
Од друга страна, некои технички ограничувања на LingBot-World сè уште постојат. Поради високите трошоци за пресметки, Тој моментално работи само на GPU-означени за корпоративни нивоа, а мемориските режими извлечени од контекстуалниот прозорец можат со времето да доведат до структурна нестабилност во долгорочни симулации. Контролата останува базирана на основна навигација; при сложени интеракции меѓу објекти, сè уште не се постигнува потребната прецизност. Плановите на компанијата вклучуваат проширување на активноста и физичкиот мотор, додавање на отворен мемориски модул и целосно елиминирање на поместувањата во процесот на производство. Достапен е преку GitHub и Hugging Face за страници за пристап.



