Искусна интелигенција со Genie 3: Истражување на пристапот на светски модел
Гугл DeepMind’овият проект Genie 3 беше претставен ова лето и сега се достапен за корисници надвор од Google. Експерименталниот прототип Project Genie им овозможува на корисниците да создадат, истражуваат и повторно да обликуваат свои интерактивни светови. Сепак, пристапот е ограничен со одредени важни услови.
Кој може да пристапи до Project Genie? Во моментов, пристапот е отворен за корисници кои имаат претплата на Google AI Ultra со месечен трошок од 250 долари, а се живее во САД и имаат над 18 години. Google ја ограничува достапноста за да ги набљудува реалните кориснички интеракции и сценарија со Genie 3.
Genie 3 работи со пристап со кој се движи над традиционалните системи за создавање 3D сцени, користејќи “world model” (модел на светот). Овој систем не само што пренесува сцена; тој динамично ги произведува идните сцени врз основа на движењата и интеракциите на корисникот. Оваа инфраструктура која симулира физички закони и интеракции помеѓу објектите, нуди флексибилни примени во области како роботика, анимација, монтажи и откривање на историски локации. DeepMind наведува дека го развива Genie 3 во паралела со целите за вештачка општа интелигенција (AGI); не се само моделира фиксни и ограничени правила на играта, туку и реалната разновидност на светот.
Project Genie е реализиран како веб апликација каде соработуваат моделите Genie 3, Nano Banana Pro и Gemini. Корисникот преминува низ три основни фази на интеракција. World Sketching фазата овозможува корисниците да ја постават основата на својот свет со текстуални влезови или постоечки слики; тука се дефинираат карактерите, аголот на камерата и начинот на движење. Потоа, Nano Banana Pro нуди преглед на светот како “чернова” и им дава можност за финално прилагодување пред влегувањето во сцената. Следната фаза е World Exploration; како што корисникот напредува, Genie 3 ја произведува патеката и детали за околината во реално време. Застанувачкото движење на аголот на камерата и обликувањето на околината врз основа на корисничките акции се карактеристики на оваа фаза. Последниот чекор е World Remixing; корисниците можат да ги съединат светските теми на други, да создадат нови варијации, да инспирират од кураторски галерии и да преземат видео-верзии од своите искуства.
Genie 3 не се дефинира како мотор за игри. Иако визуелно потсетува на игри, неговата основна механика не е игри. Исто така, постојат технички ограничувања: создадените светови се ограничени на 60 секунди, визуалниот излез е со 24 fps и резолуција од 720p. Google јасно наведува дека понекогаш можеби нема да биде сосема совпаѓање со барањата, физичкиот закони може да бидат одделни од реалноста, а постојат можни задоцнувања во контрола на карактерите. Исто така, напредните функции како активирачки настани што беа најавени минатата година, сега не се достапни во оваа верзија.

