
Vizuális kategóriák tanulása
Projektadatok
Vezető részleg
A jelenlegi kutatás elsődleges célja vizuális információt reprezentáló modellek kidolgozása integrálva a képi objektumok strukturális, megjelenési és mozgási jellemzőit. Véleményünk szerint ezen jellemzők integrálásával jelentősen javítható a jelenlegi képi kategerizáló és felismerő algoritmusok hatékonysága.
Az ember látórendszerének talán a leghasznosabb tulajdonsága az objektumok felismerésének és klasszifikációjának képessége. Egy pillantás alatt képesek vagyunk felmérni az objektumok szinte összes vizuális jellemzőjét. Képesek vagyunk különbséget tenni kategóriák között (pl. autók és emberek) és a kategóriák egyes elemei között (pl. a testvérünk arcát az apánk arcától) is. Ezzel ellentétben, a jelenlegi számítógépes rendszerek teljesítménye nagyon messze vannak az emberekétől a megtanulható kategóriák számát, a feldolgozás sebességét valamint az új kategóriák tanulásának egyszerűségét illetően.
Az emberi felismerési képességek számítógépek általi másolása alapjaiban változtathatja meg a mindennapi életünket. A lehetséges alkalmazások sora szinte végtelen; kezdve az egészségügyi alkalmazásoktól, a robotikán, az autonóm járművek fejlesztésén át a különböző biztonságtechnikai alkalmazásokig stb.
A kutatásunk során az objektumok megjelenésének és struktúrájának egy- és több-nézeti modellezésével, különböző vizuális jellemzők egységes modellbe való integrálásával, statisztikai tanulóalgoritmusok alkalmazásával valamint objektumok és események kategorizálásával kívánunk foglalkozni.
Résztvevők
MTA SZTAKI