Koherens tulajdonságrendszerek a mesterséges és az emberi látásban
Projektadatok
Vezető részleg
A vizuális világban való tájékozódásban az érzékelendő tulajdonságoktól függően használjuk a képelemzés és modellezés matematikai eszköztárát. Valamennyi algoritmikai eszköz paraméterezhető, és a beállítások függenek a szituációktól. A szakirodalomban éppen ez az akadálya a széleskörűen használható algoritmusok alkalmazásának.
A képi adatok egy részénél a tulajdonságokat axiomatikusan is lehet értelmezni: geometriához illetve fizikai megnyilvánulásokhoz köthetők. Ilyen pl. a scale-space elmélet, a 3D regisztrációs eljárások, vagy a mozgásfolyamok leírása. Az axiomatikus értelmezés többnyire valószínűsíthető szerkezethez, fizikai megvalósításhoz köthető, és ez a kötődés a kategórizált archív anyagok alapján köveztethető ki.
A tulajdonságok egy másik részénél kevésbé logikus a hovatartozás, amennyiben a helyszínről kevés információnk van. Ilyenkor sokat segít az archivált kép/eseménytár, aminek alapján valószínűsíthetők a képi tartalmak.
Mindkét modellben kulcsszerepe van a visszakereshetőségnek. Alakzatokat, tulajdonságokat, szituációs összefüggéseket, geometriai szerkezeteket és az ezek közti strukturális, oksági vagy valószínűségi kapcsolatokat keressük, és a pillanatnyi mérés adatait folyamatosan vetjük össze a hasonlónak mutatkozó esetekkel. Ebben a keresésben fontos szerepe van az indexelés kialakításának és az eltérő indexhalmazok összerendelhetőségének.
Az archív állományok feltérképezésében, az adatbányászatban a tanítás során mi adjuk meg, hogy mit és hogyan csoportosítanánk. Ez a tanítás azonban nem közvetlen, hanem példa alapú. Ezekből a lényeg kiemelése, főként kis mintaszám esetén, nehezen általánosítható. Kellenek olyan eljárások, amelyek a humán beavatkozás stratégiáját modellezik, az operátor figyelmét valószínűsítik.
A humán operátor figyelési stratégiája abban is szerepet játszhat, hogy az egyes modelleket aktuálisan hogyan paraméterezzük. Ehhez viszont a szituációs környezet alapján kell becslést tenni a képi struktúrára.
Külön feladatként jelentkezik, hogy az adatbázison alapuló tanítás során kialakuló csoportosításban a humán operátorok figyelési stratégiáját hozzárendeljük a képi jellemzők paraméterezéséhez.
Az indexelési eljárás során a releváns tulajdonságok megnevezését és hozzárendelését sokban segíti a példa alapú humán beavatkozás. Ez a megerősített tanulás egy fajtája, amit nagyban gyorsíthat, ha automatikusan kiválasztjuk azokat a részleteket, amiket az operátor figyelni szokott a vizsgált képtartalmak esetén.
Résztvevők
MTA SZTAKI
Pannon Egyetem
Pázmány Péter Katolikus Egyetem
Szegedi Tudományegyetem