Valóban lehet-e valaha intelligens a mesterséges intelligencia videóelemzése?
A videó megfigyelést általában a biztonsággal társítják. A legtöbb esetben azonban az incidensek rögzítésére és a tények utólagos kivizsgálásának segítésére használják, nem pedig a nemkívánatos események megelőzésére. A mesterséges intelligencia által vezérelt videoelemzés rendkívül ígéretes trend, amely alapjaiban változtatja meg a dolgok működését. A kezelhető adatok videofolyamból történő kinyerése segíthet a kockázatos helyzetek korai felismerésében, minimalizálhatja a károkat, és ideális esetben teljesen elkerülheti a vészhelyzeteket. Ugyanakkor az AI jelentősen kibővíti a videó megfigyelés alkalmazási területeit a biztonsági rendszereken túl.
Az új, trendi technológia körüli felhajtás azonban megakadályozza, hogy a potenciális felhasználó minőségi megoldásokat válasszon. Ez a felhajtás gyakran magas elvárásokhoz, majd az ügyfél csalódottságához vezet. Valóban a mesterséges intelligencia által vezérelt videoelemzés lehet a kulcsa a videofelügyelet technológiai áttörésének? Megnézzük, mire képes a technológia, mire nem, és hova tud eljutni innen.
Technológiai áttörés vagy csak egy újabb buborék?
Gyakran mondják, hogy a videókezelő szoftverek (VMS) piaca egyre inkább árucikkekké válik, és egyre szélesebb körben elérhetővé válik. Sok hasonló tulajdonságú termék (vagy legalábbis a gyártó hasonló ígéretei) megnehezíti a választást. Ennek eredményeként a szállítók nevei és hírneve az egyik elsődleges értékesítési pontjukká válik. A gyártók két választási lehetőség közül választhatnak: árháborúba keverednek, és a kiadások csökkentésére hagyatkoznak, vagy olyan terméket kínálnak, amely valóban innovatív és forradalmi.
A második utat választó VMS-fejlesztők olyan termékek megalkotása felé igyekeznek, amelyek neurális hálózatokon és mély tanuláson alapuló mesterséges intelligenciát használnak. A két-három éve feltörekvő mesterséges intelligencia-videóanalitikai piac növekedési fellendülést tapasztal. Ez az új technológiai hullám felkavarta a VMS világ mozdulatlan, stagnáló holtágait, és bizakodásra ad okot a kisebb fejlesztőknek. Úgy tűnik, most van esélyük arra, hogy piacvezetőkké váljanak a következő néhány évben.
A népszerű trend körüli felhajtás azonban ésszerű aggodalmakat ébreszt a tapasztalt biztonsági iparági szakemberek körében. Ezek az aggodalmak a problémáikra megoldást kereső ügyfelektől és a hosszú távú fejlesztési stratégiát kidolgozó beszállítóktól származnak. Ez nagymértékben hasonlít egy másik technológiai buborékra, mint amilyen az AI előtti videóelemzés köré épült, és akkor robbant ki, amikor világossá vált, hogy a körülötte lévő szenzációs ígéretek pusztán marketing hype (és meglehetősen gátlástalanul) voltak. Számos tényező azonban arra utal, hogy a mesterséges intelligencia által működtetett videó megfigyelő rendszerek nem egy újabb buborék.
A három tényező
Az első – és a fő – az ügyfelek webhelyein már működő rendszerekből származik. Ugyanazokat az ígéreteket teljesítik, amelyeket az előző buborék idején a forrófejűek tettek, miközben megtanítják a számítógépet az események valós idejű elemzésére, klasszikus algoritmikus megközelítéssel.
A második az, hogy ebbe az új technológiába nem csak a szoftver- és felhőalapú startupok, hanem a megalapozott VMS-fejlesztők is fektettek be. Még az olyan óriáscégek is, mint az Intel, amely a neurális hálózati gyorsító hardverek teljes sorát és olyan szoftvereszközöket mutatott be, amelyek leegyszerűsítik a velük való munkát, különösen a számítógépes látás területén.
A harmadik tényező a mesterséges intelligencia képességeiben rejlik. A mesterséges intelligencia sakkozik, autókat vezet, és sok más területen is csodákat művel. Miért ne lehetne alkalmazni a videó megfigyelésre és elemzésre?
Mégis mire képes a mesterséges intelligencia? Mit tud a mesterséges intelligencia a videó megfigyelő rendszerekben a fejlesztés ezen szakaszában? Nem tudja teljesen elemezni az események sorozatát és megérteni a kamerák látómezejében történõ „logikát”. Valószínű, hogy a mesterséges intelligencia megtanulja ezt a következő néhány évben. A neurális hálózati elemzés már nagyon jól képes észlelni, osztályozni és nyomon követni az objektumokat, nagy pontosságot biztosítva még forgalmas jelenetekben is. A mesterséges intelligencia a való világban felhasználható:
- füst és láng észlelése a korai tűzjelzéshez nyílt területeken (erdő, nyílt raktár, parkoló stb.);
- megkülönböztetni az embereket/járműveket az állatoktól és más mozgó tárgyaktól, pl. a natúrpark határának védelme az orvvadászoktól;
- Megkülönböztetni a sisakot és védőruházatot viselő személyt a nem viselőtől, hogy elkerülje a veszélyes üzemben vagy építkezésen bekövetkezett baleseteket;
- meghatározott típusú objektumokat számol, pl. autók parkolóban, emberek az eladótérben, szállítószalagon mozgó áruk stb., nem biztonsággal kapcsolatos megoldásokban.
Ez csak néhány példa. Egy neurális hálózat betanítása után más, hasonló feladatokat is meg tud oldani. Általában egy adott körülmények között kiképzett neurális hálózat nem replikálható. Más szóval, nem működik olyan jól különböző körülmények között. Másrészt a fejlesztők megtanulták, hogyan lehet gyorsan betanítani az AI-t egy adott projekt igényeire. A legfontosabb követelmény az, hogy elegendő videóanyag legyen
Ettől némileg eltér a neurális hálózatok használata az arc- és az automatikus rendszámfelismerésben. Ez egy példa a reprodukálható neurális hálózatokra (egyszer betanítja és bárhol telepítheti), ami kereskedelmi szempontból vonzóbbá teszi őket. Ha a nem reprodukálható neurális hálózatok csak a közelmúltban váltak gazdaságilag megvalósíthatóvá a speciális hardverek (például az Intel terméke) gyors fejlődése miatt, azonban az AI használata az arcfelismerésben és az ANPR-ben már régóta bevált.
Az AI-analitika másik fajtája, amelyet megvizsgálunk, a viselkedéselemzés. Ez a funkció, valószínűleg jobban, mint bármely más, közelebb hozza a videó megfigyelő rendszereket ahhoz, hogy megértsék, mi történik a kamerán. A benne rejlő lehetőségek hatalmasak.
Hogyan működik a viselkedéselemzés
Technikai szempontból a viselkedéselemzés ötvözi a mesterséges intelligenciát a klasszikus algoritmikus megközelítéssel. Egy sokféle forgatókönyvre kiképzett neurális hálózat képes meghatározni az emberek testének, fejének és végtagjainak helyzetét a kamera látóterében. Az algoritmus egy adattömböt ad ki, amely a pózok leírását tartalmazza.
Feltételek állíthatók be az adatokhoz egy adott póz, például felemelt kezek, elesett vagy guggoló személyek észleléséhez. A fejlesztők ennek segítségével gyorsan létrehozhatnak új észlelési eszközöket a kormányzati vagy üzleti ügyfelek által meghatározott potenciálisan veszélyes viselkedések azonosítására. Nincs szükség a neurális hálózat további képzésére.
Hogyan lehet bevezetni a viselkedéselemzést
Az ATM mellett leguggolt személy lehet akár egy technikus, pénzszállító őr vagy betörő. A bank őreit minden esetben értesíteni kell.
Egy lövöldözős pozícióban lévő személy, valamint egy banki alkalmazott vagy pénztáros felemelt kézzel rablást jelezhet. A rendszer konfigurálható úgy, hogy automatikusan riasztásokat küldjön egy megfigyelési pillanatfelvétellel a rendőrségnek, így felmérhetik a fenyegetést, és szükség esetén intézkedhetnek. Létfontosságú, hogy a rendőrség megkapja a riasztást, még akkor is, ha az alkalmazott nem tudja aktiválni a riasztót.
Sok esetben a figyelmet egy elesett emberre kell irányítani. Ez lehet valaki, akinek azonnali segítségre van szüksége, vagy valaki, aki nem megfelelő nyilvános helyen alszik, például egy éjjel-nappali ATM-térben.
A viselkedéselemzés a munkahelyi biztonság biztosítására is használható. Például annak nyomon követése, hogy az alkalmazottak fogják-e a korlátot, amikor a lépcsőt használják egy gyártási létesítményben vagy egy építkezésen.
És most?
A viselkedéselemzés bárhol bevethető, ahová csak az ügyfelek fantáziája viszi őket. Ezzel a funkcióval gyakorlatilag minden olyan póz észlelhető, amely potenciálisan veszélyes viselkedésre utal. A riasztásra adott időben történő reagálás segít elkerülni az anyagi károkat vagy más esetekben a baleseteket.
A viselkedéselemzés egyik lehetséges fejlesztési területe az a képesség, hogy egy személy pózainak sorozatát, vagy több egyén pózainak és egymáshoz viszonyított pozícióinak kombinációját elemezzük. Ez lesz a mesterséges intelligencia videófelügyeleti felhasználásának következő szintje: az „észlelésről” a viselkedés valós idejű „megértésére” való átállás.
A legalapvetőbb formájában az ilyen típusú elemzések a büntetés-végrehajtási intézetekben a keresési eljárástól való eltérések észlelésére használhatók, amikor az ellenőrzött személynek előre meghatározott pózsorozatot kell felvennie. Egy fejlettebb forma lehetővé teszi bármilyen rendellenes viselkedés észlelését, például egy nyilvános helyen kitörő verekedést. Ideális esetben a viselkedéselemzés képes előre jelezni a veszélyes helyzeteket az összegyűjtött statisztikákból és a Big Data elemzéséből származó szinte észrevehetetlen jelzések alapján.
Jelenleg ez tiszta fantáziának tűnik, de ami nem túl régen még hóbortosnak tűnt, az mára a mesterséges intelligencia kapcsán valósággá vált. Már legyőzték az embereket a sakkban és a Go (Weiqi) játékban. Képes lesz-e a mesterséges intelligencia egy napon felülmúlni az embereket a színjátékokon? Teljesen lehetséges, hogy hamarosan mi magunk is meglátjuk.
Egy cikk a www.securityinformed.com.