Ir diva veida pētījumi, kas cenšas uzlabot objektu detekcijas modeļus:
Otrie no šiem trenē arī klasifikācijas modeli, un tad šo pretrainoto modeli izmanto lai inicializētu objektu detektora mugurkaulu. Recepte, ko redzu visos pētījumos ir:
Tas rada jautājumu uz ko tad fokusēties? Un ja es vēlētos fokusēties tieši uz konvolūcijas/uzmanības mehānisma izstrādi, tad sanāk ka vajadzētu trenēt arī attēlu klasifikācijas tīklu.
Izrādās, ka COCO test-dev sets nav publisks, un lai iegūtu metrikas ir jāsūta minējumi viņiem
Pievienoju SLR beigās 3 ļoti nesenus, interesantus pētījumus par deformējamo uzmanību, un līdzīgiem mehānismiem. Vienīgais vēl jāpalasa dziļāk.