20 Feb 2024 | Notion

Model training

Evaluation (on COCO2017 val) pretrained-tiny:

Deformable kernel visualization

Notes:

Ir diva veida pētījumi, kas cenšas uzlabot objektu detekcijas modeļus:

Tie kas uzlabo kādu beigu mehānismu vai trenēšanas shēmu, ex. Co-DETR
Tie kas izveido jaunu apstrādes mehānismu un mugurkaulu, ex. InterniMage (deformable convolution)

Otrie no šiem trenē arī klasifikācijas modeli, un tad šo pretrainoto modeli izmanto lai inicializētu objektu detektora mugurkaulu. Recepte, ko redzu visos pētījumos ir:

Imagenet1K uz 300 epokiem
Mask-rcnn + pretrained uz 12 epokiem

Tas rada jautājumu uz ko tad fokusēties? Un ja es vēlētos fokusēties tieši uz konvolūcijas/uzmanības mehānisma izstrādi, tad sanāk ka vajadzētu trenēt arī attēlu klasifikācijas tīklu.

Izrādās, ka COCO test-dev sets nav publisks, un lai iegūtu metrikas ir jāsūta minējumi viņiem

Pievienoju SLR beigās 3 ļoti nesenus, interesantus pētījumus par deformējamo uzmanību, un līdzīgiem mehānismiem. Vienīgais vēl jāpalasa dziļāk.