Walidacja krzyżowa (purged + embargo)

Wariant walidacji krzyżowej dla danych zależnych w czasie: do zwykłego podziału na części dokłada purging i embargo, żeby zamknąć przeciek.

Zwykła losowa walidacja krzyżowa dzieli dane na kilka części i po kolei używa każdej jako testowej, a reszty jako treningowej. W szeregach czasowych bywa niewiarygodna, bo sąsiednie obserwacje są powiązane i informacja przecieka między częściami. Purging usuwa z treningu te obserwacje, których okno informacyjne lub etykieta nachodzi na okno testowe. Embargo dokłada bufor czasowy zaraz po oknie testowym i tam również wycina trening. To rodzina metod purged k-fold oraz CPCV: pokrewna, ale nie tożsama z CSCV używaną w oryginalnym rachunku PBO.

Powiązane pojęcia

  • Przeciek danych
  • Walk-forward
  • PBO