Konečně jsem se rozhoupal předělat naše statistiky pod GeoGet a GgStat. Původní kombinace půlky z GSAKu a půlky z GgStatu už byla vážně neudržitelným slepencem. Základ - seznam nalezených kešek v GeoGetu byl, tak se zdálo, že půjde o snadnou misi a nejvíc času strávím na různých kudrlinkách a zbytečnostech typu "Jakých nejvíc typů keší v co nejvíce státech jsme našli na jaře za tmy v nadmořské výšce 1000+"…B)
Trápí mne ale úplně jiná věc. Přestože databáze je původní a pouze jsem na základě šablony Template.tabmenu.cz stvořil svou verzi http://kiregps.sweb.cz/temp/Template.tabmenu.cz.my, statistika obsahuje 2253 nálezů místo správných 1942. Přitom původní template (http://kiregps.sweb.cz/temp/Template.en.my) nad stejnými daty dává správný výsledek, i spuštěcí BAT je (až na jméno šablony) identický.
Zkoumal jsem GeoGet, který vytrvale ukazuje správné počty keší (těch 1952 ks je součet 1942 nalezených a 10 vlastních, zbylá vlastní je adoptovaná a tedy dříve zároveň nalezená):
Databáze tedy obsahuje duplicitní logy. Potvrzeno u starších keší, kde je to vidět i v náhledu listingu:
Nevím, jak se to stalo. Pravdou je, že jsem databázi aktualizoval různě, občas i pomocí GeoJarry. Divné je, že se starou šablonou se duplicity nepočítají a že nelze sjednat nápravu doporučeným postupem (Databázové nástroje - Oprava databáze - Odstranění zapomenutých záznamů).
Než začnu psát nějaké zoufalé skripty, prosím o radu a pomoc. Přece si nebudu nahánět body tímto způsobem.
Předem díky…!
P.S.
Když už jsem v těch dotazech. Poradí mi někdo, jak do tabulky FTF dostat pořadové číslo FTF (ne tedy standardně zobrazované pořadové číslo nalezené kešky)?
Duplicitni logy bude asi nejaky historicky problem, treba kdysi importovana data v dobe, kdy blblo nejake parsovani webu. Kdyz se totiz nepodarilo zjistit spravne ID logu, tak se nedokazalo poznat, ze tam ten log uz je.
Kazdopadne dobra pripominka, zrovna pisu ruzne opravne skriptiky, tak zkusim vyrobit i opravu na toto.
Klidně. Jen jsem nenašel mazání logů v menu. Musím skriptíkem…?!?
Šlo by taky vytvořit celou db znovu, ale to bych potřeboval vysypat tag FTF a pak do čerstvé znovu nahrát. Ručně by se mi to dělat nechtělo…:DB)
Mám dojem, že mě to dělalo taky a zjistil jsem, že je novější template nějaké přepínátko, které ty duplicitní potom odstraňuje. Ale je popsané nějak nezrozumitelně, zkus ty template porovnat. Nebo dělá něco jiného a tohle byl jen vedlejší efekt.
EDIT: Zkus dát SORTFOUNDBY time. Když tam je all, tak to myslím počítá i ty duplicitní logy. Ale už si tím nejsem jistý, je to přes rok co jsem to řešil.
Šikulka! Díky! Pomohlo! Sortuje podle času a tím se potlačí duplicity se stejným časem. Možná na hustý powertraily to bude problém, ale tady to provizorně pomáhá.
EDIT: Navíc se takhle statistika generuje 10x rychleji…!
Díky samozřejmě i HaLuMovi za finální opravu, která nebude závislá na duchařských vedlejších efektech třídění.
Tak, v priloze by mel byt maly plugin, ktery probehne vsechny logy v databazi, a smaze ty logy, ktere maji prazdne, nebo vadne ID logu.
To by melo smazat vsechny pripadne duplicity. Pokud i tak nejaka duplicita zustane, pak je ten log v databazi skutecne dvakrat s ruznymi ID a velmi pravdepodobne se skutecne jedna o rozdilne logy.