Pár set duplicitních logů

kiReGPS · leden 3, 2012, 4:21odp.

Konečně jsem se rozhoupal předělat naše statistiky pod GeoGet a GgStat. Původní kombinace půlky z GSAKu a půlky z GgStatu už byla vážně neudržitelným slepencem. Základ - seznam nalezených kešek v GeoGetu byl, tak se zdálo, že půjde o snadnou misi a nejvíc času strávím na různých kudrlinkách a zbytečnostech typu "Jakých nejvíc typů keší v co nejvíce státech jsme našli na jaře za tmy v nadmořské výšce 1000+"…B)

Trápí mne ale úplně jiná věc. Přestože databáze je původní a pouze jsem na základě šablony Template.tabmenu.cz stvořil svou verzi http://kiregps.sweb.cz/temp/Template.tabmenu.cz.my, statistika obsahuje 2253 nálezů místo správných 1942. Přitom původní template (http://kiregps.sweb.cz/temp/Template.en.my) nad stejnými daty dává správný výsledek, i spuštěcí BAT je (až na jméno šablony) identický.

Zkoumal jsem GeoGet, který vytrvale ukazuje správné počty keší (těch 1952 ks je součet 1942 nalezených a 10 vlastních, zbylá vlastní je adoptovaná a tedy dříve zároveň nalezená):

Databáze tedy obsahuje duplicitní logy. Potvrzeno u starších keší, kde je to vidět i v náhledu listingu:

Nevím, jak se to stalo. Pravdou je, že jsem databázi aktualizoval různě, občas i pomocí GeoJarry. Divné je, že se starou šablonou se duplicity nepočítají a že nelze sjednat nápravu doporučeným postupem (Databázové nástroje - Oprava databáze - Odstranění zapomenutých záznamů).

Než začnu psát nějaké zoufalé skripty, prosím o radu a pomoc. Přece si nebudu nahánět body tímto způsobem.

Předem díky…!

P.S.
Když už jsem v těch dotazech. Poradí mi někdo, jak do tabulky FTF dostat pořadové číslo FTF (ne tedy standardně zobrazované pořadové číslo nalezené kešky)?

HaLuMa · leden 3, 2012, 4:28odp.

Duplicitni logy bude asi nejaky historicky problem, treba kdysi importovana data v dobe, kdy blblo nejake parsovani webu. Kdyz se totiz nepodarilo zjistit spravne ID logu, tak se nedokazalo poznat, ze tam ten log uz je.

Kazdopadne dobra pripominka, zrovna pisu ruzne opravne skriptiky, tak zkusim vyrobit i opravu na toto.

kiReGPS · leden 3, 2012, 4:30odp.

Předem moc děkuji. Opravdu nerad bych se uchyloval zpátky ke slepenci. GeoGet je totiž skvělej nástroj. Velké díky za něj…!

Btw - proč to proboha se starou šablonou nedělá…?!? Vznik duplicit si dovedu snadno představit, ale tohle mi rozum nebere.

rsc_cz · leden 3, 2012, 4:53odp.

Nebylo by nejjednodušší všechny logy u nalezených cachešek smazat a ty vaše doplnit přes MFPQ?

kiReGPS · leden 3, 2012, 5:00odp.

Klidně. Jen jsem nenašel mazání logů v menu. Musím skriptíkem…?!?
Šlo by taky vytvořit celou db znovu, ale to bych potřeboval vysypat tag FTF a pak do čerstvé znovu nahrát. Ručně by se mi to dělat nechtělo…:DB)

plavcik · leden 3, 2012, 5:28odp.

Brutálnější varianta by byla smazat z databaze všechny keše s nalezy a znovu je přes MFPQ natáhnout. Ale to bys prisel o vyluštěne finalky…

EDIT: Hm, a o ty FTF a případně další tagy bys přišel vlastně taky. To byla ale blbá rada :|:|

LudaL · leden 3, 2012, 5:32odp.

Mám dojem, že mě to dělalo taky a zjistil jsem, že je novější template nějaké přepínátko, které ty duplicitní potom odstraňuje. Ale je popsané nějak nezrozumitelně, zkus ty template porovnat. Nebo dělá něco jiného a tohle byl jen vedlejší efekt.
EDIT: Zkus dát SORTFOUNDBY time. Když tam je all, tak to myslím počítá i ty duplicitní logy. Ale už si tím nejsem jistý, je to přes rok co jsem to řešil.

kiReGPS · leden 3, 2012, 5:34odp.

Srovnával jsem, srovnával. Pokud tam je, je popsané hodně nesrozumitelně…B)

EDIT:
Do příkazu START se template liší jen v direktivě OWNERID 1449804 kiReGPS, kterou jsem ale doplňoval v rámci boje o správný výsledek.

HaLuMa · leden 3, 2012, 6:27odp.

Nebylo. Tim bys opravil jen svoje nalezene kesky ale vsechny ostatni ne. Polovicate reseni.

jednoduzsi a mnohem rychlejsi bude prolitnout vsechny logy v databazi a pripadne zmetky smazat. Neni lepsi si pockat na toto ciste reseni?

kiReGPS · leden 3, 2012, 6:47odp.

Šikulka! Díky! Pomohlo! Sortuje podle času a tím se potlačí duplicity se stejným časem. Možná na hustý powertraily to bude problém, ale tady to provizorně pomáhá.

EDIT: Navíc se takhle statistika generuje 10x rychleji…!

Díky samozřejmě i HaLuMovi za finální opravu, která nebude závislá na duchařských vedlejších efektech třídění.

HaLuMa · leden 3, 2012, 9:50odp.

Tak, v priloze by mel byt maly plugin, ktery probehne vsechny logy v databazi, a smaze ty logy, ktere maji prazdne, nebo vadne ID logu.

To by melo smazat vsechny pripadne duplicity. Pokud i tak nejaka duplicita zustane, pak je ten log v databazi skutecne dvakrat s ruznymi ID a velmi pravdepodobne se skutecne jedna o rozdilne logy.

kiReGPS · leden 3, 2012, 11:10odp.

Jejej, to byl fofr…! Velký díky. Jen mne prosím lehce pošťouchni, jak to spustit. Nakopíroval jsem do data/script, ale ať hledám jak hledám…B)

EDIT: Ufff, už jsem to našel. Minutu po napsání logu…
Odstranil 1077 logů…
Chachááá. A je to špíglglanc, jak u nás řikáme…!

Ještě jednou velký díky a poklona za rychlost!

kiReGPS · leden 10, 2012, 2:34odp.

Vyřešeno, ještě jednou díky a zamykám…