Nejdou načítat nové keše z určité IP adresy

Ahoj, mám velký problém, nejdou mi načítat nové keše z určité IP adresy, chybová hláška curl je prostě timeoout spojení. Ale doma mi to funguje bez chyby (na gc.com chyba nebude). Před 3 měsíci to fungovalo. Nevíte jak to opět zprovoznit?

Zkousel si jiny dns?

TimesNewYourk: nepřehnal si to s počtem a rychlostí přístupů z té určité adresy na gc.com?

Nene, nahradil jsem url ip adresou a stále chyba:


errno:28
text chyby "connect() timed out!" 

Počet přístupů jsem omezil na jednou za 7 minut, v praxi se seznam načítal tak po 11-14 minutách.
Ono by šlo samozřejmě si přesunou skript na jiný hosting, ale to až kdyby to holt jinak nešlo.

A traceroute mas moznost zkusit? Kde to konci…

jak použiju traceroute na freehostingu? případně poradit freehosting s domenou 3. řádu?

pokud ses treba pokazde prihlasoval, tak Groundspeaku muselo byt jasne, ze jde o robota a mohli zabanovat IP.

nepřihlašoval. Jak to souvisí s přihlášením?

Protoze to je ukazatel, ktery groundspeak sleduje.

Neni to spis tim, ze ten web nejede, respektive je pretizenej?

Jo teď se to pěkně s… Chvíli to jede, pak zahlasí error a tak pořád dokola. Ještě že nic nepotřebuju* B)

Ne, web není přetížen (gc.com ani ten, kde to mám uloženo (např. tomu budu říkat freehost.cz)). Říkám, že z domova (apache) to funguje. Takže z nějakého důvodu se freehost.cz nepřipojí na gc.com (ban IP, nenejdeDNS—)- Nebo je problém na straně freehost.cz, že se nechce připojit).

nevíte jak tedy diagnostikovat na freehost.cz, kde je chyba? Tracert si tam nespustím, wireshark taky ne.

Je tedy možné, aby blokovali IP, i když se nepřihlašuju?

PS: to, že se nepřihlašuju bohužel způsobí, že cache mají záměrnou odchylku (asi ±30m)

Ja kdyz si dam traceroute na GC.com, tak mam skoro 30 preskoku, no tak je klidne mozny, ze jeden ten server v ceste vrati TimeOut.

no jo, ale traceroute trvá délé než normální http požadavek.
Pro srovnání :http://www.geocaching.com/map/default.aspx/MapAction:
prohlížeč: 3s
skript na localhostu také 3s (nebereli se údaj z cache)
na hostingu jsem timeout (curl requestu) zvýšil na 60s a i v tom případě to zahlásí timeout. Zvláštní, před 2 měsíci OK a provozuji to už přes rok.

A co ti ten webhosting presne dela? Kombajnuje web GC.com?

IMHO ti tu IP zabanovali. Jestli z nějaké IP chodí s železnou pravidelností každých X sekund požadavek na stránku s novými pixlami a o nic jiného z gc.com ta IP zájem nemá, tak je jasné, že je to skript a ne člověk, byť by to X bylo poměrně hodně. Mohlo by pomoct vnést do toho intervalu jistou náhodnost a občas požádat i o jinou stránku.

TNY: predpokladam, ze ten webhosting nemas pre free wifi nebo tak neco. Anebo ze nejedes pres anonymous server kvuli jinym situm. Na druhou stranu pres den hlasi timeouty i obycejny seznam.cz. Ten tvuj webostingserver je primo na backbonu nebo se tam dostavas pres jine poskytovatele? Jinak ti dal nic uz neporadim. :frowning:

Jakýkoliv strojový sběr dat je proti guidelines, ať již to dělá cokoli, není tedy divu, pokud ti to GS zařízl.

A přímo k tématu, nejdřív si ten skript vylaď na stroji který máš správcovsky pod kontrolou, abys viděl co to vlastně dělá, jestli se z toho stroje normálně připojíš, kudy to leze, atd., až pak to implementuj na nějaký free server, který nemáš plně pod kontrolou.

TNY: Jinak můžeš se pochlubit jaké data to tahá a co to s nimi následně provádí ? Chceš říct, že to jede pořád a s železnou pravidelností to graguje jejich databázi ? Musí to být online a stojí ten výsledek za to, aby se nedalo pracovat s normálním pq ?

viz konec postu

nerozumim
timeout na seznamu jsem nikdy nezažil. Zatímco gc.com jsou výpadky poměrně značné.
Informaci o umístění serveru nevím.

[quote]
Pinokio.CZ napsal/a:
Vyladěno to mám na localhostu (doma), kde to běží OK.
Musí to být online a stojí ten výsledek za to, aby se nedalo pracovat s normálním pq ? — Upřesni otázku…

Funguje to tak, že při otevření stránky na (na localhostu nebo nefunčně na webuservru):

  1. zkontrolujou se data v cache, pokud jsou starší než 8 minut, získají se post/json/ajax requestem na url "http://www.geocaching.com/map/default.aspx/MapAction" (hlavička requestwith xmlhttp… a contenttype app/json), v post je json struktura určující obdélník na mapě. Keší musí být méně než 500. Nemusím být přihlášen, ale výsledky obsahují chybu ±30metrů. *(pozn2)
  2. data se trochu vyčistí, opraví lomítka a vrátí se json_decode vrací objekt.
  3. Projdu posledních (třeba) 5 keší a je li nějaká nová, pošlu mail–>SMS ([email protected]) . (názvy posledních 5 keší mám taky v cache)
  4. Vytvořím RSS obsahující 5 těchto keší.

pozn1: Žádný cron tam neběží, proto si musím url zaregistrovat na odber RSS (např seznam.cz, oogle reader, kteří semtam (20min) našítají).
pozn2: nepřesnost … - díky s4t7n. Nepřesnost mě nazabije, většinou ihned po příchodu sms se podívám na net. (Tehdy to bylo vtipné když jsem jel na ftf, a hledal jsem půl hodiny a až pak se připojil pomocí drahho gprs a zjistil že cache je o 30m jinde)

No, ja byt groundspeakem a videl bych , jak se mi takhle porad neco snazi hrabat na starou verzi mapy, ktera uz byla nahrazena jinou, tak bych te taky zabanoval. :wink: To je az prilis okata akce.