Srovnávadlo.cz na vzestupu

Posted 17. 08. 2009 / By Petr Soukup / srovnavadlo.cz

Předevčírem jsem tu psal o spuštění projektu Srovnávadlo.cz a už tu mám další novinky. Abych pravdu řekl, vůbec jsem nečekal, že to půjde takhle dobře. Když jsem se včera ráno díval na velikost databáze, tak bylo načteno 26 000 položek. A kolik jich je teď? Neuvěřitelných čtvrt milionu! Samozřejmě, že to rozhodně není dost. Ale už je to soubor dat, se kterými se dá pracovat. Nyní můžeme konečně pořádně zkoušet vyladění relevance hledání i optimální zobrazování.

Srovnávadlo.cz je v základu nevýdělečný projekt, protože generuje jen náklady – nikde žádná reklama, žádné přednostní výpisy, nic. Vzhledem k počtu reakcí (a hlavně kladných!) i tomu, že jde o neziskový projekt jsem si řekl, že bych tu mohl postupně zveřejňovat zákulisní informace o vývoji, problémech, chystaných vylepšeních a podobně.

První problémy?

Podle očekávání je problém s XML soubory. Zboží.cz a podobné mají evidentně benevolentnější parser. Poměrně velké množství obchodů má ve svých XML chyby. Nejčastěji jde o neošetřené entity (například & v adrese), ale kupodivu i úplně rozhozené kódování (tvrdí o sobě, že je CP1250, ale znaky jsou v UTF-8). Přemýšlím, co s tím budeme dělat. Samozřejmě je tu možnost nedělat nic a maximálně posílat automatické emaily, že je XML špatně. Ale například v případě chybných & by mělo jít takové XML opravit na naší straně. U kódování je to horší – je zde riziko, že pak opravovací skript odchytí něco chybně a pak zkoní kódování e-shopu, který má XML dobře, ale pouze obsahuje exotické názvy.

Také se objevují experti, kterým je úplně jedno, že XML má nějaký daný formát a cpou nám úplně jiné. I zde je teoreticky možnost takové XML poznat a pokud je to známý typ, tak ho převést. Jenže…

Všechny tyhle úpravy zaberou jednak čas, ale hlavně výkon serveru. Je tedy otázkou, jestli se zdržovat s chybnými XML nebo raději více sil věnovat na ladění relevance apod.

Mimochodem nejvíc mě baví experti, kteří do políčka pro XML zboží.cz i heuréky nacpou stejnou adresu :)

Hromadný import

U podobných služeb mi vždycky vadilo, že není možné nějak hromadně přidat weby. Srovnávadlo má aktuálně XML bránu pro import obchodů kvůli našim e-shopům. Jakmile se pod Simplií spustí e-shop, rovnou se přidá do Srovnávadla. Přemýšlím, že bychom možnost tohoto napojení dali i veřejně. Jenže je otázkou, kdo by to využil. Skoro mi přijde, že Simplia je asi tak jediný provozovatel, který něco takového může provést.

Jak už jsem zmínil, tak se Srovnávadlo mezi eshopisty zatím docela zalíbilo. Je vidět, že prapodivné řazení Zboží.cz leze krkem i někomu jinému než mě :) Děkuji Vám za podporu a budeme rádi, když se o Srovnávadle zmíníte, kde můžete. Zároveň bych Vás rád poprosil o spolupráci – pokud narazíte na něco, co se řadí jinak než by mělo, tak dejte vědět. Mějte ale na paměti, že ještě nemáme dost e-shopů na regulérní provoz, takže některé zboží v databázi zkrátka není.

A mimochodem – jsme na Facebooku :)

Tags: srovnávadlo, srovnavadlo.cz

« Nový zbožový vyhledávač

Pokračování workshopu »