Cu aproape o luna in urma am scris despre acest experiment: se creaza un website in SVG folosind exclusiv Inkscape, se pune pe web, se agauga un numar mare de linkuri catre el, apoi se asteapta pentru a vedea daca si cum este indexat de motoarele de cautare (in special de Google, dela care asteptarile sint cele mai mari).
Rezultatele ar fi putut fi prezentate mai de mult, dar o gresala prosteasca a general intirziere.
Gresala prosteasca
Pentru a servi un site in intregime ca SVG trebuie pus un fisier SVG (index.svg in cazul de fata) ca DirectoryIndex in configuratia Apache. Din cauza lipsei de acces la httpd.conf, a fost folosit .htaccess, ceea ce este in regula.
Nu la fel de in regula a fost prostia autorului: la citeva zile dupa ce siteul a fost pus online, avind nevoie de un fisier .htaccess in alt subdomeniu, l-a folosit pe cel din subdomeniul SVG ca template. Facind managementul fisierelor cu drag and drop folosind Nautilus peste SSH, acesta a fost mutat in loc de a fi copiat, si directorul a fost expus timp de citeva zile fara a avea un fisier index. Suficient pentru Googlebot, care deja de citeva zile tot incerca sa il indexeza, datorita multimii de linkuri postate.
Concluzie
S-a ajuns la concluzia asta dupa numai o saptamina, dar s-a asteptat o intreaga luna in inceracrea de a repara gresala descrisa mai sus. Concluzia este: nici un motor de cautare important nu indexeaza un site facut complet in SVG, nu va urma linkurile din acesta si nu va include textul.
Logurile arata un numar mare de vizite de la spideri: Googlebot, Yahoo Slurp, MSN Bot, chiar si de la botul Baidu, dar tot ce fac acestea e sa ceara radacina siteului ("/") si eventual robots.txt, deci linkurile nu sint urmate. (robots.txt a fost lasat gol intentionat, scopul experimentului a fost sa se vada ce fac motoarele de cautare prin propriile mijloace).
In interiorul paginilor SVG au fost puse citeva stringuri unice, pentru a efectua mai tirziu cautari pe baza lor. Bineinteles ca aceste cautari nu returneaza nici un rezultat, paginile nu au fost indexate si nu e poate face cautare full-text.
Google Webmaster Tools spune "Googlebot last successfully accessed your home page on Jun 19, 2007", ziua in care nu a existat .htaccess si index.svg nu a fost servit ca DirectoryIndex.
Multumiri
Proiectul a generat mult interes, au fot postate multe linkuri catre acest experiment si in consecinta au fost facute multe vizite de catre diversi boti. Multumiri tuturor!
Dar nici o multumire pentru motoarele de cautare, care nu sint capabile sa indexeze pagini facute cu SVG, a un standard W3C. Sa va fie rusine!
vineri, iulie 13, 2007
Progres: Crearea websiteurilor SVG cu Inkscape
Abonați-vă la:
Postare comentarii (Atom)
Niciun comentariu:
Trimiteți un comentariu