Hallo,
Om Google en co wat wegwijs te maken op mijn bescheiden homepage, heb ik een robots.txt en sitemap.xml toegevoegd. De robots.txt moet verwijzen naar de bijhorende sitemap, en ziet er als volgt uit:
De sitemap wordt automatisch gegenereerd, via een aaneenschakeling van 2 plugins (1 voor Wordpress, en 1 voor de wiki), die beide een sitemap conform de regels opstelt. Het resultaat is dit.
Het probleem is echter wat google doet met de sitemap: hij negeert vrolijk 38 van de 43 urls! Volgens de details althans die ik op webmastertools.google.com vind:
Als ik een google query uitvoer die alle pagina's van mijn site toont, krijg ik iets meer resultaten, maar nog niet allemaal. Elke url in de sitemap die naar een deel van mijn blog wijst, wordt niet geindexeerd...
En ik kan maar niet vinden aan wat dat ligt
De URL's kloppen volledig, de /blog/ directory bevat geen htaccess die de bot tegenhoudt, requests naar een blog page leveren een mooie HTTP 200 op (en geen redirect naar een andere pagina), het formaat van de URL's is identiek in de sitemap.xml, ...
Wat ik zelf vreemd vind, is dat alle Wiki pagina's (gegenereerd door plugin A) te vinden zijn in Google, maar alle pagina's van mijn blog (gegenereerd door plugin
, en manuaal toegevoegde url's (via de GUI van plugin
nergens terug te vinden zijn. Het doet me vermoeden dat het formaat van wat beide plugins genereren, verschillend zou moeten zijn, maar helaas kan ik geen verschillen vinden (zelfde endlines, beide gebruiken tabs en geen spaties, datum formaat is hetzelfde, alle entries komen overeen, .......).
Een link die bijvoorbeeld niet door Google aanvaard wordt, is: http://maleadt.no-ip.org:8080/blog/?p=12
Vandaar deze topic
Alle reacties zijn welkom
maleadt
Om Google en co wat wegwijs te maken op mijn bescheiden homepage, heb ik een robots.txt en sitemap.xml toegevoegd. De robots.txt moet verwijzen naar de bijhorende sitemap, en ziet er als volgt uit:
code:
1
2
3
| User-Agent: * Disallow: /folder_die_bots_niet_horen_te_zien/ Sitemap: http://maleadt.no-ip.org:8080/sitemap.xml |
De sitemap wordt automatisch gegenereerd, via een aaneenschakeling van 2 plugins (1 voor Wordpress, en 1 voor de wiki), die beide een sitemap conform de regels opstelt. Het resultaat is dit.
Het probleem is echter wat google doet met de sitemap: hij negeert vrolijk 38 van de 43 urls! Volgens de details althans die ik op webmastertools.google.com vind:
code:
1
2
| Totale aantal URL's in sitemap: 43 Geïndexeerde URL's in sitemap: 5 |
Als ik een google query uitvoer die alle pagina's van mijn site toont, krijg ik iets meer resultaten, maar nog niet allemaal. Elke url in de sitemap die naar een deel van mijn blog wijst, wordt niet geindexeerd...
En ik kan maar niet vinden aan wat dat ligt

Wat ik zelf vreemd vind, is dat alle Wiki pagina's (gegenereerd door plugin A) te vinden zijn in Google, maar alle pagina's van mijn blog (gegenereerd door plugin
Een link die bijvoorbeeld niet door Google aanvaard wordt, is: http://maleadt.no-ip.org:8080/blog/?p=12
Vandaar deze topic
maleadt
offtopic:
Niet letten op de misplaatste H2, moet ik vanavond nog eens fixen
Niet letten op de misplaatste H2, moet ik vanavond nog eens fixen
[ Voor 5% gewijzigd door maleadt op 29-11-2008 16:06 . Reden: Toevoeging van een URL. ]