Generierung manipulierter URLs

Alles über die Anwendung und Entwicklung von AddOns.

Generierung manipulierter URLs

Beitragvon Katharina-in-Berlin » 26. Jan 2012, 09:51

Hallo zusammen,
von meiner Page http://goo.gl/v55KS (ca. 1000 Contentseiten) gibt es zurzeit massenhaft, fast dreifachen Duplicate Content. Die Ursache sind manipulierte URLs, die in den Suchmaschinen angezeigt werden. Wie diese entstehen, kann ich nicht feststellen, daher meine Frage an Euch, hier im Forum. Ich würde mich über Eure Hilfe sehr freuen. Vorab: Sorry, wenn ich nicht immer die exakten Fachbegriffe verwende.

So sieht eine manipulierte URL aus, die die Suchmaschine ausgibt. Der fett markierte Teil wurde willkürlich ergänzt. Ich verwende keine sprechende URLs für meine Site.
http://www.valentinas-kochbuch.de/index ... cle_id=953

So sieht sie korrekt aus:
http://valentinas-kochbuch.de/index.php?article_id=953

Folge (wäre) der manipulierten URL ist, dass die Seite das CSS nicht aufrufen konnte und falsch dargestellt wurde. (Das haben wir geändert.) Weitere Folge ist, dass es von der Original-Page laut Webmaster Tooll bis zu siebenfachen Duplicate Content gibt mit leichten Variation des ergänzten Parameter.

Beispiele:
http://www.valentinas-kochbuch.de/index ... cle_id=953
oder auch http://www.valentinas-kochbuch.de/index ... cle_id=953

Meine Frage ist: Wie entstehen die "falschen" URLs?

Zur Chronologie der Site
2007-2009 Wordpress mit sprechenden URLs (somit gab es die ergänzten URL-Parameter-TEILE schon einmal, aber eben nicht in der URL-Zusammensetzung, wie sie nun angzeiegt werden.)
2009 vollständige Löschung der Wordpress-Datenbank (keine Migration o.ä.)
ab 2009 Redaxo-CMS - alle Pages wurden komplett neu angelegt.
Januar 2012 Datenbank-Umzug innerhalb eines Hosting-Anbieter (neue IP)

Seit wann taucht das Problem auf? Seit Mitte Januar. Ich sende Euch ein Screen meiner Abrufzahl, daran wird deutlich, wann Google auf den Duplicate Content reagierte.

Mein Hosting-Anbieter nennt den Google-Cache als Grund. Das verstehe ich nicht ganz, denn ich hatte seit 2009 nie Probleme damit. Außerdem sind den URLs nur Teilparamter uralter URLs, die vor 2009 genutzt wurden.

Oder liegt es Wordpress?

Vielen Dank im Voraus! Was immer Ihr für Ursachen seht, laßt es mich gerne wissen. Herzlichst Katharina
Katharina-in-Berlin
 
Beiträge: 5
Registriert: 26. Jan 2012, 09:46

Re: Generierung manipulierter URLs

Beitragvon Cheffchen » 26. Jan 2012, 17:53

Hallo Katharina-in-Berlin,

also erst mal
wurde willkürlich ergänzt
das glaube ich mal nicht das google einfach so URL änderst :O).
Du wirst irgend wo auf die 1000 Seiten solche Links generieren und Google wird diese auslesen und da die normalen Links nicht besonders sind nimmt Google halt die schicken, das diese gerade bei dir falsch sind kann ja google nichts.
Denn Google hat die Seite erst 17.02.2012 aufgenommen also ist das was aktuelles und hat nichts mit Wordpress zu tun von vor 5 Jahren :O).

Also Seite mal durchsuchen nach solchen links, Analytics(klickpfad) kann da glaube ich sehr gut helfen :O).

Das Zeigt auch das schicke URLs was bringen, also würde ich dir zu RexSeo raten damit bekommst schöne urls.

So fürs erste dürfte die info reichen.


Cheffchen
Benutzeravatar
Cheffchen
 
Beiträge: 1124
Registriert: 3. Mär 2009, 12:51
Wohnort: Berlin

Re: Generierung manipulierter URLs

Beitragvon Katharina-in-Berlin » 26. Jan 2012, 21:29

Danke Cheffchen! für Deine Antwort.
Hm, "willkürlich" meinte ich als Gegenteil als für mich erkennbar logisch. Ich habe alle Logfiles abgesucht und alle darangehängten URL-Parameter gesammelt und auf ein Muster hin analysiert - noch sehe ich es nicht. Sie sind mal so, mal so einandergereiht - pfff. Sicher, Google wird sie irgendwo herauslesen, aber ich verstehe nicht, wie sie entstehen, warum sie so gereiht werden und warum das Problem plötzlich auftaucht, obgleich die Seite so seit 2009 existiert und außer der IP-Änderung nichts Wesentliches verändert wurde.
Den Verweis auf die Wordpress-Site habe ich gemacht, weil es 2-3 URL-Parameter nur damals gegeben hat. Zum Teil gibt es und gab es nicht mehr den entsprechenden Inhalt auf meiner Seite. Ich habe meine Seite auf alle ergänzten URL-Parameter abgesucht und auch die Datenbank. Nischt.
Das mit den Links habe ich schon abgeklopft. Nischt.
Das mit den schicken URLs - klar, wem sagst Du das. Haste völlig recht.
Katharina-in-Berlin
 
Beiträge: 5
Registriert: 26. Jan 2012, 09:46

Re: Generierung manipulierter URLs

Beitragvon Thomas.Blum » 26. Jan 2012, 22:31

Hej,

verwende ein rewrite Addon.

Denn ich kann auch

/index.php/redaxo-ist-simple/index.php?article_id=953

eingeben und komme zum Artikel.

Wenn du das nicht willst, dann überprüfe mal deine htaccess.


vg Thomas
blumbeet - web.studio - Dresden - 0351 217 6225
webbude - Blog über CSS.XHTML.REX
Ein Wunschzettel
Benutzeravatar
Thomas.Blum
Entwickler
 
Beiträge: 4669
Registriert: 24. Aug 2004, 21:11
Wohnort: Dresden

Re: Generierung manipulierter URLs

Beitragvon Katharina-in-Berlin » 26. Jan 2012, 23:06

Oh, das ist nett von Dir.
Zur Ansicht: Es ist jetzt ein Befehl eingefügt als Schadensbegrenzung, dass immer auf das CSS zugegriffen wird, denn vorher wurden die Pages alle falsch angezeigt.
Ja, den Fehler vermuteten wir da auch - alles geprüft. Heute hat sie sich ein zweiter Programmierer angeschaut. Kleinigkeiten haben wir verbessert, aber beide sind sich einig, das kann nicht der Auslöser sein.
Trotzdem besten Dank für Deine Hilfsbereitschaft. :-)
Katharina-in-Berlin
 
Beiträge: 5
Registriert: 26. Jan 2012, 09:46

Re: Generierung manipulierter URLs

Beitragvon jeandeluxe » 26. Jan 2012, 23:19

Katharina-in-Berlin hat geschrieben:Hallo zusammen,
von meiner Page http://goo.gl/v55KS ..

Wozu dieser anonymisierte link? Was sagt der Webdesigner der die Seite erstellt hat zu dem Thema?
Kann es sein, daß zweitweise ein url-rewriter im Einsatz war? Davon abgesehn spuckt die Seite teils auch falsch konstruierte links aus wie valentinas-kochbuch.de/?article_id=182..
mark your solved threads [SOLVED]™ promotion tour.. | Redaxo API Docu | rexdev.de | "You start with some money.."
IT'S A MARATHON. NOT A SPRINT. UNLESS IT IS A SPRINT, THEN SPRINT!
Benutzeravatar
jeandeluxe
 
Beiträge: 1928
Registriert: 29. Sep 2005, 09:50
Wohnort: Hamburg

Re: Generierung manipulierter URLs

Beitragvon Katharina-in-Berlin » 27. Jan 2012, 08:09

Der Webdesigner, mein Ehemann, hat darauf keine Antwort und vor allem gerade keine Zeit, weil er für einige Tage unterwegs ist. Der Link ist anonymisiert, weil manche Foren es nicht gerne sehen, wenn er ausgeschrieben ist. Da ich mich selten in Technik-Foren bewege, wollte ich nicht gleich ins erste Fettnäpfchen treten. Aber nun dann doch ...
Oh je, valentinas-kochbuch.de/?article_id=182.. - das hatte ich noch nicht entdeckt. Ein url-rewriter war wohl mal im Einsatz.
Katharina-in-Berlin
 
Beiträge: 5
Registriert: 26. Jan 2012, 09:46

Re: Generierung manipulierter URLs

Beitragvon Katharina-in-Berlin » 27. Jan 2012, 08:15

Jeandeluxe, wie hast Du die falsch URL gefunden? Suche gerade ...
Katharina-in-Berlin
 
Beiträge: 5
Registriert: 26. Jan 2012, 09:46

Re: Generierung manipulierter URLs

Beitragvon Thomas.Blum » 27. Jan 2012, 09:51

Hej,
Katharina-in-Berlin hat geschrieben:Jeandeluxe, wie hast Du die falsch URL gefunden? Suche gerade ...


Jan hat die Lins wahrscheinlich mit einem Crawlet gefunden.

Ich hab eben nur mal schnell im Quelltext nachgesehen. Dein Namen und Bild in der rechten Spalte ist so zum Bspl. verlinkt.

Wichtig.
Verwende bei Verlinkungen immer die Funktion rex_getUrl() oder bei Objekten getUrl().

Dann ist es ein einfaches auch mal RexSeo zu installieren, Cache löschen und sehen das die Weilt einfacher ist.

Zu dem Problem nochmal
Hast du eine htaccess im Stammverzeichnis? Wenn ja wie sieht die aus? Denn solche Urls wie oben notiert kann es eigentlich nicht geben.

vg Thomas
blumbeet - web.studio - Dresden - 0351 217 6225
webbude - Blog über CSS.XHTML.REX
Ein Wunschzettel
Benutzeravatar
Thomas.Blum
Entwickler
 
Beiträge: 4669
Registriert: 24. Aug 2004, 21:11
Wohnort: Dresden


Zurück zu AddOns [R4]

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste