25. August 2008
Schattendateien im CMS?
Aus einem wohl aktuellem Anlass erklärt stern.de-Kolumnist Carsten Scheibe auf dem Level von Lach- und Sachgeschichten, wo seiner Meinung nach die nächste Abmahngefahr für viele Websitebetreiber liegt: in den “Schattendateien”, die WCMS angeblich hinterlassen.
Nicht nur, dass Herr Scheibe bei WCMS schnell zu Superlativen wie “Software-Riesen” und “Giganten” greift (und im gleichen Absatz WordPress erwähnt), er geht auch davon aus, dass WCMS statische HTML-Dateien erstellen und die dann beim Löschen der Seite im WCMS auf der Festplatte “vergessen”. Danach verknüpft er Phrasen über die angebliche Komplexität von Servern, Internet und Suchmaschinen so, dass man den Eindruck bekommen kann, ein unbedarfster WordPress-User kann genau wegen der Nutzung eines WCMS wie WordPress Probleme bekommen kann.
Selten habe ich in letzter Zeit einen so schlechten Beitrag gelesen. Nicht nur, dass Herr Scheibe verkennt, dass moderne WCMS wie insbesondere WordPress überhaupt keine HTML-Daten ablegen, sondern jede abgerufene Seite dynamisch aus der Datenbank generieren, so dass HTML-Leichen erst gar nicht entstehen können. Der ganze Beitrag ist – hoffentlich nur durch die angewandten Vereinfachungen durch Herrn Scheibe – an allen Ecken inkorrekt und suggeriert, dass Suchmaschinen, CMS und vor allem abmahnende Industrie jedem Webseiten-Betreiber übel mitspielen.
Die eigentliche Aussage des Beitrag von Herrn Scheibe ist nicht zu erkennen. Soll es nur der erste Satz des letzten Absatzes sein, dass man doch seinen Webserver mal wieder aufräumen sollte? Dieser Rat ist bestimmt nicht falsch – der Rest des Beitrags über weite Strecken und insbesondere in der Kombination aber schon.
Und, Herr Scheibe, ein ganz persönlicher Tipp: Nutzen Sie doch auch ein volldymanisches WCMS und richten Sie die Einstellungen für Suchmaschinen-Robots korrekt ein. Dann gibt es auch kein Problem mit illegalen Daten, die Sie vielleicht vor Jahren mal auf Ihrem Webspace hatten.
Ähnliche Beiträge im ECM-Blog
8 Reaktionen zu “Schattendateien im CMS?”
Einen Kommentar schreiben
Mit der Veröffentlichung von Werbung via Kommentar, erklären Sie sich durch das Absenden des Kommentars mit den Bedingungen für die Platzierung einer Werbeanzeige und den AGB für Verlagspublikationen von Cara Europe Limited einverstanden. Bei einer Laufzeit von drei Monaten berechnen wir Ihnen je angefangene Zeile 150,00 Euro zzgl. gesetzl. MwSt. Nach Ende des Zeitraums wird Ihr werblicher Kommentar automatisch entfernt.
Kommentare ohne gültige E-Mail-Adresse werden kommentarlos gelöscht.



Am 25. August 2008 um 12:04 Uhr
Den Webserver aufräumen … ich meine, wie kann Herr Scheibe von sich auf andere schliessen (obwohl ich mir nicht sicher bin ob Herr Scheibe einen Webserver betreibt). Der gute Mann hat offenabr nicht viel Ahnung von WCMS!
Am 25. August 2008 um 18:41 Uhr
Lieber Herr Krüger,
ich habe in der Tat wenig Ahnung von CMS und ihrer tieferen Funktionsweise. Ein schlimmes Anwaltsschreiben hat aber genau diesen Fall zutage geführt: Im CMS längst gelöschte Einträge waren weiterhin vorhanden, wurden von Google indexiert und konnten über die Suche von Google gefunden werden – obwohl sie weder im CMS stehen noch auf den Web-Seiten anzuklicken sind.
Keine Ahnung, in welcher Form genau diese Schattendaten vorliegen, aber sie sind da und können zu Rechtsproblemen führen. Das ist doch Fakt – auch wenn ich das schlecht ausgedrückt habe. Auf meinem eigenen Presseserver habe ich so Meldungen über Google wiedergefunden, die ich schon lange gelöscht habe.
Grüße
Carsten Scheibe
PS: Über eine genaue Erklärung, wie das geht, wäre ich sehr dankbar.
Am 26. August 2008 um 09:12 Uhr
Guten Morgen Herr Scheibe,
ein Vorfall wie von Ihnen beschrieben ist mit jedem modernen WCMS nicht möglich. Wenn doch, ist dies eher ein systemspezifischer Funktionsfehler, als eine Gefahrenquelle. Wenn ein System so fehlerhaft arbeitet, muss es repariert oder ausgetauscht werden.
Wenn man eine Unterlassungserklärung abgibt, ist es m.E.n. nach Mindeste, den genauen Link testweise nochmals aufzurufen, um zu prüfen, ob die Seite tatsächlich nicht mehr abrufbar ist. Zudem sollte die URL via Webmnaster-Tools gelöscht werden, damit auch der Google-Cache zu dieser Seite gelöscht wird.
Grüße,
Jörg Dennis Krüger
Am 26. August 2008 um 13:27 Uhr
Hallo *
So ärgerlich es sein mag, aber diesen Fakt gibt es und es sind nicht wenige Systeme, die zu derartigen ‘Leichen’ führen.
Technisch ist das Ganze recht einfach zu erklären:
Viele einfache CMS-Systeme erzeugen statische Seiten, oftmals auf einem lokalen Home-PC (Offline CMS Systeme, ‘bessere’ HTML Editoren).
Anwender übertragen diese Daten nach lokaler Prüfung – sprich aktualisieren ihren Webauftritt – durch ein Kopieren (z.B. per ftp) der Dateien auf den Webserver.
Bei einem manuellen Kopieren (z.B. bei Microsoft Frontpage möglich) ist es einem normalen Anwender nicht möglich, alt von neu zu unterscheiden oder gar alte Dateien auf dem Server manuell zu löschen.
Bei einem automatischen Transfer (auch bei Frontpage möglich) via ftp kann und darf ein CMS ihm nicht bekannte (fremde) Objekte nicht ‘so einfach’ löschen und damit verbleiben auch hier die ‘Leichen’ auf dem Server.
Solange Systeme verwendet werden, die bei einem Löschen im CMS keine aktive Rücknahme (Depublikation) der Online-Daten vom Livesystem durchführen – und das dürfte bei den meisten privaten Homepages und leider auch bei sehr vielen Firmenwebseiten der Fall sein – wird sich die von Herrn Scheibe beschriebene Situation nicht ändern.
Leider gehören dazu auch größere Systeme und selbst per se dynamische Systeme (z.B. OpenCMS), wenn zur Performance Optimierung deren Seiten statisch ausgespielt werden.
WordPress ist -natürlich – nicht betroffen
Der einzige Tip den ich für alle diese Frontpage und sonstigen User hätte: Vor einer Aktualisierung einmal den gesamten Webspace leeren und die Site komplett erzeugen lassen. Der Nachteil einer kleinen Off-Zeit ist wohl eher in Kauf zu nehmen, als ewig affindbaren Müll online zu halten.
Grüße, Holger Norden
Am 26. August 2008 um 13:34 Uhr
An sowas wie Frontpage habe ich nun natürlich nicht gedacht – das ist von WCM ja nun auch recht weit weg. Bei der Arbeit mit HTML-Editoren u.ä. kann es solche Probleme natürlich geben – genau das wird aber durch den Einsatz von WCMS gelöst.
In nicht zu Ende gedachten Umgebungen können natürlich auch Lösungen wie RedDot und FirstSpirit HTML-Dateien “vergessen”. Dies aber in jedem Fall schlichtweg ein Bug bzw. ein “Kunstfehler” bei der Implementation und sollte dringend behoben werden.
Am 26. August 2008 um 14:52 Uhr
Stimmt, das ist von professionellem WCMS extrem weit entfernt. Leider bilden die Masse aller Systeme aber solche kleinen privaten Systeme mit reiner Offline Erstellung. Würde Microsoft sein Frontpage hier sinnvoll erweitern, wäre damit sicherlich schon vielen geholfen.
Selbst im professionellen Bereich würde ich aber vermuten, dass es bei den statifizierenden Systemen mehr Umsetzungen mit exact diesem Fehler als ohne diesen gibt. Mir zumindest sind davon in den letzen Jahren schon einige unter die Finger gekommen, darunter auch mit RedDot, OpenText und anderen professionellen Systemen erstellte Business-Sites.
Die demnach ‘durchdachten’ Systeme dürften folglich eher einen sehr niedrigen Prozentsatz ausmachen, was ich persönlich recht bitter finde.
Am 26. August 2008 um 14:56 Uhr
Das sehe ich doch deutlich anders. Die meisten einigermaßen professionellen Websites – auch im privaten Bereich – werden mittlerweile mit einem WCMS betrieben, sei es Typo3, WordPress, Sefrengo, Joomly oder ähnliches. Bei vielen Billighostern gibt es diese per automatischer Installation dazu.
Die Anzahl Menschen, die tatsächlich von einem solchen “Schattendateien-Problem” betroffen sein könnten, ist sehr, sehr gering.
Am 25. Oktober 2008 um 15:49 Uhr
Zusätzlich kommt noch das Problem hinzu, dass Seiten einfach im Google-Cache landen und das kann schon etwas länger dauern, bis sie “verschwinde”, weil der teilweise ähnliche Funktionen übernimmt, wie die waybackmachine bei archive.org.
Bei den “professionellen ” WCMS kommt hinzu, dass Sie von Zeit zu Zeit migriert werden, wenn das automatisiert geschieht, dann werden alte Inhalte oft html-isiert, da man anders nichts archivieren kann, weil die neuen CMSe die MYSQL-Datenbanken anders “befüllen” als die alten und mit einem trivialen SQL-Dump kann man eben nicht eine alte Website mal eben rüberhieven.
Dann kommt noch das Problem hinzu, dass viel CMS aus Performancegründen intern nicht nur Templates sondern eben auch ganze Seiten oder nur diejenigen cachen, die selten geändert werden. Und HTML-files sind eben immer schneller als die dynamischen CMS. Warum sonst ist eine Flatfile/XSLT-Lösung den üblichen CMSen so haushoch überlegen, wenn es um Performance geht…Flat is finer AND faster
Beste Grüße
Jörg Wittkewitz