Archive The Net - Der Content-Klau-Crawler

  • "Archive The Net " will angeblich das ganze Internet auf eigenen Servern abspeichern , um den Inhalt auch dann noch verfügbar zu machen, wenn es einzelne Seiten oder Inhalte nicht mehr gibt.


    Das hört sich auf den ersten Blick ja "sehr schön" an. Auf den zweiten Blick wird man aber vielleicht einmal ins Grübeln kommen wollen:


    1) Wie will ein einziger Anbieter alle Inhalte des Internets dauerhaft speichern können ?
    Selbst die weltweit größten Unternehmen besitzen zusammen nicht die nötigen Ressourcen. Nicht einmal Microsoft hält alle eigenen Dokumente dauerhaft vor, sondern löscht sie, wenn sie scheinbar nicht mehr benötigt werden, um Ressourcen zu sparen.


    2) Das Kopieren fremder Inhalte unterliegt internationalen Urheberrechtsbestimmungen
    Man darf sich alles zusammenkopieren, um es persönlich jederzeit verfügbar zu haben. Man darf diese Inhalte aber nicht an andere weiter geben. Der Anbieter verstößt also gegen alle internationalen Gesetze, indem er bekannt gibt, dass er die Kopien verfügbar machen will.

    3) Es gibt keinen allgemeinen Zugriff auf die Raubkopien

    Nur staatliche Institute und Bildungsträger können Zugriff beantragen.



    Was bedeutet das jetzt für einen Seitenbetreiber ?

    a) Gegen die Urheberrechte aller Verfasser, Autoren und Betreiber wird verstoßen
    Da dieser Gesetzesverstoß nicht staatlich geahndet wird, muss jeder Geschädigte einzeln klagen. Da das keiner macht, wird der Dienst ungehindert weiter raubkopieren können.


    b) Fehlinformationen bleiben unkorrigiert weiter verfügbar
    Wenn eine Nachricht (z.B. wegen neuer Informationen) aktualisiert wird, wird trotzdem noch die Falschmeldung weiter gespeichert.
    Am Ende heißt es dann vielleicht noch, der Autor hätte die Falschinformation aus Unfähigkeit nie verbessert - weil man davon ja nichts sehen kann.


    c) Der Contenklauer schädigt die Umwelt und stört alle Internetseiten
    Mit jeder Raubkopie wird auf den entsprechenden Server zugegriffen. Dieser benötigt für die Auslieferung der Inhalte immer etwas mehr Energie als wenn dieser Contentdieb nicht da wäre. Energie muss erzeugt werden. Energieerzeugung kostet Ressourcen. Energieverbrauch setzt auch automatisch immer auch gleichzeitig Wärme frei. Diese heizt im Gesamten das Klima auf.


    Wer das alles nicht will, kann und sollte diesen Crawler ausschließen.



    Browser-Kennung /Browser-Agent

    Zitat

    Mozilla/5.0 (compatible; memorybot/1.20.71 +http://archivethe.net/en/index.php/about/internet_memory1 on behalf of DNB)


    aktuell bekannte IPs
    37.16.72.213
    37.16.72.123


    Dieser Contentklau-Crawler ist erst seit dem 10.06.2014 im Internet unter dem aktuellen Namen aufgetaucht.


    Betrieben wird der Dienst übrigens durch internetmemory.net

  • Danke für den Hinweis. Habe grade mal meine Datenbank nach dem String "memorybot" durchsucht aber nichts gefunden. In meinem Loggingscript wird der auch als Bot markiert. Leider hab ich ausgerechnet vor ein paar Stunden die Datenbank von Bots bereinigt, von daher kann ich jetzt nicht sagen, wie oft der bei mir aufgetaucht ist. Aber vom Namen kommt der mir bekannt vor und ich glaube, ich hab den schon öfter mal mit mehreren Zugriffen hintereinander bei mir gesehen. Ich speichere mir mal den Link zu dem Thread in meiner .htaccess damit ich den, wenn der nochmal auftaucht, sperren kann und noch weiß, aus welchem Grund. :)


    MFG BlackY =)