SemrushBot - wie man ihn los wird, ohne ihn sperren zu müssen

  • Dieser Bot / Crawler trägt die Browser-Kennung / Browser-Agent

    Zitat

    Mozilla/5.0 (compatible; SemrushBot/0.98~bl; +http://www.semrush.com/bot.html)


    Aktuell bekannte IPs:
    46.229.164.112
    46.229.164.113
    46.229.164.114


    Der Bot scannt eine Seite immer wieder und versucht dabei auch immer wieder , mit einer anderen IP anzukommen, wenn man ihn versucht mit einem IP-Block auszusperen.
    Die robots.txt werden ignoriert.


    Wendet man sich den den Betreiber und fordert ihn auf, seinen Bot zu stoppen, erhält man folgende Antwort


    Zitat

    Hello,


    Thank you for contacting SEMrush! After looking at your robots.txt file, it appears that you have successfully blocked our bot from crawling your site. We most likely found your site due to a backlink. You should not see our bot visit your page anymore.


    I am sorry for any inconvenience. If you have any other questions, please feel free to ask!


    Frei übersetzt:
    Nachdem wir Ihre robots.txt geprüft haben, haben wir festgestellt, dass Sie unseren Bot erfolgreich vom Crawlen Ihrer Seite ausgesperrt haben. Wir haben wahrscheinlich Ihre Seite durch einen Backlink gefunden. Sie sollten unseren Bot nun nicht mehr auf Ihrer Seite sehen.


    Diese Antwort kam am Mi 04.02.2015 22:57 Uhr


    Was von dieser Antwort zu halten ist , zeigen folgende Momentaufnahmen.
    05.02.2015

    07.02.2015


    ----------------------------


    Dem Betreiber ist also nicht zu trauen und seine Aussagen, weshalb der Bot die robots.txt nicht beachtet hat, sind einfach nur "laue Erklärungen für völlige Anfänger".


    Wenn der Betreiber keine Kontrolle über seinen Bot hat - oder sie nicht ausüben will - muss man eben selbst dafür sorgen, dass dieser Bot draußen bleibt. Hier der Nachweis , beginnend nach der Zeit der Mail , dass dieser Bot die Seite fortwährend weiter aufsuchen will.


    Änderung 07.02.1015:
    Liste mit über 100 Auftauchen als TXT-Datei angehängt . Die Bilder oben zeigen aber, dass jedes einzelne Auftauchen gleichzeitig auch mit vielen Zugriffsversuchen verbunden ist.


    Das ist übrigens ein Auszug aus dem Sicherheitssystem. Der Bot lässt sich zwar nicht durch den Browser-Agent aussperren, aber relativ leicht per IP-Block mit Wildcard blockieren.


    Dass dieser Bot NICHT für den Seitenbetreiber nützlich ist, kann man u.a. unter https://www.mywot.com/en/scorecard/semrush.com nachlesen. Scheinbar handelt es sich um einen Content-Klau-Bot. Definitiv sorgt er aber für massig überflüssigen Traffics auf eurer Seite.


    Zitat

    We collect massive amounts of SERP data for more than 106 million keywords and about 100 millions domains, including: AdWords ad copies and positions, organic positions for domains and landing URLs, search volumes, CPC, competition, number of results, and so much more.



    So, don´t trust this bot. Block it, because it`s better for your own page

    Meinung geändert. Siehe folgenden abschließenden Mailverkehr. Alle entsprechenden Passagen wurden im Nachhinein durchgestrichen by "Ratgeber" am 10.02.2015

  • Nachtrag


    weitere Browser-Kennungen


    Das erklärt wohl, weshalb sich der Bot nicht allein mittels seines Browser-Agents sperren lässt


    Weitere IPs dieses Bots




    Zitat

    Semrush betreibt Zahlenhuberei par excellence und interessiert sich wenig für den Schutz personenbezogener Daten. Wer mit den kostenpflichtigen Daten des Unternehmens arbeitet, möchte letztlich nichts anderes als Mitbewerber bequem ausspionieren und Suchmaschinenergebnisse manipulieren.


    http://de.wetena.com/bot/semrushbot


    Wie nman solche Bots weiterhin aussperren kann, beschreibt unsere Partnerseite BlackPhantom.DE unter http://blackphantom.de/artikel…-per-htaccess-aussperren/

  • Update


    Am 07.02.2015 habe ich um 14:17 Uhr folgende Mail an den Zuständigen von Semrush gesendet

    Zitat

    Hello,


    of course I know , how the internet works. But I know too, that it`s easy for you to stop reaching my domain.
    I should not see your bot anymore ? But what are you thinking about this list of appearances - after your promise ?


    (danach folgte die bereits oben erwähnte Liste)


    Frei übersetzt lautete meine Mail wie folgt:


    >>
    Hallo,
    natürlich weiß ich wie das Internet arbeitet. Aber ich weiß auch, dass es für Euch einfach ist, euren Bot davon abzuhalten, meine Domain zu erreichen.
    Ich sollte euren Bot nicht mehr sehen ? Aber was denkst du über die Liste des Auftretens - nach deinem Versprechen ?
    <<


    Ergebnis:
    Am 08.02.2014 um 2:31 Uhr erfolgten die letzten Zugriffsversuche dieses Bots


    So , if you have problems with this bot, write to the owners and describe your problems.
    If you can explain ( and show) the problem, they are able and willing to stop the bot.


    Wenn du Probleme mit dem Bot hast, schreibe dem Betreiber.
    Wenn du die Probleme erklären (und zeigen) kannst, sind sie fähig und willens den Bot zu stoppen.

  • Am 09.02.2015 erreichte mich um 21 Uhr folgende Rückmail


    Zitat

    Hello,


    Thank you for your reply! I am very sorry for the inconvenience. I have notified our PO team of the issue to make sure nothing is going wrong with our bots. They will make sure to identify the issue and make sure it will not happen again in the future.


    I am very sorry for the inconvenience. If you have any other questions, please feel free to ask!


    sinngemäße Übersetzung

    Zitat

    Halo,
    danke für Ihre Antwort. Ich entschuldige mich für die Unannehmlichkeiten. Ich habe die Liste an unser PO Team (Sinn unbekannt) weiter geleitet um sicher zu stellen, dass unser Bot ordnungsgemäß arbeitet.Sie werden sich darum kümmern , so dass es in Zukunft nicht mehr passieren wird.


    Ich entschuldige mich für die Unannehmlichkeiten. Wenn Sie weitere Fragen haben, können Sie mich gerne kontaktieren.


    Vielen Dank . Da sich der Betreiber sowohl vernünftig verhält als auch die Wünsche eines Seitenbetreibers berücksichtigt, ändere ich meine Meinung:
    Dieser Bot ist doch kein "Bad Bot" , weil man sein Betreiber ihn auf Wunsch gerne anders einstellt.


    Tanks a lot :thumbsup: