Gefahr durch KI-Sprachmodelle - LLM sammeln auch persönliche Daten und geben sie weiter

  • LLM = large language model = großes Sprachmodell. Die Datensammlung wird benötigt, damit man eine KI entwickeln und betreiben kann. Je mehr Daten eine LLM hat, desto natürlicher und "menschlicher" kann sie später auch auftreten.


    An diese Daten muss man aber erst einmal kommen und da hat jeder seine eigene Methode. Und wenn man schon Daten hat, kann man sie ja auch noch zu Geld machen oder anderweitig weitergeben.


     Die größte Gefahr besteht darin, dass für LLM auch posts in den sozialen Netzwerken genommen werden. Zusätzlich werden auch noch allgemeine Crawler Regeln absichtlich missachtet.


    Das bedeutet:

    Wenn irgendwo dein Name, Telefonnummer oder andere persönliche Daten vorhanden sind, werden sie zusammen, mit dem was du geschrieben hast, gespeichert.


    Man indexiert auch ganz gezielt Bereiche, die normalerweise für Suchmaschinen gesperrt sind.


    Aks Beispiel meldet Google für dieses Forum immer wieder einen "Fehler".

    In der "robots.txt" steht nämlich drin, dass Suchmaschinen nicht in auf die User-Profile zugreifen dürfen.

    Die Suchmaschinen meckern darüber, halten sich aber trotzdem daran.


    Für LLM ist es aber egal was in der "robots.txt" steht. Sie ignorieren es und machen einfach was sie wollen.


    Userinnen und User vom Ratgeber---forum.de sind aber trotzdem sicher. :thumbup:

    Auch wenn LLM-Betreiber die robots.txt ignorieren --> an die Userdaten kommen sie nicht ran :P

    Und wenn die Userinnen und User es nicht möchten, können auch Registrierte nicht auf ihr Profil.



    Das Zusammenführen von Person + Posts kann übrigens auch Konsequenzen im normalen Leben haben

    Hast du vielleicht mal etwas geschrieben, dass vielleicht als "nicht ganz in Ordnung" ausgelegt werden kann?

    Sorg dafür, dass es wieder gelöscht wird... auch wenn es schon Jahre her ist.


    Vor kurzem gab es eine Hausdurchsuchung, weil vor einigen Jahren mal ein Bild mit einem sarkastischen Kommentar dazu geteilt wurde.

    Der Betreffende hatte das später zwar wieder gelöscht, aber irgendwer hatte es noch und ihn deshalb angezeigt.

    Smartphone und alles andere wurde konfisziert und als Beweismittel sichergestellt. Jetzt wartet er auf den Prozess ... wegen nur einem Pic + comment.


    Bis auf Mistral + Copilot + Claude geben alle die Daten auch an die Strafverfolgungsbehörden weiter.

    Wenn den LLM-Betreibern also etwas suspekt erscheint, erstatten die gleich Strafanzeige.

    Denunziantentum durch LLM-Betreiber :f


    Der normale Weg wäre, dass ich eine Strafverfolgungsbehörde an den Seitenbetreiber wendet und die Herausgabe der Personendaten fordert.

    Anderen darf man die Daten nicht rausgeben. So ist es eigentlich in den meisten Ländern geregelt.

    LLM-Betreiber setzen sich damit also auch über diese Gesetze hinweg.


    Eine Übersicht, für welche KI welche Daten gesammelt werden, bekommt ihr hier im Original (Englisch)