Thursday, 1. March 2007Jubiläum
Heute wird gwaihir ein Jahr alt. Der Kleine ist ein Tor-node, der auf diesem Server läuft. Viel Internetverkehr kann er zwar nicht anonymisieren, mein Vertrag sieht maximal 100GB/Monat (ankommender + abgehender Verkehr) vor und 20-30GB davon brauche ich für die restlichen Dienste hier, aber 1GB/Tag Durchleitung schafft er auch. Das lässt sich auch auf dem heutzutage eher schwächlichen PIII/600MHz noch locker nebenbei erledigen.
Wer mehr über Tor wissen will, kann bei tor.eff.org nachlesen, so in kürze zusammengefasst ist das ein Netz aus derzeit 800 Rechnern die weltweit verteilt sind. Wer Tor nutzt, leitet seinen Verkehr durch dieses Netz. Seine Daten werden dabei durch drei dieser Server weitergereicht. Jeder dieser drei kennt nur seinen nächsten Nachbarn, nur der erste kennt also den eigentlichen Nutzer und der letzte (der exit-node) kennt die Zieladresse. Verschlüsselt werden die Daten dabei auch, lediglich der exit-node kann den unverschlüsselten Verkehr sehen, falls die Daten nicht schon durch den Nutzer und den Zielserver verschlüsselt wurden, z.B. durch https. Alle Zwischenknoten sehen nur den für sie bestimmten Teil der Informationen, der Inhalt der Pakete wird ähnlich einer Zwiebel in mehrere Schalen verpackt, weshalb diese Art der Weitervermittlung auch onion routing genannt wird. "Jubiläum" vollständig lesen Monday, 12. February 2007Rechtschreibprüfung
(Nur für WP 2.1 bis einschliesslich Wordpress 2.3.3! 2.5 hat eine andere Rechtschreibkorrektur, da passt dieser Patch nicht. Sollte aber auch nicht nötig sein...)
Notiz für zukünftige Updates: Der Spellchecker von Wordpress 2.1 wäre ja eigentlich ganz praktisch, dachte ich, wenn er nur laufen würde. Irgendwie gings aber nach dem Auspacken nicht. Der könnte aspell verwenden (geht nicht, ich lass wordpress keine Systemaufrufe machen), oder pspell (geht nicht, weil ich habe keine Lust, php4 neu zu kompilieren und einbinden lässt der sich nicht nachträglich, soweit ich weiss), oder er könnte das Google-api zur Rechtschreibprüfung verwenden. Dieses Google-api scheint aber Anfang des Jahres auf https umgestellt worden zu sein, darum geht das wordpress 2.1, das ich mir runtergeladen habe auch nicht. Der spellchecker muss also nachinstalliert werden. Und das geht so:
Zwischendurch hab ich auch noch php-curl installiert. Wie sich herausstellte, funktioniert damit die Überprüfung besser. Ohne curl kam öfters (aber nicht immer...) eine Meldung "could not execute AJAX call, server didn't return valid a XML", die seit dem Einsatz von curl weg ist. "Nordwald" hat dann hier kommentiert und eine Version ohne Einsatz von curl vorgeschlagen. Das hat funktioniert und ab der Version 105a kann man auf curl verzichten. Jetzt läuft der checker, umschalten kann man ihn auch und die Qualität ist naja, die von Google halt. Falls es jemand schnell probieren will, ich hab die Dateien mit den Änderungen gezippt und zum Download bereitgestellt: spellcheck-DE-1031.zip (basierend auf dem TinyMCE Spellchecker PHP V 1.0.3.1 vom 10.1.07) spellcheck-DE-104.zip (basierend auf dem TinyMCE Spellchecker PHP V 1.0.4 vom 23.4.07), getestet mit WP 2.1.3 und WP 2.2 spellcheck-DE-105.zip (basierend auf dem TinyMCE Spellchecker PHP V 1.0.5 vom 28.5.07), getestet mit WP 2.2, WP 2.2.1, WP 2.2.2 und WP 2.2.3 spellcheck-DE-105a.zip (basierend auf dem TinyMCE Spellchecker PHP V 1.0.5 vom 28.5.07), getestet mit WP 2.2.3, WP 2.3, WP 2.3.1, WP 2.3.2 und WP 2.3.3 Für 2.5 gibt es keinen Patch. Der sollte aber auch nicht nötig sein... PS: Fehlende scharfe Se sind hier beabsichtigt, ich mag die nicht, das liegt also nicht am Spellcheck. Tuesday, 30. January 2007Pseudonymisierung
Bei Heise steht ein Artikel über das neue Telemediengesetz und dass man in Zukunft aufpassen muss, dass man seinen Besuchern auch schön mitteilt, was man von ihren Daten so speichert.
Irgendwie ists ja schon komisch mit den Logdateien. Jeder Serverbesitzer hat seine Apache-Logs, die Protokolle des Mailservers, die Logfiles seiner IP-Tables und aller sonstigen Programme, die einem das /var/log-Verzeichnis zumüllen. Jeder will seine awstat-Auswertungen und seine Counter, auch ich hänge täglich an den Logfiles und freue mich riesig, wenn wieder einer über den Suchbegriff "Kambodscha Massage ohne Verkehr" zu unserer Seite gefunden hat. Aber keiner (ausser der Werbeindustrie) will personenbezogene Daten dauerhaft haben und für die Vorratsdatenspeicherung will sich sowieso keiner hergeben. Ich halte es deshalb so, das ich die Daten, die ich für den Serverbetrieb für wichtig halte, maximal eine Woche aufhebe. Dazu gehören z.B. die Logs des Mailservers, weil ich gern die Spammer und Relay-Tester besser kennenlernen will. Oder auch die Logs des Webservers und des sshd, weil ich gerne wissen will, ob der Typ, der im Gästebuch rumpöbelt der gleiche ist, der auch versucht, sich per ssh auf dem Server anzumelden. Nach einer Stunde pseudonymisiere ich die Logfiles des Webservers, die anderen Logs werfe ich nach einer Woche weg. Zum Pseudonymisieren werden die Logs durch ein kleines perl-Skript geschickt, das die Usernamen löscht, von den IP-Adressen die letzten 2 Bytes durch 0 ersetzt und von den Hostnamen den ersten Teil durch ein Zufallsbuchstabenkombination ersetzt. Diese Zufallszeichenkette ist so gebaut, dass zwar ein bestimmter Hostname bei der Eingabe eindeutig zu einem bestimmten Namen in der Ausgabe wird, dieser Vorgang aber nicht umkehrbar ist. Damit bleibt alles erhalten was die Neugier des Besucherstatistikers erfreut: Der Provider ist noch erkennbar, der verwendete Browser, der Referer, die aufgerufenen Seiten und ein einzelner Besucher bleibt erkennbar und zählbar (soweit das halt überhaupt geht). Die lästige intime IP-Adresse ist aber weg. Das gilt natürlich nicht für den kostenpflichtigen Teil des Angebotes. Hier müssen wir schon zur Rechnungslegung und Missbrauchsverfolgung alles speichern. IP-Adressen in Kommentaren werden übrigens dank des Plugins "Delete Comment IP" hier ebenfalls nach fünf Tagen gelöscht. Allerdings lösen diese Kommentare gelegentlich Mails an mich aus, in denen die IP-Adrese drinsteht und meine Mails lösche ich nur ab und zu. Technischer Kram zum Pseudonymisieren steht im oben verlinkten Script. Wer das auch hernehmen mag, kann sich bedienen. Nachtrag 26.2.: Auch der oberste Bundesdatenschützer scheint 7 Tage für ok zu halten. Aus heise: Gemäß dem Bundesdatenschutzbeauftragten Peter Schaar ist die von der T-Com jetzt praktizierte einwöchige Vorhaltung von Verbindungsdaten bei Flatrates gesetzeskonform und datenschutzverträglich. "Als Aufsichtsbehörde versuchen wir, das geltende Recht bei den Telekommunikationsunternehmen durchzusetzen", erklärte Schaar gegenüber heise online. Das heranzuziehende Telekommunikationsgesetz (TKG) erlaube in den Paragraphen 96, 97 und 100 eine Verwendung von "Verkehrsdaten" zur Entgeltberechnung und zur Missbrauchseingrenzung. Nach Paragraph 109 TKG sei der Anbieter ferner verpflichtet, angemessene Maßnahmen zum Schutz des Netzes gegen unerlaubte Zugriffe beziehungsweise äußere Angriffe zu treffen. "Bei einer siebentägigen Frist ist dies genau der Fall", warb Schaar für seinen in Gesprächen mit der Deutschen Telekom durchgesetzten Vorschlag. Nachtrag 6.10.: Ich pseudonymisiere jetzt nach maximal 1 Stunde, zuvor hab ich das wöchentlich erledigt. Thursday, 28. December 2006Öffentlich-rechtliche müssen draussen bleiben
In der Diskussion zum heutigen Heise-Artikel zur Rundfunkgebühr für neuartige Empfangsgeräte (früher auch als "PC" bekannt) konnte ich wieder ein paar IP-Adressbereiche der öffentlich-rechtlichen Anstalten aufschnappen. Dazu gibts hier die passende Bastelanleitung, wie man ö.r. Besucher von seiner Homepage ausschliesst. Ich finde es nämlich unfair, dass wir pauschal für die Internetpräsenz der Anstalten zahlen sollen, während die sich kostenlos an unserem Bildungs- und Unterhaltungsangebot erfreuen können.
Um das zu verhindern, muss man einfach nur eine .htaccess-Datei erstellen und die IP-Adressen der unbeliebten Besucher eintragen. Unsere z.B. sieht so aus: ErrorDocument 403 \ Das einzubauen macht nicht sonderlich viel Mühe, man hat aber immer wieder grosse Freude an den Logfiles. Dieses ErrorDocument muss natürlich ausserhalb des so geschützten Bereiches liegen. Schliesslich muss man seinen Besuchern ja erklären, warum sie hier nicht reindürfen. Für weitere Hinweise auf Adressbereiche der GEZ-Mitglieder wäre ich dankbar. Nachtrag: Zum Beweis, dass ich wirklich meckern darf, hier meine GEZ-Anmeldung:
« vorherige Seite
(Seite 9 von 9, insgesamt 44 Einträge)
|
KategorienVerwaltung des Blogs |