<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>

<channel>
	<title>berhorn.de</title>
	<atom:link href="http://berhorn.de/feed" rel="self" type="application/rss+xml" />
	<link>http://berhorn.de</link>
	<description>Auslandsstudium, Galapagos, Spambekämpfung und Softwareentwicklung</description>
	<pubDate>Wed, 17 Feb 2010 11:31:25 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.5.1</generator>
	<language>en</language>
			<item>
		<title>TMCpro statt normalem TMC</title>
		<link>http://berhorn.de/2009/09/13/tmcpro-statt-normalem-tmc</link>
		<comments>http://berhorn.de/2009/09/13/tmcpro-statt-normalem-tmc#comments</comments>
		<pubDate>Sun, 13 Sep 2009 12:54:09 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[Navi]]></category>

		<category><![CDATA[TMC]]></category>

		<category><![CDATA[TMCpro]]></category>

		<guid isPermaLink="false">http://berhorn.de/?p=89</guid>
		<description><![CDATA[Seit einigen Wochen habe ich ein schönes Navi mit TMC. Das ist an Freitagen zum Feierabendverkehr sehr praktisch, wenn auf Deutschlands Baustellen-Autobahnen mal wieder alles zu ist. So bekommt man dann vom Navi automatisch Strecken durch das schöne Sauerland oder andere landschaftlich ähnlich reizvolle Umfahrrouten verordnet.
Auf der Fahrt nach Holland stellten sich in Belgien und [...]]]></description>
			<content:encoded><![CDATA[<p>Seit einigen Wochen habe ich ein schönes Navi mit TMC. Das ist an Freitagen zum Feierabendverkehr sehr praktisch, wenn auf Deutschlands Baustellen-Autobahnen mal wieder alles zu ist. So bekommt man dann vom Navi automatisch Strecken durch das schöne Sauerland oder andere landschaftlich ähnlich reizvolle Umfahrrouten verordnet.</p>
<p>Auf der Fahrt nach Holland stellten sich in Belgien und Holland einige Meldungen mehr ein, die es in Deutschland sonst nicht gibt. So wusste das Navi über die wenigen Baustellen die es auch in diesen Ländern manchmal gibt, schon Bescheid.</p>
<p>Eine Recherche im Internet fördert zutage, dass die ARD-Sender &#8220;TMC&#8221; senden, und einige private &#8220;TMCpro&#8221;. TMC wird von den Sendern redaktionell zusammengestellt und parallel zum normalen Radiosignal kodiert gesendet. Quellen sind Polizei, ADAC und (menschliche) Staumelder.</p>
<p><a title="TMCpro" href="http://de.wikipedia.org/wiki/TMCpro">TMCpro</a> hingegen hat auch Daten von Sensoren an Autobahnen dabei. Die c&#8217;t hat anno 2006 (<em>TMC und TMCpro, </em>c&#8217;t 2006, Heft 13) noch herausgefunden, dass TMC in Westdeutschland noch besser taugt, da hier wenige Sensoren an den Autobahnen sind. In Ostdeutschland hingegen sei TMCpro schon besser.</p>
<p>Mittlerweile dürfte sich die Situation geändert haben.<br />
Allerdings senden die meisten und vor allem die stärksten Sender (ARD-Sender) das normale TMC, TMCpro wird von privaten und Millitärsendern gesendet.</p>
<p>Im Navi muss man dann auf manuelle Suche umstellen und den Sender direkt eingeben.</p>
<p>Hier ist meine Ausdruck-Liste für Rheinland-Pfalz, Hessen und Nordrhein-Westfalen:</p>
<p>Big.FM</p>
<ul>
<li>Kaiserslautern 107,6 MHz</li>
<li>Mainz 106,6 MHz</li>
<li>Frankfurt 104,5 MHz</li>
</ul>
<p>Radio Bob</p>
<ul>
<li> Limburg 90,2</li>
<li> Wetzlar 88,2</li>
<li> Marburg 103,9</li>
<li> Korbach 96,5</li>
<li>Mannheim 87,8 MHz</li>
<li> Heidelberg 90,9 MHz</li>
</ul>
<p>AFN The Eagle</p>
<ul>
<li> Großer Feldberg/Taunus 98,7 MHz</li>
</ul>
<p>BFBS</p>
<ul>
<li> Bielefeld     103.0 (sehr starkes Signal)</li>
<li> Langenberg     96.5 (Sauerland, hoch!)</li>
<li> Bonn     97.8</li>
<li> Drachenberg     93.0</li>
<li> Hameln     99.3</li>
</ul>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li>No related posts.</li>
	</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2009/09/13/tmcpro-statt-normalem-tmc/feed</wfw:commentRss>
		</item>
		<item>
		<title>Mal wieder ein Eintrag</title>
		<link>http://berhorn.de/2008/09/30/mal-wieder-ein-eintrag</link>
		<comments>http://berhorn.de/2008/09/30/mal-wieder-ein-eintrag#comments</comments>
		<pubDate>Tue, 30 Sep 2008 20:55:57 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<guid isPermaLink="false">http://berhorn.de/?p=88</guid>
		<description><![CDATA[Hier im Blog tut sich ja seit einiger Zeit nichts mehr.
Das muss nichts schlimmes heißen, ich finde nur im Moment nicht Zeit und Muße, um etwas miteilenswertes zu schreiben. Daher wird es wohl erstmal eine zeitlang bei der Flaute hier im Blog bleiben.

	Related posts
	
	No related posts.
	

]]></description>
			<content:encoded><![CDATA[<p>Hier im Blog tut sich ja seit einiger Zeit nichts mehr.</p>
<p>Das muss nichts schlimmes heißen, ich finde nur im Moment nicht Zeit und Muße, um etwas miteilenswertes zu schreiben. Daher wird es wohl erstmal eine zeitlang bei der Flaute hier im Blog bleiben.</p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li>No related posts.</li>
	</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2008/09/30/mal-wieder-ein-eintrag/feed</wfw:commentRss>
		</item>
		<item>
		<title>Warum</title>
		<link>http://berhorn.de/2007/10/19/warum</link>
		<comments>http://berhorn.de/2007/10/19/warum#comments</comments>
		<pubDate>Fri, 19 Oct 2007 13:41:00 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[Benzinpreis]]></category>

		<guid isPermaLink="false">tag:berhorn.de,2007-10-19 13:41:00:108</guid>
		<description><![CDATA[steigt bei uns der Benzinpreis, wenn der Dollar ständig schwächer und schwächer und der Euro stärker und stärker wird?

Die anhaltenden Spannungen zwischen der Türkei und kurdischen Rebellen im Nordirak stützten den Ölpreis, &#8230;. Zudem stütze der extrem schwache US-Dollar den Ölpreis, sagten Händler. Der fallende Dollar mache in US-Währung gehandelte Ölprodukte preiswerter. Dies führe zu [...]]]></description>
			<content:encoded><![CDATA[<p>steigt bei uns der Benzinpreis, wenn der Dollar ständig schwächer und schwächer und der Euro stärker und stärker wird?</p>
<blockquote>
<p>Die anhaltenden Spannungen zwischen der Türkei und kurdischen Rebellen im Nordirak stützten den Ölpreis, &#8230;. Zudem stütze der extrem schwache US-Dollar den Ölpreis, sagten Händler. Der fallende Dollar mache in US-Währung gehandelte Ölprodukte preiswerter. Dies führe zu einer steigenden Nachfrage und höheren Ölpreisen. Auch der Euro hatte heute mit 1,4318 Dollar einen neuen Rekordstand erreicht.</p>
</blockquote>
<p>Warum muss in Europa immer mehr gezahlt werden, wenn der Einkauf durch den starken Euro immer billiger wird?<br />
Es wäre wirklich mal an der Zeit, dass ein paar entscheidende Märkte in Euro handeln und nicht mehr in Dollar.<br />
Die Zeit ist reif das die Amerikaner das Währungsschwankungsrisiko zugeschoben bekommen.</p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li>No related posts.</li>
	</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2007/10/19/warum/feed</wfw:commentRss>
		</item>
		<item>
		<title>Ultimate Frisbee bei der TGS Vorwärts Frankfurt</title>
		<link>http://berhorn.de/2007/08/27/ultimate-frisbee-bei-der-tgs-vorwarts-frankfurt</link>
		<comments>http://berhorn.de/2007/08/27/ultimate-frisbee-bei-der-tgs-vorwarts-frankfurt#comments</comments>
		<pubDate>Mon, 27 Aug 2007 19:45:00 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[Ultimate-Frisbee]]></category>

		<guid isPermaLink="false">tag:berhorn.de,2007-08-27 19:45:00:103</guid>
		<description><![CDATA[Am Wochenende hatte die TGS Vorwärts 1874 Frankfurt ihr Sommerfest in Frankfurt-Rödelheim. Das Frankfurter Ultimate-Team hatte uns eingeladen, zu einem Show-Spiel dort anzutreten.
Hier sind einige Fotos vom Spiel:




 

Arsludendi Darmstadt ist traditionell in Gelb-blau, die Frankfurter spielen Schwarz.

	Related posts
	
	Ultimate in Wisconsin - Hucktoberfest Whitewater 2006 (0)
	Ultimate Frisbee im ZDF (0)
	Ultimate bei 60° (0)
	Ultimate bei 34° (0)
	Tom&#8217;s [...]]]></description>
			<content:encoded><![CDATA[<p>Am Wochenende hatte die <span class="caps">TGS</span> Vorwärts 1874 Frankfurt ihr Sommerfest in Frankfurt-Rödelheim. Das <a href="http://www.ultimate-eintracht.de/">Frankfurter Ultimate-Team</a> hatte uns eingeladen, zu einem Show-Spiel dort anzutreten.</p>
<p>Hier sind einige Fotos vom Spiel:</p>
<div id="gallery"><a rel="lightbox[Ultimate-Frankfurt]" href="http://berhorn.de/assets/2007/8/27/P1010483.JPG"><img src="http://berhorn.de/assets/2007/8/27/P1010483_thumb.JPG" alt="" /></a><br />
<a rel="lightbox[Ultimate-Frankfurt]" href="http://berhorn.de/assets/2007/8/27/P1010481.JPG"><img src="http://berhorn.de/assets/2007/8/27/P1010481_thumb.JPG" alt="" /></a><br />
<a rel="lightbox[Ultimate-Frankfurt]" href="http://berhorn.de/assets/2007/8/27/P1010476.JPG"><img src="http://berhorn.de/assets/2007/8/27/P1010476_thumb.JPG" alt="" /></a><br />
<a rel="lightbox[Ultimate-Frankfurt]" href="http://berhorn.de/assets/2007/8/27/P1010478.JPG"><img src="http://berhorn.de/assets/2007/8/27/P1010478_thumb.JPG" alt="" /></a><br />
<a rel="lightbox[Ultimate-Frankfurt]" href="http://berhorn.de/assets/2007/8/27/P1010475.JPG"><img src="http://berhorn.de/assets/2007/8/27/P1010475_thumb.JPG" alt="" /></a> </p>
</div>
<p><a href="http://www.arsludendi.de/">Arsludendi Darmstadt</a> ist traditionell in Gelb-blau, die Frankfurter spielen Schwarz.</p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li><a href="http://berhorn.de/2006/10/03/ultimate-in-wisconsin-hucktoberfest-whitewater-2006" title="Ultimate in Wisconsin - Hucktoberfest Whitewater 2006 (3. Oktober  2006)">Ultimate in Wisconsin - Hucktoberfest Whitewater 2006</a> (0)</li>
	<li><a href="http://berhorn.de/2007/07/17/ultimate-frisbee-im-zdf" title="Ultimate Frisbee im ZDF (17. Juli  2007)">Ultimate Frisbee im ZDF</a> (0)</li>
	<li><a href="http://berhorn.de/2006/10/30/ultimate-bei-60%c2%b0" title="Ultimate bei 60° (30. Oktober  2006)">Ultimate bei 60°</a> (0)</li>
	<li><a href="http://berhorn.de/2006/10/23/ultimate-bei-34%c2%b0" title="Ultimate bei 34° (23. Oktober  2006)">Ultimate bei 34°</a> (0)</li>
	<li><a href="http://berhorn.de/2007/05/02/toms-tourney-2007-in-brugge" title="Tom&#8217;s Tourney 2007 in Brügge (2. Mai  2007)">Tom&#8217;s Tourney 2007 in Brügge</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2007/08/27/ultimate-frisbee-bei-der-tgs-vorwarts-frankfurt/feed</wfw:commentRss>
		</item>
		<item>
		<title>Gästebuchspam auf kfl-herzebrock.de</title>
		<link>http://berhorn.de/2007/07/29/gastebuchspam-auf-kfl-herzebrockde</link>
		<comments>http://berhorn.de/2007/07/29/gastebuchspam-auf-kfl-herzebrockde#comments</comments>
		<pubDate>Sun, 29 Jul 2007 13:30:00 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[On Software]]></category>

		<category><![CDATA[Gästebuchspam]]></category>

		<category><![CDATA[Länderstatistik]]></category>

		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">tag:berhorn.de,2007-07-29 13:30:00:100</guid>
		<description><![CDATA[Im Gästebuch auf www.kfl-herzebrock.de kämpfen wir seit längerem mit Spam-Einträgen. Also solchen Einträgen, die keiner sehen will und in denen es wahlweise um irgendwelche Medikamente, Klingeltöne oder obskure Internetseiten geht.
Sobald man einmal auf der Liste der Spammer ist, kann nicht viel anderes tun als diese Einträge irgendwie zu entsorgen. Irgendwelche Schranken wie die Eingabe eines [...]]]></description>
			<content:encoded><![CDATA[<p>Im <a href="http://www.kfl-herzebrock.de/Gastebuch/">Gästebuch</a> auf <a href="http://www.kfl-herzebrock.de">www.kfl-herzebrock.de</a> kämpfen wir seit längerem mit Spam-Einträgen. Also solchen Einträgen, die keiner sehen will und in denen es wahlweise um irgendwelche Medikamente, Klingeltöne oder obskure Internetseiten geht.</p>
<p>Sobald man einmal auf der Liste der Spammer ist, kann nicht viel anderes tun als diese Einträge irgendwie zu entsorgen. Irgendwelche Schranken wie die Eingabe eines Buchstabencodes haben wir nicht eingebaut, um es unseren Besuchern auch weiterhin einfach zu ermöglichen, Einträge im Gästebuch zu machen.</p>
<h4>Nachgerechnet</h4>
<p>Seit dem 08.02.2007, also seit nicht ganz einem halben Jahr, führt der Wächter über gut und böse im Gästebuch Statistik darüber, warum geblockt wurde und aus welchem Land der “Müll” kommt.<br />
Bis heute, dem 29.07.2007 wurde 6517 mal kein Eintrag vorgenommen. Bei einem Zeitraum von 171 Tagen macht das 38 Müll-Einträge pro Tag.</p>
<h4>Länderstatistik</h4>
<p>Und gewonnen haben: Die <span class="caps">USA</span>. 20% kommen aus dem Land der unbegrenzten Möglichkeiten. Platz 2. geht mit 8,5% an die Türkei, Platz 3. mit noch gut 7,7% geht an Südkorea. Deutschland folgt mit 3,2% Anteil auf Platz 11. unserer Liste.<br />
Folgende Grafik veranschaulicht das:</p>
<p><img src="http://berhorn.de/assets/2007/7/29/nachLand.jpg" alt="" /></p>
<p>Die Länderzuordnung soll zu ca. 98% akkurat sein. Im Großen und Ganzen sollte die Länderzuordnung richtig sein (basiert auf Maxmind <a href="http://www.maxmind.com/app/geolitecountry">GeoLight Country</a> ).</p>
<h4>Warum wurde geblockt</h4>
<p>Bevor ein Eintrag im Gästebuch veröffentlicht wird, durchläuft er folgende Prüfkette:</p>
<ul>
<li>Steht im Eintrag überhaupt etwas?</li>
<li>Kommt ein Wort aus der Schlagwortliste vor?</li>
<li>Ist der Rechner von dem Eintrag kommt als spamversendender Rechner bekannt?</li>
<li>Laut <a href="http://akismet.com/">Akismet</a> Spam?</li>
</ul>
<p>Dabei ergibt sich, dass das meiste schon durch nach Prüfung der Schlagwortliste abgewiesen werden kann:</p>
<p><img src="http://berhorn.de/assets/2007/7/29/warum.jpg" alt="" /></p>
<p>Erstaunlich viele Einträge enthalten gar nichts und zu Akismet müssen “nur” noch 8%.</p>
<h4>Und nun?</h4>
<p>Zu überlegen wäre, um man Einträge aus Ländern wie der Türkei oder Russland gar nicht erst zulässt. Die <span class="caps">USA</span> rauszunehmen wäre ein wenig risikoreich, weil der ein oder andere bei einem Anbieter surft, der eine amerikanische Mutterfirma hat, so dass schon mal die Rechneradressen den <span class="caps">USA</span> zugeordnet werden können.<br />
Dann wäre allerdings ein Gruß-Eintrag aus dem Türkei-Urlaub auch nicht mehr möglich. Im Moment ist so etwas erst mal nicht nötig, da so gut wie alle Einträge automatisch entsorgt werden.</p>
<p>Somit können wir dann auch weiterhin auf die Eingabe eine Codes oder ähnliches verzichten. Und 38mal täglich wird uns Betreibern das manuelle aussortieren erspart.</p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li><a href="http://berhorn.de/2007/05/14/fuzzyocr-im-einsatz" title="FuzzyOcr im Einsatz (14. Mai  2007)">FuzzyOcr im Einsatz</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2007/07/29/gastebuchspam-auf-kfl-herzebrockde/feed</wfw:commentRss>
		</item>
		<item>
		<title>Ultimate Frisbee im ZDF</title>
		<link>http://berhorn.de/2007/07/17/ultimate-frisbee-im-zdf</link>
		<comments>http://berhorn.de/2007/07/17/ultimate-frisbee-im-zdf#comments</comments>
		<pubDate>Tue, 17 Jul 2007 12:12:00 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[Ultimate-Frisbee]]></category>

		<category><![CDATA[ZDF]]></category>

		<guid isPermaLink="false">tag:berhorn.de,2007-07-17 12:12:00:99</guid>
		<description><![CDATA[
Das ZDF hat Gestern einen kurzes Porträt über Ultimate Frisbee in den Mittagsnachrichten gebracht.
Also wer schon immer mal einen besseren Eindruck von der Sportart bekommen wollte, der findet den Film in der ZDF-Mediathek:
http://www.zdf.de/ZDFmediathek/inhalt/3/0,4070,5568035-5,00.html

	Related posts
	
	Ultimate in Wisconsin - Hucktoberfest Whitewater 2006 (0)
	Ultimate Frisbee bei der TGS Vorwärts Frankfurt (0)
	Ultimate bei 60° (0)
	Ultimate bei 34° (0)
	Tom&#8217;s Tourney [...]]]></description>
			<content:encoded><![CDATA[<p><img src="http://berhorn.de/assets/2007/7/17/zdf-screenshot.png" alt="" /></p>
<p>Das <span class="caps">ZDF</span> hat Gestern einen kurzes Porträt über Ultimate Frisbee in den Mittagsnachrichten gebracht.<br />
Also wer schon immer mal einen besseren Eindruck von der Sportart bekommen wollte, der findet den Film in der <span class="caps">ZDF</span>-Mediathek:</p>
<p><a href="http://www.zdf.de/ZDFmediathek/inhalt/3/0,4070,5568035-5,00.html">http://www.zdf.de/ZDFmediathek/inhalt/3/0,4070,5568035-5,00.html</a></p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li><a href="http://berhorn.de/2006/10/03/ultimate-in-wisconsin-hucktoberfest-whitewater-2006" title="Ultimate in Wisconsin - Hucktoberfest Whitewater 2006 (3. Oktober  2006)">Ultimate in Wisconsin - Hucktoberfest Whitewater 2006</a> (0)</li>
	<li><a href="http://berhorn.de/2007/08/27/ultimate-frisbee-bei-der-tgs-vorwarts-frankfurt" title="Ultimate Frisbee bei der TGS Vorwärts Frankfurt (27. August  2007)">Ultimate Frisbee bei der TGS Vorwärts Frankfurt</a> (0)</li>
	<li><a href="http://berhorn.de/2006/10/30/ultimate-bei-60%c2%b0" title="Ultimate bei 60° (30. Oktober  2006)">Ultimate bei 60°</a> (0)</li>
	<li><a href="http://berhorn.de/2006/10/23/ultimate-bei-34%c2%b0" title="Ultimate bei 34° (23. Oktober  2006)">Ultimate bei 34°</a> (0)</li>
	<li><a href="http://berhorn.de/2007/05/02/toms-tourney-2007-in-brugge" title="Tom&#8217;s Tourney 2007 in Brügge (2. Mai  2007)">Tom&#8217;s Tourney 2007 in Brügge</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2007/07/17/ultimate-frisbee-im-zdf/feed</wfw:commentRss>
		</item>
		<item>
		<title>Kollaborative Spam-Filter im Einsatz</title>
		<link>http://berhorn.de/2007/06/03/kollaborative-spam-filter-im-einsatz</link>
		<comments>http://berhorn.de/2007/06/03/kollaborative-spam-filter-im-einsatz#comments</comments>
		<pubDate>Sun, 03 Jun 2007 13:47:00 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[On Software]]></category>

		<category><![CDATA[DCC]]></category>

		<category><![CDATA[iXHash]]></category>

		<category><![CDATA[Spamassassin]]></category>

		<guid isPermaLink="false">tag:berhorn.de,2007-06-03 13:47:00:95</guid>
		<description><![CDATA[Hier einige Statistiken von kollaborativen Hash-Filtern von meinem
System, die ich aus den syslog gefiltert habe.
IXHASH und LOGINHASH basieren auf dem Hash-Filter des Heise-Verlags (siehe nixspam.org).
DCC bezieht sich auf das Distributed Checksum Clearinghouse
Mein System ist eher “klein”. Der Spamanteil liegt bei ca. 80%. Ca.
55% des Spams werden schon in der SMTP-Phase geblockt (Blacklists,
Surbl-Domains und Viren). Der [...]]]></description>
			<content:encoded><![CDATA[<p>Hier einige Statistiken von kollaborativen Hash-Filtern von meinem<br />
System, die ich aus den syslog gefiltert habe.</p>
<p><span class="caps">IXHASH</span> und <span class="caps">LOGINHASH</span> basieren auf dem Hash-Filter des Heise-Verlags (siehe <a href="http://nixspam.org">nixspam.org</a>).<br />
<span class="caps">DCC</span> bezieht sich auf das <a href="http://rhyolite.com/anti-spam/dcc/">Distributed Checksum Clearinghouse</a></p>
<p>Mein System ist eher “klein”. Der Spamanteil liegt bei ca. 80%. Ca.<br />
55% des Spams werden schon in der <span class="caps">SMTP</span>-Phase geblockt (Blacklists,<br />
Surbl-Domains und Viren). Der Spamassassin, in dem die Hash-Filter<br />
laufen, bekommt somit also “nur” noch  45% ab.</p>
<p>Zeitraum für die Statistiken ist Mai 2007</p>
<p>Anteile der im Grauzonen-Bereich (SA-Score &lt;5):</p>
<pre><code>47 DCC_CHECK
 3 LOGINHASH1
 3 IXHASH
 1 LOGINHASH2</code></pre>
<p>Diese Zahlen sind mit Vorsicht zu genießen, da manchmal auch ein noch<br />
schlecht trainierter Bayes-Filter nicht den Auschlag über die<br />
5er-Schwelle gegeben hat.<br />
Es handelt sich aber meistens um Massennewsletter, auf die <span class="caps">DCC</span> per<br />
Definition drauf anschlägt. Ixhash hat z.B. auf einen<br />
Apple-Newsletter angeschlagen.</p>
<p>Da wo es eindeutig war (SA-Score &gt; 5), sah es im Mai wie folgt aus:</p>
<pre><code>959 DCC_CHECK
746 LOGINHASH1
654 IXHASH
282 LOGINHASH2</code></pre>
<p>In dem Zeitraum sind 3500 Spams hereingekommen.<br />
Das macht also für Ixhash ca. 19%.  Diese Zahl ist gar nicht so schlecht, da die Hash-Prüfsummen basieren, die spezifisch für den Spam sind, den die Heise-Redakteure erhalten.<br />
Mit einem selbsttranierten Hash-Repository ließe sich sicher eine noch bessere Quote erreichen.</p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li><a href="http://berhorn.de/2007/05/14/fuzzyocr-im-einsatz" title="FuzzyOcr im Einsatz (14. Mai  2007)">FuzzyOcr im Einsatz</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2007/06/03/kollaborative-spam-filter-im-einsatz/feed</wfw:commentRss>
		</item>
		<item>
		<title>FuzzyOcr im Einsatz</title>
		<link>http://berhorn.de/2007/05/14/fuzzyocr-im-einsatz</link>
		<comments>http://berhorn.de/2007/05/14/fuzzyocr-im-einsatz#comments</comments>
		<pubDate>Mon, 14 May 2007 20:35:00 +0000</pubDate>
		<dc:creator>Ansgar Berhorn</dc:creator>
		
		<category><![CDATA[Deutsch]]></category>

		<category><![CDATA[On Software]]></category>

		<category><![CDATA[FuzzyOCR]]></category>

		<category><![CDATA[Spam]]></category>

		<category><![CDATA[Spamassassin]]></category>

		<guid isPermaLink="false">tag:berhorn.de,2007-05-14 20:35:00:93</guid>
		<description><![CDATA[Seit einiger Zeit nimmt auf meinem Server die Anzahl der Spamemails im Grauzonen-Bereich zu. Das sind solche Spam-Emails, die zwar als Spam erkannt wurden, aber nicht ausreichend Punkte vom Spamassassin bekommen haben, um ungesehen wegsortiert zu werden.
Wenn man dann in den Ordner mit den Grauzonen-Emails schaut, stellt man fest, dass eigentlich alle Spams recht eindeutig [...]]]></description>
			<content:encoded><![CDATA[<p>Seit einiger Zeit nimmt auf meinem Server die Anzahl der Spamemails im Grauzonen-Bereich zu. Das sind solche Spam-Emails, die zwar als Spam erkannt wurden, aber nicht ausreichend Punkte vom Spamassassin bekommen haben, um ungesehen wegsortiert zu werden.</p>
<p>Wenn man dann in den Ordner mit den Grauzonen-Emails schaut, stellt man fest, dass eigentlich alle Spams recht eindeutig aussehen. Die meisten fallen in zwei Kategorien:</p>
<ul>
<li>Penny-Stock-Options (<a href="http://www.heise.de/newsticker/meldung/89672">heise.de</a> schrieb gestern darüber)</li>
<li>Spam-Botschaft nur in einem Bild</li>
</ul>
<p>Wenn erstere von einem frisch infizierten Spam-Bot kommen und außer den Aktientitel keine einschlägigen Wörter enthalten, rutschen diese Emails durch. Es sind nunmal Penny-Stocks…</p>
<p>Zweitere kann man mit FuzzyOCR bekämpfen. Auf Emails mit Bildern wird <a href="http://de.wikipedia.org/wiki/Texterkennung" title="OCR">Texterkennung</a> angewendet und wenn einschlägige Wörter gefunden werden, wird die Email als Spam gewertet.</p>
<p>Das funktioniert erstaunlich gut und nicht merklich mehr Zeit für die Erkennung durch den Spamassassin.<br />
Ich habe einen Test mit 1 einem selbstgebauten Bild und 11 Bildern aus meinem Grauzonen-Ordner gemacht.<br />
Von den 12 Bildern wurden nur zwei von FuzzyOCR nicht erkannt.</p>
<p>Hier sind die Bilder mit den entsprechenden Ergebnissen. </p>
<div>
<a href="http://berhorn.de/assets/2007/5/14/sff.gif" title="Eigenkreation, 0.8 seconds, 5159 bytes, 6.0 FUZZY_OCR"><img src="http://berhorn.de/assets/2007/5/14/sff_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/cathodoluminescence.gif" title="1.0 seconds, 6595 bytes, 4.0 FUZZY_OCR "><img src="http://berhorn.de/assets/2007/5/14/cathodoluminescence_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/dregs.gif" title="2.7 seconds, 9433 bytes, nichts erkannt"><img src="http://berhorn.de/assets/2007/5/14/dregs_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/Unbekannt-1.gif" title="1.3 seconds, 16198 bytes, 5.0 FUZZY_OCR"><img src="http://berhorn.de/assets/2007/5/14/Unbekannt-1_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/gala.gif" title="4.2 seconds, 16738 bytes, 12 FUZZY_OCR"><img src="http://berhorn.de/assets/2007/5/14/gala_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/Unbekannt-2.gif" title="1.8 seconds, 13921 bytes, 5.0 FUZZY_OCR"><img src="http://berhorn.de/assets/2007/5/14/Unbekannt-2_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/Unbekannt-3.gif" title="1.2 seconds, 8101 bytes, 11 FUZZY_OCR "><img src="http://berhorn.de/assets/2007/5/14/Unbekannt-3_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/Unbekannt-4.gif" title="1.8 seconds, 11364 bytes, 10 FUZZY_OCR"><img src="http://berhorn.de/assets/2007/5/14/Unbekannt-4_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/Unbekannt.gif" title="1.8 seconds, 25025 bytes, FUZZY_OCR=6.000"><img src="http://berhorn.de/assets/2007/5/14/Unbekannt_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/warmly.gif" title="1.6 seconds, 18085 bytes, 10 FUZZY_OCR"><img src="http://berhorn.de/assets/2007/5/14/warmly_thumb.gif" alt="" /></a><br />
<a href="http://berhorn.de/assets/2007/5/14/idealism.gif" title="1.9 seconds, 13943 bytes, nichts erkannt"><img src="http://berhorn.de/assets/2007/5/14/idealism_thumb.gif" alt="" /></a></p>
<div></div>
</div>
<p>Wenn man die Zeiten betrachtet, fallen nur zwei mit mehr als 2 Sekunden heraus. Zu dem Zeitpunkt hatte das System allerdings viel zu tun. Der Test fand auf einer dedizierten Linux-Maschine mit Gentoo-Linux und fuzzyocr-2.3b statt. Es handelt sich um einen 2,4Ghz Celeron.</p>
<p>Einziges Problem scheint zu sein, dass viele Spam-Bilder so versteckt verpackt sind, dass sie gar nicht erst zur Bewertung herangezogen werden. In meinen Tests habe ich die Bilder sauber angehängt und nicht die Orginal-Spams verwendet.</p>
<p>Diskussion zum Thema im <a href="http://www.heise.de/ix/foren/go.shtml?list=1&amp;#38;forum_id=48292">NiX-Spam-Forum</a> bei heise:<br />
<a href="http://www.heise.de/ix/foren/go.shtml?read=1&amp;#38;msg_id=12756091&amp;#38;forum_id=48292&amp;#38;showthread=1">Erfahrungen mit FuzzyOCR?</a></p>

	<h4>Related posts</h4>
	<ul class="st-related-posts">
	<li><a href="http://berhorn.de/2007/06/03/kollaborative-spam-filter-im-einsatz" title="Kollaborative Spam-Filter im Einsatz (3. Juni  2007)">Kollaborative Spam-Filter im Einsatz</a> (0)</li>
	<li><a href="http://berhorn.de/2007/07/29/gastebuchspam-auf-kfl-herzebrockde" title="Gästebuchspam auf kfl-herzebrock.de (29. Juli  2007)">Gästebuchspam auf kfl-herzebrock.de</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://berhorn.de/2007/05/14/fuzzyocr-im-einsatz/feed</wfw:commentRss>
		</item>
	</channel>
</rss>
