PHP

Simple Anti-FOMO RSS-Reader

Das erste Mal, dass ich ein GitHub Repo public mache. Im RSS-Club hatte ich ja schon mal angedeutet, dass ich einen einzigen RSS-Reader geschrieben habe, der per LLM FeedItem für mich nach Relevanz sortieren soll. Ich muss nicht alles lesen, was mir vor die Augen kommt. Man wird heutzutage ohnehin schon wie blöd mit News vollgepumpt. Quasi ein Anti-FOMO RSS-Reader. Der Name ist noch etwas sperrig.

Feature sind überschaubar:

  • Feeds werden einer OPML-Datei entnommen, gelesen und die Items in einer MySQL Tabelle hinterlegt.
  • Wenn ein ANTHROPIC_API_KEY hinterlegt ist, werden neu gelesene Items mit dem claude-haiku-4-5-20251001-Model klassifiziert. Dazu wird eine Markdown-Datei mit einer Liste von Kategorien herangezogen. Diese enthält je Zeile eine Kategorie mit Schlüsselwörtern/Definition. Die Reihenfolge der Kategorien entspricht der Relevanz. Was nicht vom LLM klassifiziert werden kann, ist „Nicht kategorisiert“ und steht unten in der Liste. Das sind dann in der Regel Posts, die sich nicht mit meinem Interessenbereich decken. Bei der Klassifizierung entstehen geringfügige Kosten.
  • Neue Items können als gelesen markiert werden.
  • Alte Items werden nach 5 entsorgt. * Items können favorisiert werden und bleiben dann über 5 Tage hinaus behalten.

Mehr gibt es noch nicht. Ich könnte mir vorstellen, die index.php zum Lesen auch wegzulassen und stattdessen das Ganze als RSS-Feed mit (soweit verfügbar) vollständigen Posts einfach nur als Feed bereitzustellen, den ich dann mit NetNewsWire lesen kann. Mal sehen …

Eine DDEV-Config ist im Repo enthalten.

Naja, es ist eher eine Art Proof of Concept als eine ernst gemeinte Anwendung. Ich denke, dass man so etwas vielleicht auch mit ein paar Klicks in Inoreader machen könnte. Aber wo bleibt denn da der Spaß.

Zeilenweise Text zum Browser streamen.

Ich wollte im Browser eine zeilenweise Ausgabe erzwingen und habe gemogelt, was das Zeug hält nur um es allein in PHP umzusetzen.

Naja, es funktioniert auf jeden Fall.

set_time_limit(0);

// Streaming-Setup: gzip/deflate aus, alle Puffer-Ebenen schließen, implicit flush an.
if (function_exists('apache_setenv')) {
    apache_setenv('no-gzip', '1');
}
@ini_set('zlib.output_compression', 'Off');
header('Content-Encoding: none');
while (ob_get_level() > 0) {
    ob_end_flush();
}
ob_implicit_flush(true);

// Mini-HTML-Preamble + Padding, 
// damit Firefox/Safari den Render-Threshold (~1 KB) erreichen.
echo "<!doctype html><meta charset=utf-8><title></title>\n";
echo str_repeat(' ', 1024) . "\n";
flush();

// Apache mod_proxy_fcgi puffert FastCGI-Pakete ohne flushpackets=on;
// per-line padding drückt jede Zeile über die Puffer-Schwelle und erzwingt Auslieferung.
$line = static function (string $text): void {
    echo $text . str_repeat(' ', 4096) . "\n";
};

// Ausgabe
for ($i = 1; $i <= 10; $i++) {
    $line($i.'<br>');
    sleep(1);
}

Suchbegriffe in HTML highlighten

Ich denke, ich habe einen recht brauchbaren RegEx gefunden, um Suchbegriffe in HTML zu highlighten und dabei den Inhalt von Tags zu ignorieren. Befindet sich der Suchbegriff beispielsweise in einem href-Attribut eines a-Tags, sollte der natürlich nicht „gehighlighted“ werden.

$html = preg_replace(
    pattern: '/(?![^<>]*>)'.preg_quote($searchTerm, '/').'/ui',
    replacement: '<mark class="tag">$0</mark>',
    subject: $html
);

Naja, wenn es um Tags geht, könnte ich evtl. auf preg_quote() verzichten. Aber der Vollständigkeit halber… 

So im Nachhinein denke ich mir natürlich: „Hmm… Profan!“ Aber ich bin mir sicher, in einem Jahr müsste ich mir wieder den Kopf zerbrechen. Ich habe das gesucht, um in der HTML-Ansicht meines Zettelkastens die assoziierten Tags im Fließtext hervorzuheben.

FTP Deployment

Wenn man einen Virtual Host ohne SSH & Git benutzt, ist es etwas lästig, Änderungen an einer Seite von Hand mit einem FTP Client hochzuladen. Das Projekt ftp-deplyoment kommt einem da stark entgegen.

Wenn man ein Composer Projekt hat, kann man es mit composer require dg/ftp-deployment in das Projekt einbinden. Dann eine deplyoment.php oder deplyoment.ini erstellen, wie es dort beschrieben ist, und vendor/bin/deployment deployment.php vereinfacht das Leben.

Bin ich eigentlich der Einzige, der von DDEV manchmal unglaublich genervt ist. Immer wieder stolpere ich über die beiden folgenden Probleme. Vollkommen egal, ob ich Colima oder OrbStack benutze.

  • Irgendwann hört der Mutagen-Spaß auf zu synchronisieren, oder die Synchronisation ist so langsam, dass effektiv keine Arbeit möglich ist. Obwohl in Anbetracht der ignorierten Verzeichnisse in der .ddev/mutagen/mutagen.yml nur eine Hand voll Dateien übrig bleiben, die überhaupt synchronisiert werden müssten.
  • Xdebug beachtet grundsätzlich nur Breakpoints in der index.php eine Projekts. Alle anderen Breakpoints werden ignoriert.

Es ist zwar nervig, den vollständigen Stack in den passenden Versionen lokal zu installieren. Aber arbeiten konnte ich damit immer sehr gut. Ich denke, ich will dahin zurück…

The Power Of Glob

Mir war nicht klar, dass man mit nur einem Aufruf von glob eine Verzeichnis Struktur rekursiv scannen kann, wenn man zuvor die Tiefe kennt.

glob("$basedir/{,*/,*/*/,*/*/*/}*.jpg", GLOB_BRACE);

Das GLOB_BRACE-Flag ist schon ein Knaller.