Projekte · maklerupdate.de

maklerupdate.de

Automatische Überwachung von 50+ Immobilienmaklern im Großraum Düsseldorf – KI-gestützte Property-Extraction und tägliches Crawling ersetzen manuelle Website-Checks

Live
Gründer & Lead Developer · 2021 - heute
SvelteKitSvelte 5SupabasePostgreSQLPostGISTanStack QueryTypeScriptDrizzle ORMOpenAI GPTClaudeInngestDenoFirecrawlTailwind CSS v4Vercel

Das Problem

Wer eine Immobilie in Düsseldorf sucht, muss täglich Dutzende Makler-Websites checken. Die meisten Objekte sind nie auf ImmoScout – lokale Makler listen nur auf der eigenen Website. Manuell 50+ Seiten durchklicken kostet Stunden und man verpasst trotzdem neue Angebote.

Die Lösung

maklerupdate crawlt automatisch 3x täglich alle überwachten Makler-Websites, extrahiert neue Properties per KI und schickt Daily-Digest-Emails an Subscriber. Statt stundenlangem Klicken: einmal Suchkriterien definieren, täglich die relevanten Neuzugänge per Mail bekommen.

Ergebnisse

50+
Überwachte Makler
3x täglich
Automatisches Crawling
0 Minuten
Manueller Aufwand

Architektur

SvelteKit 5 Frontend mit Supabase/PostgreSQL Backend. PostGIS für geografische Queries (Umkreissuche). Multi-Strategie Property-Extraction: LLM-gestützte DOM-Selector-Discovery für statische Sites, JSON-API-Detection für React-SPAs, Heuristic-Fallbacks. Event-driven Background Jobs über Inngest mit automatischem Retry und Monitoring.

Herausforderungen

  • Heterogene Makler-Websites: Jede Site hat andere Struktur – vom WordPress-Theme bis zur Custom React-App
  • DOM-Selector-Discovery: GPT/Claude analysieren HTML und finden automatisch die richtigen CSS-Selektoren für Preis, Adresse, Fläche
  • Change Detection: Nur echte neue Objekte melden, nicht jede Layout-Änderung auf der Website
  • Rate Limiting & Politeness: Nicht als Bot geblockt werden, respektvolle Crawl-Intervalle

Learnings

  • LLMs sind erstaunlich gut darin, HTML-Strukturen zu verstehen und Selektoren vorzuschlagen
  • Firecrawl nimmt viel Pain aus dem Crawling: JavaScript-Rendering, Anti-Bot-Bypassing, strukturierte Markdown-Ausgabe
  • Deno CLI ist perfekt für Admin-Tools: Type-Safety, keine node_modules, läuft überall
  • PostGIS + Drizzle = Type-safe geografische Queries ohne SQL-Strings