Text-Diff
Vergleichen Sie zwei Texte und sehen Sie, was sich geändert hat. Zeilen- oder Wort-Granularität, Live-Vorschau, läuft komplett im Browser.
Was ist ein Text-Diff?
Ein Diff (kurz für Differenz) ist ein Side-by-Side-Bericht darüber, was sich zwischen zwei Texten geändert hat. Klassisch im Versionskontrollkontext — Git, SVN und Co. nutzen Diffs, um die Änderungen jedes Commits zu zeigen — aber dieselbe Idee ist auch beim Lektorat, beim Vergleich von Verträgen, beim Aufspüren kleiner Änderungen in Konfigurationsdateien oder beim Prüfen, ob ein Dokument einen Copy-Paste-Roundtrip unbeschadet überstanden hat, nützlich. Dieses Tool berechnet das Diff über einen Longest-Common-Subsequence-Algorithmus — dieselbe Familie von Techniken, die git diff antreibt.
So nutzen Sie das Tool
Fügen Sie die Originalversion in A und die geänderte Version in B ein. Das Diff erscheint live darunter: grüne Zeilen (oder Wörter) sind Hinzufügungen in B, rote sind Löschungen aus A, einfache Zeilen sind unverändert. Wechseln Sie zwischen Zeilen- und Wort-Granularität, je nachdem was Sie sehen wollen — Zeilen-Diffs eignen sich am besten für Code oder strukturierte Texte, Wort-Diffs sind bei Prosa lesbarer, wo kleine Wortänderungen zählen. Statistiken oberhalb der Ausgabe zeigen die Anzahl hinzugefügter, entfernter und unveränderter Tokens.
Wann Zeilen- vs. Wort-Diff?
Zeilen-Diff ist der richtige Standard für Code, JSON, CSV, Logdateien und alles, wo die Struktur auf Zeilenebene lebt. Eine einzelne Zeichenänderung erscheint als entfernte und hinzugefügte Zeile — leicht zu scannen und entspricht dem, was Versionskontrolltools tun. Wort-Diff glänzt bei Prosa: Es hebt die tatsächlich geänderten Wörter innerhalb eines Absatzes hervor, sodass Sie Änderungen sehen, ohne den ganzen Text neu zu lesen. Vermeiden Sie Wort-Diff bei sehr langen Dokumenten — die LCS-Berechnung wird quadratisch und fühlt sich oberhalb einiger tausend Wörter langsam an.
Häufig gestellte Fragen
Wird mein Text irgendwohin hochgeladen?
Wie funktioniert der Diff-Algorithmus?
diff verwendet. Bei sehr großen Eingaben (über ~2.000 Tokens pro Seite) fällt das Tool auf einen einfachen Position-für-Position-Vergleich zurück, der schneller, aber suboptimal ist.Warum sieht das Ergebnis manchmal seltsam aus?
Was ist mit Leerzeichen?
Kann ich das Diff exportieren?
diff -u a.txt b.txt auf der Kommandozeile aus oder verwenden git diff --no-index a.txt b.txt für reichere Ausgabe wie auf GitHub.Warum werden Zeilenumbrüche manchmal als Änderungen markiert?
\r\n (CRLF), Unix und macOS \n (LF). Wenn Text zwischen Systemen kopiert wird, können sich Zeilenumbrüche mischen, und das Diff behandelt line\r und line als unterschiedlich. Lassen Sie den Text durch ein Tool wie dos2unix laufen oder fügen Sie ihn über einen Klartext-Editor ein, der Zeilenumbrüche normalisiert, bevor Sie vergleichen.