forschung2026-05-107 Min.

Qualitative Interviews: Whisper → MAXQDA-Workflow

Wer qualitative Interviews auswertet, kennt das Spannungsfeld zwischen Whisper-Geschwindigkeit und MAXQDA-Anforderungen: Whisper liefert in Minuten ein Transkript, MAXQDA und f4analyse erwarten aber eine bestimmte Struktur mit Sprecherwechseln, Zeitstempeln und sauberen Absätzen. Dieser Beitrag beschreibt einen Workflow, mit dem die KI-Transkription direkt MAXQDA-tauglich landet — ohne stundenlange manuelle Nachbearbeitung.

Drei Format-Anforderungen, die MAXQDA an Transkripte stellt

MAXQDA importiert verschiedene Formate (DOCX, RTF, TXT) — aber für Codierung mit Zeitbezug und Sprecher-Filter müssen drei Strukturen vorhanden sein: erkennbare Sprecher-Labels am Absatzbeginn (z. B. „Interviewer:" oder „IP1:"), optional Zeitstempel pro Absatz (#hh:mm:ss# oder ähnliches Format) und konsistente Absatz-Trennung. Ohne diese Struktur wird das Transkript zum reinen Text-Korpus ohne MAXQDA-Mehrwert.

Workflow in fünf Schritten

1. Aufnahme mit klarer Tonspur

Externes Mikrofon oder gutes Headset, Stereo-Aufnahme bei zwei Sprechern, möglichst ruhige Umgebung. Whisper-Genauigkeit hängt laut OpenAI-Whisper-Paper stark von der Audioqualität ab — bei klarem Deutsch typischerweise Wortfehlerrate 4-7%, bei Hintergrundlärm deutlich darüber.

2. Hochladen mit Sprache und Sprechertrennung

Im Transkriptionstool die Sprache vorgeben (Deutsch) — automatische Erkennung kostet Genauigkeit. Sprechertrennung („Diarization") aktivieren, wenn das Tool sie anbietet. Bei reinen Einzel-Aufnahmen (Vorlesung) ist Sprechertrennung nicht nötig.

3. Auto-Anonymisierung optional vor Export

Wenn personenbezogene Namen in der Aufnahme genannt werden: vor dem Export pseudonymisieren. Werkzeug-Empfehlung: Tools mit konfigurierbarem Mapping-Lifecycle (verwerfen / behalten / 30 Tage) erlauben spätere Re-Identifikation für Nachfragen.

4. DOCX-Export mit MAXQDA-Struktur

Export-Format wählen: DOCX mit Sprecher-Labels am Absatzbeginn und optionalen Zeitstempeln. Bei f4analyse: f4transcript-Export (.f4t) — das proprietäre Format des Tools mit eingebauten Timecode-Markern.

5. Import in MAXQDA

In MAXQDA über „Dokumente → Importieren → Transkript" laden. Die Software erkennt Sprecher-Labels automatisch, wenn sie konsistent am Absatzbeginn stehen. Bei Timecodes: MAXQDA verknüpft die Audio-Datei automatisch mit dem Transkript-Text, sodass beim Klick auf einen Absatz die zugehörige Audio-Stelle abspielt.

DOCX-Struktur, die in MAXQDA „einfach funktioniert"

Sprecher-Label-Konvention

„Interviewer:" / „IP1:" / „IP2:" oder Klartextnamen wie „Sarah Müller:" — wichtig: Doppelpunkt am Ende, gleich am Absatzbeginn, durchgehend gleich geschrieben. MAXQDA filtert später nach exakt diesen Strings.

Zeitstempel-Format

#00:01:23# oder [00:01:23] sind weit verbreitete Konventionen. MAXQDA und f4analyse erkennen typische Timecode-Formate; im Zweifel im Tool-Handbuch nachschlagen. Optional: nur ein Timestamp pro Absatz, nicht pro Sprecherwechsel.

Absatz-Trennung

Ein Absatz pro Redebeitrag — auch wenn der Redebeitrag mehrere Sätze umfasst. Kein Zeilenumbruch innerhalb eines Beitrags. Lange Pausen oder Themenwechsel können einen Sprecher in zwei Absätze trennen.

Nonverbale Marker

Übliche Konventionen: „(lacht)", „(unverständlich)", „...". Konsistent verwenden — MAXQDA kann diese später als eigene Codes erfassen, wenn Sie sich an ein einheitliches Schema halten.

f4analyse-Export — wann lohnt sich das?

f4transcript (.f4t) ist das proprietäre Format von f4analyse, einer Alternative zu MAXQDA. Vorteil: feinerer Zeitcode-Bezug (Wortebene statt Absatzebene), eingebaute Player-Steuerung beim Hören. Nachteil: f4analyse ist weniger verbreitet als MAXQDA, der Austausch zwischen Forschenden schwieriger. Empfehlung: DOCX-Export für maximale Kompatibilität, f4transcript zusätzlich nur bei Bedarf für f4analyse-Workflows.

Weiterführend

Quellen & Hinweise

OpenAI-Whisper-Paper „Robust Speech Recognition via Large-Scale Weak Supervision" (Radford et al., 2022) zur Wortfehlerrate · MAXQDA-Dokumentation zu Transkript-Import · VERBI-Hinweise zu f4transcript-Format. Dieser Beitrag ist eine Workflow-Empfehlung — bitte Ihre Tool-Versionen und institutsspezifischen Vorgaben (z. B. Methodenzentrum) prüfen, bevor Sie den Workflow im großen Projekt einsetzen.

Transkribr für qualitative Forschung

DOCX-Export mit Sprecher-Labels und Zeitstempeln für MAXQDA-Import, f4transcript-Export für f4analyse, Auto-Anonymisierung mit Lifecycle-Modi. Verarbeitung auf Servern in Deutschland, sofortige Audio-Löschung. Zahlungsabwicklung über Stripe (EU-Niederlassung Irland, US-Mutterkonzern; Forschungsdaten verlassen Deutschland nicht). 15 Minuten kostenlos testen.

Kostenlos testen