Qualitative Interviews: Whisper → MAXQDA-Workflow
Wer qualitative Interviews auswertet, kennt das Spannungsfeld zwischen Whisper-Geschwindigkeit und MAXQDA-Anforderungen: Whisper liefert in Minuten ein Transkript, MAXQDA und f4analyse erwarten aber eine bestimmte Struktur mit Sprecherwechseln, Zeitstempeln und sauberen Absätzen. Dieser Beitrag beschreibt einen Workflow, mit dem die KI-Transkription direkt MAXQDA-tauglich landet — ohne stundenlange manuelle Nachbearbeitung.
Drei Format-Anforderungen, die MAXQDA an Transkripte stellt
MAXQDA importiert verschiedene Formate (DOCX, RTF, TXT) — aber für Codierung mit Zeitbezug und Sprecher-Filter müssen drei Strukturen vorhanden sein: erkennbare Sprecher-Labels am Absatzbeginn (z. B. „Interviewer:" oder „IP1:"), optional Zeitstempel pro Absatz (#hh:mm:ss# oder ähnliches Format) und konsistente Absatz-Trennung. Ohne diese Struktur wird das Transkript zum reinen Text-Korpus ohne MAXQDA-Mehrwert.
Workflow in fünf Schritten
1. Aufnahme mit klarer Tonspur
Externes Mikrofon oder gutes Headset, Stereo-Aufnahme bei zwei Sprechern, möglichst ruhige Umgebung. Whisper-Genauigkeit hängt laut OpenAI-Whisper-Paper stark von der Audioqualität ab — bei klarem Deutsch typischerweise Wortfehlerrate 4-7%, bei Hintergrundlärm deutlich darüber.
2. Hochladen mit Sprache und Sprechertrennung
Im Transkriptionstool die Sprache vorgeben (Deutsch) — automatische Erkennung kostet Genauigkeit. Sprechertrennung („Diarization") aktivieren, wenn das Tool sie anbietet. Bei reinen Einzel-Aufnahmen (Vorlesung) ist Sprechertrennung nicht nötig.
3. Auto-Anonymisierung optional vor Export
Wenn personenbezogene Namen in der Aufnahme genannt werden: vor dem Export pseudonymisieren. Werkzeug-Empfehlung: Tools mit konfigurierbarem Mapping-Lifecycle (verwerfen / behalten / 30 Tage) erlauben spätere Re-Identifikation für Nachfragen.
4. DOCX-Export mit MAXQDA-Struktur
Export-Format wählen: DOCX mit Sprecher-Labels am Absatzbeginn und optionalen Zeitstempeln. Bei f4analyse: f4transcript-Export (.f4t) — das proprietäre Format des Tools mit eingebauten Timecode-Markern.
5. Import in MAXQDA
In MAXQDA über „Dokumente → Importieren → Transkript" laden. Die Software erkennt Sprecher-Labels automatisch, wenn sie konsistent am Absatzbeginn stehen. Bei Timecodes: MAXQDA verknüpft die Audio-Datei automatisch mit dem Transkript-Text, sodass beim Klick auf einen Absatz die zugehörige Audio-Stelle abspielt.
DOCX-Struktur, die in MAXQDA „einfach funktioniert"
Sprecher-Label-Konvention
„Interviewer:" / „IP1:" / „IP2:" oder Klartextnamen wie „Sarah Müller:" — wichtig: Doppelpunkt am Ende, gleich am Absatzbeginn, durchgehend gleich geschrieben. MAXQDA filtert später nach exakt diesen Strings.
Zeitstempel-Format
#00:01:23# oder [00:01:23] sind weit verbreitete Konventionen. MAXQDA und f4analyse erkennen typische Timecode-Formate; im Zweifel im Tool-Handbuch nachschlagen. Optional: nur ein Timestamp pro Absatz, nicht pro Sprecherwechsel.
Absatz-Trennung
Ein Absatz pro Redebeitrag — auch wenn der Redebeitrag mehrere Sätze umfasst. Kein Zeilenumbruch innerhalb eines Beitrags. Lange Pausen oder Themenwechsel können einen Sprecher in zwei Absätze trennen.
Nonverbale Marker
Übliche Konventionen: „(lacht)", „(unverständlich)", „...". Konsistent verwenden — MAXQDA kann diese später als eigene Codes erfassen, wenn Sie sich an ein einheitliches Schema halten.
f4analyse-Export — wann lohnt sich das?
f4transcript (.f4t) ist das proprietäre Format von f4analyse, einer Alternative zu MAXQDA. Vorteil: feinerer Zeitcode-Bezug (Wortebene statt Absatzebene), eingebaute Player-Steuerung beim Hören. Nachteil: f4analyse ist weniger verbreitet als MAXQDA, der Austausch zwischen Forschenden schwieriger. Empfehlung: DOCX-Export für maximale Kompatibilität, f4transcript zusätzlich nur bei Bedarf für f4analyse-Workflows.
Weiterführend
Quellen & Hinweise
OpenAI-Whisper-Paper „Robust Speech Recognition via Large-Scale Weak Supervision" (Radford et al., 2022) zur Wortfehlerrate · MAXQDA-Dokumentation zu Transkript-Import · VERBI-Hinweise zu f4transcript-Format. Dieser Beitrag ist eine Workflow-Empfehlung — bitte Ihre Tool-Versionen und institutsspezifischen Vorgaben (z. B. Methodenzentrum) prüfen, bevor Sie den Workflow im großen Projekt einsetzen.
Transkribr für qualitative Forschung
DOCX-Export mit Sprecher-Labels und Zeitstempeln für MAXQDA-Import, f4transcript-Export für f4analyse, Auto-Anonymisierung mit Lifecycle-Modi. Verarbeitung auf Servern in Deutschland, sofortige Audio-Löschung. Zahlungsabwicklung über Stripe (EU-Niederlassung Irland, US-Mutterkonzern; Forschungsdaten verlassen Deutschland nicht). 15 Minuten kostenlos testen.
Kostenlos testen