Při většině kvalitativních výzkumů řešíme, ať už skupinového rozhovoru, nebo hloubkového rozhovoru, jak se dostat od audio nahrávky rozhovoru k psanému textu, který bychom mohli analyzovat. Prozatím nejobvyklejším způsobem je pořízení manuálních přepisů, to je ale jak finančně nákladné, tak časově náročné. Podíval jsem se na to, jaké jsou možnosti využití umělé inteligence pro přepis. Ve zkratce: a) pokud nám jde o nejlevnější možnost, tak doporučuji model Whisper od OpenAI. b) pokud jde o online rozhovor, tak je nejjednodušší využít Microsoft Teams s integrovanou možností přepisu a nahrávání. Je třeba pořídit co nejkvalitnější audio.
Shrnutí:
Text se zabývá možnostmi přepisu nahrávek kvalitativních výzkumů, jako jsou skupinové a hloubkové rozhovory, pomocí umělé inteligence. Nejčastěji se používá manuální přepis, který je finančně i časově náročný. Textu poskytuje přehled možností využití umělé inteligence pro přepis, včetně modelu Whisper od OpenAI, který je doporučen pro nejlevnější řešení. Také jsou uvedeny informace o přepisu v Microsoft Teams a Microsoft Word pro web a webových službách pro přepis.
MS Word for web (365)
- přepis záznamu (speech to text) / přepis živě
- 300 minut měsíčně
- potřebná licence: Microsoft 365 (je třeba ověřit, mění se to)
- info, podporované jazyky:
- EN: Dictate your documents in Word – Microsoft Support
- CZ https://support.microsoft.com/cs-cz/office/p%C5%99epis-nahr%C3%A1vek-7fc2efec-245e-45f0-b053-2a97531ecf57
- podporované jazyky: viz odkaz výše
MS Teams
- přepis živě + uložení přepisu (= neumožňuje přepis nahrávky)
- Pro zákazníky s následujícími licencemi: Office 365 E1, Office 365 A1, Office 365/Microsoft 365 A3, Office 365/Microsoft 365 A5, Microsoft 365 E3, Microsoft 365 E5, Microsoft 365 F1, Office 365/Microsoft 365 F3, Microsoft 365 Business Basic, Microsoft 365 Business Standard, Microsoft 365 Business Premium SKU.
- info:
- b) uložení audio/video záznamu, po čase soubor zmizí (detaily:
- EN: https://support.microsoft.com/en-us/office/record-a-meeting-in-teams-34dfbe7f-b07d-4a27-b4c6-de62f1348c24
- CZ: https://support.microsoft.com/cs-cz/office/nahr%C3%A1v%C3%A1n%C3%AD-sch%C5%AFzky-v-teams-34dfbe7f-b07d-4a27-b4c6-de62f1348c24 )
- potřebná licence: Office 365 Enterprise E1, E3, E5, F3, A1, A3, A5, M365 Business, Business Premium nebo Business Essentials.
Google Speech to text api
- Speech Recognition (without Data Logging – default): 0-60 Minutes – Free; Over 60 Minutes – $0.024 / minute
- nevyzkoušeno
Webové služby:
- ani u jedné služby nebyl přepis do CZ přesvědčivý
Speech https://speechtext.ai/cs
- 180 minut/10 USD, 990 minut/49 USD
- kredit (pay as you go, nikoli měsíční platba)
- 0,02 USD/min
Google Recorder (nezkoušeno)
- na mobilech řady Pixel, ukládání přepisu do cloudu na novějších
Model Whisper Open.ai – vlastní instalace
- výhody: rychlý přepis viz ukázka a ukázka s časy
- nevýhody: není přesný – vyžaduje korektury, není identifikace mluvčího (diarization)
- identifikace mluvčího – jde obejít přes další úpravy , viz výstup
- pro představu: přepis 10 min rozhovoru trvá 6 minut výpočetního času (na Google hardwaru), ale nejspíše se přepis vejde do free tarifu
Je třeba co nejkvalitnější audio
- v případě online rozhovoru určitě doporučuji sluchátka a mikrofon, jakákoli jsou lepší než žádná. V případě rozhovoru naživo – pokud nemáme k dispozici profi studio pro skupinový rozhovor – jsou velmi dobrá doporučení na tomto odkazu. https://www.indianscribes.com/4-ways-to-improve-focus-group-recordings/
Dbát na to:
- aby se nepřekrývaly hlasy,
- abychom nechali respondenty dokončit větu,
- zdržet se hlasitého vyjadřování porozumění respondentovi – zůstat pouze u neverbálních projevů (pokyvovat na znamení porozumění), i když to může být obtížné.
Závěry:
- pro online rozhovory: MS Teams
- pro záznamy/ pro osobní rozhovory/fokusky/ speech to text transkripce:
- MS Word 365
- Whisper AI – vlastní instalace
- zkusit mít co nejlepší kvalitu audia
Kredit: Koncept napsán člověkem, text napsán člověkem, shrnutí vytvořeno pomocí AI/ChatGPT.