Problemi di trascrizione audio
Quando le trascrizioni sono imprecise, mancanti, o il lavoro fallisce — ecco come risolvere.
21 mag 2026
Vulgate trascrive i caricamenti audio usando modelli speech-to-text di alta qualità. La stragrande maggioranza dei file torna con trascrizioni utilizzabili, ma alcuni problemi comuni si presentano — questo articolo li copre.
Il lavoro termina con errore
Apri Caricamenti → Elaborazione nella barra laterale e clicca sulla riga fallita per il motivo specifico. I più comuni sono:
- Formato non supportato — Converti con
ffmpegin MP3 o WAV e ricarica. Accettiamo MP3, M4A, AAC, WAV, FLAC, OGG, Opus e contenitori video comuni (la traccia audio viene trascritta). - File silenzioso — Un file con meno di pochi secondi di contenuto udibile non può essere trascritto. Conferma che il file si riproduca in modo udibile nel tuo player locale.
- File molto lungo — I file lunghi possono andare in timeout. Dividi con
ffmpeg:
Poi carica ogni parte individualmente.ffmpeg -i input.mp3 -f segment -segment_time 3600 -c copy chunk_%03d.mp3 - Limite di spesa superato — I crediti di elaborazione del tuo piano per il mese sono esauriti. Fai l'upgrade o aspetta il prossimo ciclo.
Per altri messaggi di errore, copia il testo esatto e scrivi a info@vulgate.ai con l'ID del lavoro.
La trascrizione è imprecisa
La qualità della trascrizione è principalmente una funzione della qualità dell'input:
- Rumore di fondo. Bar, folle, ronzio dell'aria condizionata o vento degradano seriamente l'accuratezza. Registra nuovamente in un ambiente più silenzioso se possibile.
- Più parlatori sovrapposti. Vulgate rileva i turni dei parlatori ma il parlato sovrapposto spesso si confonde. Registrare separatamente ogni parlatore sulla propria traccia e caricare separatamente produce risultati drammaticamente migliori.
- Bassa frequenza di campionamento. I file campionati a 8 kHz (audio telefonico vintage, alcuni VoIP) hanno più errori rispetto a 16 kHz o superiore.
- Accenti o dialetti forti. La maggior parte dei dialetti principali sono ben supportati, ma accenti regionali molto forti possono produrre trascrizioni letterali ma sbagliate ("council" → "consul").
- Vocabolario specializzato. Termini teologici, legali o scientifici potrebbero essere trascritti foneticamente.
Audio in lingue miste
Se una registrazione passa da una lingua all'altra (es. un sermone in italiano con passaggi liturgici in latino), la trascrizione seguirà la lingua dominante e inciamperà su quella secondaria. Best practice: dividi il file ai confini linguistici prima di caricare, anche se sono solo due file.
Quando contattarci
Scrivi a info@vulgate.ai con l'ID del lavoro se:
- Ricevi un messaggio di errore non coperto sopra.
- La qualità della trascrizione è drammaticamente peggiore del previsto su un file che hai verificato essere pulito.
- Lo stesso file fallisce ripetutamente nonostante sia ben entro i limiti di dimensione e formato.
Correlati
Cerca nell'assistenza