Har testet litt mer. Blant annet et 90 minutter langt opptak av panelsamtale på engelsk om den siste boka til Espen Ytreberg om Media and events in history, som fikk nesten alle fagord og akademikere riktig (bortsett fra noen nordiske). Testet også å bytte ut "--output-vtt" med "--output-txt" i koden. Der fungerte helt fint (og er greit dersom en kun vil ha teksten UTEN tidskoder). Oppdaget forøvrig at mine tidligere opptak i 20 bit wav ikke fungerer; kun 16 bit. Men det er jo en smal sak å gjøre om før jeg tekster.
Takk for fin oppskrift. Obs. på min maskin funka imidlertid ikke oppskriften, fordi whisper-mappa la seg under hjem-mappa. La til /whisper.cpp/ i tillegg til ./ -- slik at det ser slik ut:
Koden som gjør om m4a, ogg o.l. til wav-filer i output-mappe (som jeg forøvrig måtte opprette manuelt):
Har testet litt mer. Blant annet et 90 minutter langt opptak av panelsamtale på engelsk om den siste boka til Espen Ytreberg om Media and events in history, som fikk nesten alle fagord og akademikere riktig (bortsett fra noen nordiske). Testet også å bytte ut "--output-vtt" med "--output-txt" i koden. Der fungerte helt fint (og er greit dersom en kun vil ha teksten UTEN tidskoder). Oppdaget forøvrig at mine tidligere opptak i 20 bit wav ikke fungerer; kun 16 bit. Men det er jo en smal sak å gjøre om før jeg tekster.
Takk!
Har du funne ut kven Nikolai Winther er? Ser han dukker opp innimellom på internett:
https://juniorskole.no/podcasts/svp-120599/boer-mamma-og-pappa-ha-skjermtid?
https://www.dagbladet.no/video/thumbnail/65422e2303ed06f62bd8768b/subtitles.srt
https://www.digiung.no/post/de-er-heldigitale-barn-men-mangler-sikkerhetsnett
Har alle desse brukt Whisper, eller har Whisper fanga opp navnet hans i treningsmateriale og fantasert litt?
Takk for fin oppskrift. Obs. på min maskin funka imidlertid ikke oppskriften, fordi whisper-mappa la seg under hjem-mappa. La til /whisper.cpp/ i tillegg til ./ -- slik at det ser slik ut:
Koden som gjør om m4a, ogg o.l. til wav-filer i output-mappe (som jeg forøvrig måtte opprette manuelt):
mkdir -p output;
for i in ./whisper.cpp/data/*; do
f=$(echo "${i##*/}");
filename=$(echo $f | cut -d'.' -f 1);
ffmpeg -i "$i" -acodec pcm_s16le -ac 1 -ar 16000 "./whisper.cpp/output/$(echo $filename).wav";
done
Kode som tekster/oversetter og legger til vtt-fil:
for i in ./whisper.cpp/output/*.wav; do ./whisper.cpp/main -m ./whisper.cpp/models/ggml-large.bin -l no --output-vtt -f "$i"; done