11 Comments
Jan 16, 2023Liked by Ida Aalen

Har testet litt mer. Blant annet et 90 minutter langt opptak av panelsamtale på engelsk om den siste boka til Espen Ytreberg om Media and events in history, som fikk nesten alle fagord og akademikere riktig (bortsett fra noen nordiske). Testet også å bytte ut "--output-vtt" med "--output-txt" i koden. Der fungerte helt fint (og er greit dersom en kun vil ha teksten UTEN tidskoder). Oppdaget forøvrig at mine tidligere opptak i 20 bit wav ikke fungerer; kun 16 bit. Men det er jo en smal sak å gjøre om før jeg tekster.

Expand full comment

Takk!

Expand full comment

Har du funne ut kven Nikolai Winther er? Ser han dukker opp innimellom på internett:

https://juniorskole.no/podcasts/svp-120599/boer-mamma-og-pappa-ha-skjermtid?

https://www.dagbladet.no/video/thumbnail/65422e2303ed06f62bd8768b/subtitles.srt

https://www.digiung.no/post/de-er-heldigitale-barn-men-mangler-sikkerhetsnett

Har alle desse brukt Whisper, eller har Whisper fanga opp navnet hans i treningsmateriale og fantasert litt?

Expand full comment

Takk for fin oppskrift. Obs. på min maskin funka imidlertid ikke oppskriften, fordi whisper-mappa la seg under hjem-mappa. La til /whisper.cpp/ i tillegg til ./ -- slik at det ser slik ut:

Koden som gjør om m4a, ogg o.l. til wav-filer i output-mappe (som jeg forøvrig måtte opprette manuelt):

mkdir -p output;

for i in ./whisper.cpp/data/*; do

f=$(echo "${i##*/}");

filename=$(echo $f | cut -d'.' -f 1);

ffmpeg -i "$i" -acodec pcm_s16le -ac 1 -ar 16000 "./whisper.cpp/output/$(echo $filename).wav";

done

Kode som tekster/oversetter og legger til vtt-fil:

for i in ./whisper.cpp/output/*.wav; do ./whisper.cpp/main -m ./whisper.cpp/models/ggml-large.bin -l no --output-vtt -f "$i"; done

Expand full comment