11 Comments

Har testet litt mer. Blant annet et 90 minutter langt opptak av panelsamtale på engelsk om den siste boka til Espen Ytreberg om Media and events in history, som fikk nesten alle fagord og akademikere riktig (bortsett fra noen nordiske). Testet også å bytte ut "--output-vtt" med "--output-txt" i koden. Der fungerte helt fint (og er greit dersom en kun vil ha teksten UTEN tidskoder). Oppdaget forøvrig at mine tidligere opptak i 20 bit wav ikke fungerer; kun 16 bit. Men det er jo en smal sak å gjøre om før jeg tekster.

Expand full comment

Jeg har oppdaget at den kan bli litt vel kreativ.... se oppdatering i av eksempelene øverst i posten ;)

Expand full comment

Takk!

Expand full comment

Har du funne ut kven Nikolai Winther er? Ser han dukker opp innimellom på internett:

https://juniorskole.no/podcasts/svp-120599/boer-mamma-og-pappa-ha-skjermtid?

https://www.dagbladet.no/video/thumbnail/65422e2303ed06f62bd8768b/subtitles.srt

https://www.digiung.no/post/de-er-heldigitale-barn-men-mangler-sikkerhetsnett

Har alle desse brukt Whisper, eller har Whisper fanga opp navnet hans i treningsmateriale og fantasert litt?

Expand full comment

Haha! Det er altså ikke bare meg! Jeg fant en Nicolai Winther på imdb, det er min beste teori. Altså at det er han her. Og at han har tekstet en del. https://www.instagram.com/wintherofficial/

Expand full comment

Tenkte kanskje å grave litt i dette, med tanke på når du publiserte artikkelen antar eg at du ikkje brukte nasjonalbiblioteket sin modell.

Det finnes forøvrig eit par NWs på Linkedin også, men dei eg har sett på til no har ikkje passa så godt.

Expand full comment

Takk for fin oppskrift. Obs. på min maskin funka imidlertid ikke oppskriften, fordi whisper-mappa la seg under hjem-mappa. La til /whisper.cpp/ i tillegg til ./ -- slik at det ser slik ut:

Koden som gjør om m4a, ogg o.l. til wav-filer i output-mappe (som jeg forøvrig måtte opprette manuelt):

mkdir -p output;

for i in ./whisper.cpp/data/*; do

f=$(echo "${i##*/}");

filename=$(echo $f | cut -d'.' -f 1);

ffmpeg -i "$i" -acodec pcm_s16le -ac 1 -ar 16000 "./whisper.cpp/output/$(echo $filename).wav";

done

Kode som tekster/oversetter og legger til vtt-fil:

for i in ./whisper.cpp/output/*.wav; do ./whisper.cpp/main -m ./whisper.cpp/models/ggml-large.bin -l no --output-vtt -f "$i"; done

Expand full comment

Fra Dag-Inge:

"Glemte du kanskje å skifte mappe til whisper.cpp (cd whisper.cpp) etter at du gjorde git clone? Da ville du måttet endre oppskriften i alle fall ettersom du ikke ville stått i riktig mappe når du kjørte kommandoene, og alle referansene til filplasseringer ville blitt feil.

Forøvrig er hjemmemappen et fint sted å legge dette. ./ betyr bare «fra mappen jeg står i nå», mens ~/ ville vært «fra hjemmemappen». At ./ funker forteller meg at du står i mappen «over» whisper-mappen og en cd whisper.cpp, som går inn i mappen som whisper nå ligger i, er nødvendig for at de senere kommandoer skal kjøres som forventet.

— Dag-Inge"

Expand full comment

Ja, det er nok riktig. Turte ikke flytte mappen når den først var installert i tilfellet det var noen filer som hadde lagt seg annet sted og som ikke ville gå riktig sti da. Funker i alle fall fint nå 😃🙌

Expand full comment

Jeg skal høre med Dag-Inge hva som er greia og se om jeg skal justere forklaringen :)

Expand full comment

PS. Spurte chatGPT om jeg trengte den første linjen kode neste gang og fikk svar:

"Den første linjen "mkdir -p output;" er ikke nødvendig etter at mappen "output" er laget, så du kan fjerne den og kjøre koden fra "for" linjen. "-p" flagget i "mkdir -p" kommandoen sørger for at mappen blir laget, selv om den allerede eksisterer, så det er ikke nødvendig å kjøre den flere ganger hvis mappen allerede eksisterer." 😜

Expand full comment