Svi zapisi

Što smo naučili o Galaxy AI (poslije pet dana terena)

Iskreni osvrt na Galaxy AI alate, LOG snimanje i S26 Ultru. Što nam je stvarno pomoglo na Festivalu, kod Korlevića i u AZRRI uredu, a što smo prestali koristiti nakon dva dana.

Sjedimo u školi i gledamo materijal

Prošli tjedan smo zatvorili teren. Sad u kabinetu prolazimo kroz audio, fotke i video, i imamo neke zaključke o alatima koje smo dobili na početku. Ovo je poštena lista. Što je radilo, što smo precijenili, i što nas je iznenadilo.

LOG profil

Sve smo snimali u LOG-u. Sad u montaži vidimo zašto se to isplatilo na nekim lokacijama, a zašto je na drugima bio samo dodatni rad.

Kod Korlevića u opservatoriju imali smo užasno miješano svjetlo. Topla žarulja iznad stolice, plava sjena oko teleskopa, vani sunce kroz prozor. Da smo snimali u standardnom načinu, sve bi nam u sjeni bilo crno. Ovako smo u montaži mogli izvući detalj na njegovu licu, a da nam pozadina ne pregori. U AZRRI uredu sugovornik je sjedio uz prozor s jako jakom svjetlosnom razlikom. LOG nas je opet spasio.

A kod gradonačelnice u Pazinu nam LOG nije trebao. Svjetlo je bilo ravno i ujednačeno, mogli smo snimati u standardu i uštedjeti vrijeme u boji.

Pouka koja nam se kristalizirala: LOG ima smisla kad svjetlo nije pod tvojom kontrolom. Inače je samo dodatni rad.

Audio Eraser

Najveća buka cijelog projekta bila je 5. Festival strukovnih zanimanja. Sajamska dvorana, ljudi viču, stolovi se pomiču, sve se odbija od zidova. Naš sugovornik je bio metar i pol od mikrofona.

Kad smo audio pustili kroz Audio Eraser, nismo vjerovali što čujemo. Razdvojio je glas i pozadinski žamor, a glas nije ispao “robotski” kako se obično dogodi kad se ovakve stvari pojačavaju. Bez ovog alata bi pola te snimke išla u koš.

Voice Recorder s transkripcijom

Voice Recorder na S26 Ultri pravi živi tekstualni zapis dok snimaš. Ovo je promijenilo kako radimo bilješke. Umjesto da netko piše dok drugi pita, samo pustimo aplikaciju da hvata, pa poslije idemo kroz tekst i označavamo zanimljive trenutke.

Iskrene ocjene po terenu:

  • TZ ured (jutro 13.4.) — transkripcija oko 95% točna. Sugovornik je govorio jasno, malo eha.
  • AZRRI — par puta je promašio lokalne nazive (npr. “Pićan”), ali to se brzo ispravlja.
  • Korlević — najbolji rezultat. Glasno i razgovjetno.
  • Festival — najgori. Ali tu nismo ni očekivali čudo.

Photo Assist s tekstualnim promptima

Bila je novost na S26 Ultri i prvi put smo bili skeptični. Ispalo je da nam je uštedjelo vrijeme na desetke načina:

  • “Makni odsjaj prozora s lica sugovornika.” Radilo iz prve.
  • “Izoštri detalje na ploči u pozadini.” Pomoglo nam u kadru s plakatom o Pićnu.
  • “Ukloni ljude u pozadini koji nisu u fokusu.” Object Eraser, korišten nebrojeno puta.

Ono što nismo radili, ni jednom: generirati ljude ili scene koje nisu postojale. To smo si na početku rekli kao pravilo, jer je projekt o stvarnim sugovornicima i mjestima. Generative Edit smo koristili samo za promjenu formata fotke (kvadratno u 16:9 za naslovnicu), nikad za izmišljanje sadržaja.

Note Assist

Iskreno, ovo nismo planirali koristiti puno. Ispalo je da je u svakodnevnom radu najkorisniji alat.

Nakon svakog terena bismo pustili Note Assist da napravi sažetak naših nabacanih bilježaka. Tih nekoliko rečenica nam je bilo polazište za sutradan, jer smo iz njih odmah vidjeli što smo dobili kao odgovor, a što je ostalo otvoreno za drugi krug. Bez ovog bismo svaku večer trošili sat vremena samo da posložimo bilješke. Ovako nam je trebalo deset minuta.

Par puta nas je spasio dok je razgovor tekao. Kad bi sugovornik spomenuo nešto što nismo poznavali (neki konkretan OPG, dokument, naziv mjesta), Circle to Search nam je odmah dao kontekst, bez da prekidamo razgovor pitanjem “oprostite, što je to?”.

Korisno na terenu, manje korisno poslije. Kad smo doma, lakše nam je upisati u tražilicu nego okruživati ekran.

Galaxy Z Flip7

Krenuli smo s idejom da je Flip7 sekundarni uređaj, više audio backup nego išta drugo. Ispalo je da nam je na pola terena bio glavni alat za zvuk.

Razlog je prozaičan: stane u džep dok ti ruke imaju S26 Ultru. Flex mode (kad ga ostaviš poluotvorenog) nam je više puta poslužio kao mini-tronožac za snimanje glasa, samo ga staviš na stol između sebe i sugovornika.

U Uslugi smo, kao što smo već pisali, cijeli razgovor snimili samo na Flip, jer nam tamo slika nije ni trebala.

Što nam nije sjelo

Da ne ispadne sve u superlativima:

  • APV codec smo isprobali samo na Korleviću, ali u montaži nismo imali stabilan workflow za njega. Ostali smo na 10-bit HEVC LOG-u za sve ostalo. APV ima smisla samo ako imaš kompletan pipeline.
  • Pro Mode za fotografiju smo prerijetko koristili. Auto je u 90% slučajeva radio jednako dobro, a brže. Pro Mode čuvamo za kontrolirane situacije.
  • Live Translate nam uopće nije trebao. Svi su sugovornici hrvatski.

Najveća lekcija

Najvažnije što smo naučili nije ni jedan konkretni alat. Naučili smo da su AI alati alat, a ne odluka. Mogu nam smanjiti šum, izvući detalj iz sjene, transkribirati razgovor. Ali ne mogu odlučiti koje pitanje postaviti ili koji odgovor je vrijedan portfolia. Onaj dio posla je i dalje ostao na nama petero. I to je dobro tako.