Pregled programske opreme za prepisovanje Sonix.ai

Kazalo:

Anonim

Vsako orodje, ki prepisuje, cilja na določeno nišo, Sonix pa je izbral tiste, ki snemajo sestanke ali predstavitve, nato pa za iskanje ali razširjanje potrebujejo vtipkano različico.

Zato bi bilo lahko enako koristno za študenta kot za vodjo, saj ponuja transkripcije, ki jih je mogoče zlahka indeksirati za nadaljnjo uporabo.

Da pa bo ta naloga uspešna, mora biti programska oprema natančna in cenovno dostopna.
Je Sonix.ai to orodje in ali lahko spletna storitev tekmuje z nameščeno aplikacijo?

  • Želite preizkusiti Sonix.ai? Oglejte si spletno stran tukaj

Načrti in cene

Kot pri mnogih storitvah prepisovanja je tudi pri stroškovnem modelu Sonix model, ki temelji na času. Natančneje, trajanje katerega koli posnetka, ki ga naložite v storitev za obdelavo, in stroški tega vira znašajo 10 USD na uro, če uporabljate njegovo standardno storitev »pay-as-go-go«.

Stroški na uro se lahko znižajo na 5 USD, če se naročite na naročninsko storitev Premium za 22 USD na mesec za vsakega uporabnika. Za tiste družbe, ki potrebujejo več kot 100 ur prepisanih mesecev, so na voljo količinski popusti.

Standardni načrt ima najosnovnejše funkcije, Premium pa dodaja dodatne, kot sta dostop do več uporabnikov in skupna raba ekipe. Enterprise ima vse, kar ponuja Premium z veliko dodatki za upravljanje in izboljšanim modelom podpore.

Glede na to, da prepisujejo storitve, je Sonix eden dražjih in zagotovo ne nekaj, kar bi si večina študentov ali domačih uporabnikov razumno lahko privoščila.

Oblikovanje

Spletno mesto my.sonix.ai uporablja izjemno čisto obliko in ustvarjanje računa je brezplačno.

V času pisanja tega članka gre izključno za spletno storitev in Sonix nima mobilne aplikacije, ki bi zajemala in pošiljala v obdelavo zvočnih posnetkov.

Ker bomo kasneje pokrivali to težavo, obstajajo preprosti načini, ki nekoliko rešujejo pomanjkanje mobilne aplikacije.

Začetna točka vsakega opravila prepisovanja je nadzorna plošča Sonix.ai, kjer si lahko ogledate že prepisan zvok in dodate nove, ki jih je treba obdelati.

Ker je bil ta sistem zasnovan za več uporabnikov, vključuje sistem navideznih map za organiziranje prepisov na kakršen koli način, ki se mu zdi primeren.

Če kliknete »naloži«, se uporabnik pripelje na stran, kjer je v sistem mogoče spustiti več datotek, in če ima račun dovolj dobroimetja, jih lahko nato obdela.

Podprti so vsi standardni formati zvočnih datotek, vključno z wav, mp3, mp4a, aiff, acc, ogg in wma, lahko pa tudi naložite nekaj struktur za video embalažo. Največja velikost datoteke je 4 GB, zato pred nalaganjem velike video datoteke z ločljivostjo 4K priporočamo, da za pospešitev nalaganja uporabite drugo orodje za razdelitev zvoka.

Dober način za pospešitev nalaganja je uporaba shrambe v oblaku, kot je Google Drive, One Drive, Box ali Dropbox, in to neposredno povezati z računom. Sistem lahko po e-pošti pošljete tudi z Gmailom, da ustvarite bolj eleganten potek dela kot spuščanje datotek na spletni strani.

Ta avtomatizacija je zagotovljena prek Zapierja, kar omogoča veliko širšo integracijo, če je podjetje, ki ga uporablja, vlagalo v to tehnologijo za povezovanje svojih poslovnih procesov.

Še en prijeten dotik je, da lahko skupaj z zvočno ali video datoteko vključite obstoječi prepis kot sredstvo za hitrejše dokončanje postopka in izboljšanje natančnosti.

Še en prijeten dotik je, da lahko skupaj z zvočno ali video datoteko vključite obstoječi prepis kot sredstvo za hitrejše dokončanje postopka in izboljšanje natančnosti.

Zaradi narave obdelave v oblaku je ocenjevanje, kako hitra ali počasna obdelava nemogoče, vendar je po naših izkušnjah Sonix.ai razmeroma hiter. Običajno traja od 10% do 20% časa prepisa, dokler traja snemanje. Zato dokončanje 10-minutnega snemanja običajno traja manj kot 2 minuti.

Ni vam treba slediti obdelavi, saj vam bo sistem po opravljenem delu poslal e-poštno obvestilo skupaj s povezavo do novega prepisa.

Ko je datoteka obdelana, jo lahko odprete znotraj in stran za urejanje, da pregledate rezultate, in tudi izvozite besedilo v široko paleto uporabnih formatov, vključno s tistimi, ki jih nekatere aplikacije določajo kot podnapise.

Število jezikov in narečij, ki jih podpira sistem, je 36, kar vključuje več angleško, francosko, kantonsko, mandarinsko, portugalsko in špansko govoreče države, skupaj z vsemi običajnimi zahodnimi in vzhodnoevropskimi jeziki, skupaj z nekaterimi azijskimi in arabskimi.

Posnetki

Poleg dela, ki je bilo namenjeno umetni inteligenci, ki je bilo potrebno za razlago hrupa, ki ga povzročajo ljudje, verjetno stran Posnetki predstavlja pomemben napor kodiranja tukaj.

Tu lahko zvok in z njim povezan prepis primerjate in ročno izboljšate s podrobnostmi o spremembah zvočnikov in popravkih napačnih interpretacij.

Za vse, ki delajo s prepisom za poliranje besedila, je na tej strani navedena lokacija premoga. Smiselno je, da smo si v ta del vložili nekaj truda, saj je zelo enostaven za uporabo in sledenje.

V poskusu, da uporabnika usmeri, kje bi lahko prišlo do težav, bo Sonix.ai vsebino obarval tako, da bo poudaril tiste odseke, ki so manj samozavestni. Ta funkcija je lahko koristna, čeprav lahko Sonix.ai dela napake tudi v tistih delih, kjer meni, da ima prepis status "Zelo samozavesten".

Najboljši vidiki te strani so sinhronizacija predvajanja zvoka in besedila, tako da postavitev kurzorja v besedilo premakne položaj predvajanja v isti odsek.

Poleg navadnega urejanja je mogoče tudi poudariti odseke v različnih stilih in ustvariti opombe, ki gredo ob prepisu.

Časovno kodo lahko tudi prilagodite, še posebej koristno, če se snemanje začne z daljšim premorom ali neželeno preambulo.

Natančnost

Sonix opisuje Sonix.ai kot "najboljšo avtomatizirano programsko opremo za prepise, ki jo poganja najnovejša umetna inteligenca".

Glede na naša testiranja bi ta izdelek opisali kot zelo odvisnega od kakovosti snemanja in številnih drugih dejavnikov, ki jih ni mogoče zlahka nadzorovati.

Pri obdelavi naših klasičnih zgodovinskih posnetkov govora je bilo z nekaterimi zvočniki zelo težko, čeprav so se nam zdeli jasni.

Ti rezultati so bili v izrazitem nasprotju z nekaterimi bolj sočasnimi posnetki, kjer je bila natančnost sprejemljiva, a komaj zvezdna.

Ugotovili smo, da pristop, ki ga je uporabil Sonix, daje več predpostavk, ki lahko delujejo ali ne, odvisno od zvočnika in kakovosti snemanja.

Fascinantno je, da bo storitev barvno kodirala svoj prepis glede na to, kako prepričana je v to, kar je rečeno, in ta samoanaliza je zelo razkrivajoča.

V nekaterih okoliščinah bo pravilno ugotovil, da je del lahko sumljiv, v drugih delih pa je prepričan, da je del, ki ga je prepisal, popolnoma napačen.

Zdi se, da nekaj pogostih vprašanj povzroča krivuljo, ena od teh pa so ljudje, ki ne govorijo slovnično popolne proze. V prizadevanju, da bi bil njihov govor bolj neposreden, so iz svojih stavkov odstranili nekaj besed in tako ustvarili bolj dramatičen slog. Ko jih Sonix prepiše, se zdi odločen, da te besede doda nazaj, tako da ustrezajo njegovemu notranjemu slovničnemu modelu, ne pa temu, kar je bilo dejansko izgovorjeno.

Prepis se bolje bere kot dokument, vendar v resnici ne predstavlja povedanega.

Sonix je zagotovo boljši, če sta kakovost snemanja in jasnost zvočnika visoka, kar smo dokazali z majhnim posnetkom Stephena Fryja ob branju Harryja Potterja. Vendar ni mogoče vedno imeti takšnega nadzora nad kakovostjo zvoka in s tem testom je vseeno delal napake.

Drugo težavno področje so formalna imena in tehnične besede ali okrajšave. Te je mogoče odpraviti tako, da jih dodate v slovar po meri, vendar je za to potrebno delo, da se sistem bolje uresniči, ko se uporabljajo imena ali kratice.

Za tiste, ki potrebujejo popolno besedo za transkripcijo, ima Sonix izbor pridruženih profesionalnih prepisovalcev, ki lahko delajo s snemanjem in rešujejo ta vprašanja, vendar to nekoliko premaga namen obdelane transkripcije.

Varnost

V središču varnosti Sonix.ai so strežniki, na katerih se zvok obdeluje in se hranijo prepisi.

Ves promet je šifriran s pomočjo TLS (Transport Layer Security) in ko so datoteke na strežniku, ki je zaščiten z več plastmi požarnega zidu, je zaščita pred vdorom in vsi podatki obkroženi s šifriranjem na strani strežnika AES-256. Podjetje obljublja, da zaposleni nimajo dostopa do posnetkov ali prepisov, razen če jim ni dano izrecno dovoljenje.

Bistvena težava tega pristopa je, da lahko preprosto prijavo in geslo zaobidemo vse. Sonix.ai nima dvofaktorske avtentikacije in nima lahko dostopnega dnevnika, kdo in kdaj dostopa do datotek.

Z vidika varnosti bi to lahko šteli za pretirano zanašanje na integriteto tistih, ki uporabljajo sistem, da posnetkov ne delijo z drugimi zunaj podjetja ali obdržijo potencialno občutljive datoteke, ko zapustijo podjetje.

Skratka, varnost mora biti boljša, sledenje ali aktivnost uporabnikov pa mora imeti večjo prednost.

Končna sodba

Glede na razmeroma visoke stroške smo pričakovali, da bo Sonix deloval bolje kot je.

Morda nismo imeli sreče z izbiro stvari, ki jih bomo prešifrirali, vendar se je vseeno zdelo, da gre za neizmerno veliko napak.

Pozitivna stran te enačbe je, da je hiter in je izjemno enostaven za uporabo, čeprav priporočamo, da skozi to rešitev zaženete nekaj primerov posnetkov, preden se naročite na naročnino.

Največja težava pri Sonixu so visoki stroški, in čeprav je to pravo orodje za vaše potrebe, obstajajo cenejša sredstva za pretvorbo zvoka v besedilo drugje.